Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich einen Überblick über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich aktuelle Themen aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.
Neue KI-Produkte hier entdecken: https://top.aibase.com/
1. Kunlun Wanwei veröffentlicht das erste Open-Source-Videogenerierungsmodell für KI-Kurzfilme: SkyReels-V1
Kunlun Wanwei hat die Veröffentlichung des ersten Open-Source-Videogenerierungsmodells für KI-Kurzfilme, SkyReels-V1, und seines Algorithmus zur steuerbaren Mimik und Gestik, SkyReels-A1, angekündigt. Ziel ist es, die hohen Kosten und die Schwierigkeit der Verwendung bestehender Modelle zu lösen. Diese Innovation wird die Entwicklung der KI-Kurzfilmindustrie vorantreiben und eine höhere Qualität bei der Generierung von Filmmaterial ermöglichen. SkyReels-V1 wurde mit hochwertigen Daten trainiert und ermöglicht eine präzise Steuerung der Darstellung von Personen, unterstützt verschiedene Kombinationen aus Mimik und Gestik und verbessert so die Realitätsnähe und Ausdruckskraft der Videos.
【AiBase Zusammenfassung:】
🎥 SkyReels-V1 ist das erste Open-Source-KI-Videogenerierungsmodell Chinas für Kurzfilme und unterstützt 33 verschiedene Gesichtsausdrücke und über 400 Gestiken.
🤖 SkyReels-A1 ist der erste Algorithmus auf SOTA-Niveau zur Steuerung von Mimik und Gestik und ermöglicht eine hochgenaue Wiedergabe von Mikroexpressionen.
🌐 Kunlun Wanwei setzt sich für Open-Source-Technologie ein und fördert Innovation und Entwicklung in der KI-Kurzfilmindustrie, um die Produktionskosten zu senken.
Detaillierter Link: https://github.com/SkyworkAI/SkyReels-V1
2. xAI veröffentlicht das bahnbrechende Modell Grok3: Übertrifft GPT-4o, 10-fache Rechenleistung
xAI hat am Montag sein neuestes Flaggschiff-KI-Modell Grok3 veröffentlicht, das einen wichtigen Fortschritt des Unternehmens im Bereich der Künstlichen Intelligenz darstellt. Grok3 bietet eine zehnmal höhere Rechenleistung als die Vorgängerversion Grok2, kann Bilder analysieren und Fragen beantworten und übertrifft OpenAIs GPT-4o in mehreren Benchmark-Tests. Die neue Funktion DeepSearch ermöglicht es Benutzern, schnell tiefgreifende Informationen zu erhalten und verbessert die Praktikabilität der Grok-Anwendung. Zukünftig soll ein Sprachmodus eingeführt werden, der den Nutzern ein noch umfassenderes Erlebnis bieten soll.
【AiBase Zusammenfassung:】
🧠 Grok3 ist das neueste KI-Modell von xAI mit einer zehnmal höheren Rechenleistung als sein Vorgänger.
📈 Grok3 kann Bilder analysieren und Fragen beantworten und übertrifft GPT-4o in mehreren Benchmark-Tests.
🔍 Die neue Funktion DeepSearch bietet tiefgreifende Informationsanalysen und ermöglicht Benutzern einen schnellen Zugriff auf Informationen.
3. Step veröffentlicht ein dominierendes Sprachmodell mit 130 Milliarden Parametern: Echtzeit-Dialog + Emotionsklonung, ein Durchbruch
Step Audio hat kürzlich ein Sprachmodell mit 130 Milliarden Parametern veröffentlicht, das einen bedeutenden Durchbruch im Bereich der Sprachinteraktion darstellt. Dieses Modell kombiniert Sprachverständnis und Generierungssteuerung und bietet eine leistungsstarke mehrsprachige Unterstützung und Dialekterkennung, um ein personalisiertes Sprachinteraktionserlebnis zu ermöglichen. Darüber hinaus bieten die Funktionen zur Emotionskontrolle und Sprachklonung den Nutzern reichhaltigere Interaktionsmöglichkeiten und deuten darauf hin, dass zukünftige Sprach-KIs intelligenter und natürlicher werden.
【AiBase Zusammenfassung:】
🚀 Dieses Modell ist das erste Echtzeit-Sprachdialogsystem der Branche, das Sprachverständnis und Generierungssteuerung vereint und über eine leistungsstarke Steuerung verfügt.
🌍 Es unterstützt mehrere Sprachen und Dialekte, darunter Chinesisch, Englisch, Japanisch sowie Kantonesisch und Sichuanisch, und erleichtert so die sprachübergreifende Kommunikation.
🎶 Es verfügt über Funktionen zur Sprachklonung und Emotionskontrolle, sodass Benutzer die emotionale Stimmung der Sprache frei einstellen und personalisierte Sprachassistenten erstellen können.
Detaillierter Link: https://github.com/stepfun-ai/Step-Audio/tree/main
4. Beste Ergebnisse! Step Star veröffentlicht das Step-Video-T2V Videogenerierungsmodell
Heute haben Step Star und die Geely Automobile Group zwei Open-Source-Multimodal-Large-Language-Modelle veröffentlicht, insbesondere das Step-Video-T2V-Videogenerierungsmodell, das mit 30 Milliarden Parametern im Bereich der Videogenerierung hervorragende Fähigkeiten zeigt. Das Modell zeichnet sich nicht nur durch die Generierung hochwertiger Videos aus, sondern versteht auch Anweisungen präzise, unterstützt verschiedene Kamerabewegungen und die generierten Bilder sind realistisch und entsprechen den physikalischen Gesetzen. Entwickler können dieses Modell in der Yuewen-App testen und Feedback geben, um den technischen Fortschritt zu fördern.
【AiBase Zusammenfassung:】
🌟 Das Step-Video-T2V-Modell verfügt über 30 Milliarden Parameter, generiert Videos mit 204 Frames und einer Auflösung von 540P und ist weltweit führend.
🎨 Das Modell zeichnet sich durch seine flüssigen Bewegungen und Ästhetik aus und übertrifft bestehende Open-Source-Videomodelle.
📱 Die beiden Modelle sind bereits in der Yuewen-App verfügbar. Entwickler können sie testen und Vorschläge unterbreiten, um die technische Entwicklung voranzutreiben.
Detaillierter Link: https://github.com/stepfun-ai/Step-Audio
5. KI-Talent Luo Fuli hat eine neue Stelle angetreten
Luo Fuli, das 95er-Jahre-KI-Wunderkind, hat kürzlich eine neue berufliche Herausforderung begonnen, obwohl die genauen Informationen zum Unternehmen noch nicht bekannt gegeben wurden. Sie war durch das Angebot eines Millionen-Gehalts von Xiaomi-Gründer Lei Jun in den Fokus der Öffentlichkeit gerückt. Luo Fuli hat einen Master-Abschluss in Computerlinguistik an der Peking-Universität und hat anschließend bei Alibaba DAMO Academy und DeepSeek umfangreiche Forschungserfahrung gesammelt.
【AiBase Zusammenfassung:】
✨ Luo Fuli hat eine neue Stelle angetreten, das Unternehmen ist noch nicht bekannt.
💰 Lei Jun bot Luo Fuli einen Millionen-Vertrag bei Xiaomi an.
📈 Luo Fuli bezeichnete das DeepSeek-V2-Modell als „Preis-Leistungs-König“.
6. Kleine und große Modelle im Verbund! Mita AI Search führt die Funktion „Shallow Research“ ein
Die Mita Network Technology Co., Ltd. hat am 18. Februar 2025 ihre neue Funktion „Shallow Research“ vorgestellt, die darauf abzielt, mit Hilfe von KI-Technologie Informationen schnell zu sammeln und zu analysieren, um die Forschungseffizienz zu steigern. Diese Funktion verwendet eine Architektur, die kleine und große Modelle kombiniert, und kann innerhalb kurzer Zeit Hunderte von Webseiten durchsuchen und analysieren, wodurch die Forschungszeit erheblich verkürzt wird. Obwohl sich die Funktion noch in der Entwicklung befindet, kann sie den Benutzern bereits erste Analyseergebnisse liefern und zeigt das enorme Potenzial von KI in der Informationsverarbeitung.
【AiBase Zusammenfassung:】
🧠 Verwendet eine Architektur, die kleine und große Modelle kombiniert, um die Forschungseffizienz zu steigern.
⏱️ Kann innerhalb von 2 bis 3 Minuten Hunderte von Webseiten durchsuchen und analysieren.
📈 Geplant ist die zukünftige Integration von Code-Ausführung und numerischer Analyse, um die Forschung zu vertiefen.
7. HYBEs KI-Sprachwerkzeug Supertone Play ist online: Sprachklonung in 10 Sekunden
HYBEs Supertone hat das Text-to-Speech-Tool „Supertone Play“ vorgestellt, das Kreativen hochwertige und ausdrucksstarke Audioinhalte bieten soll. Das Tool unterstützt Englisch, Koreanisch und Japanisch und wird in Zukunft um Spanisch und Chinesisch erweitert. Supertone Play bietet 150 verschiedene Stimmen für verschiedene kreative Zwecke und verfügt über eine Sprachklonfunktion, mit der Benutzer basierend auf ihrer eigenen Stimme personalisierte Charaktere erstellen und Emotionen und Tonhöhe anpassen können.
【AiBase Zusammenfassung:】
🎙️ Supertone Play unterstützt mehrere Sprachen und bietet 150 verschiedene Stimmen für Kreative.
🔒 Das Tool verfügt über Sicherheitsmaßnahmen wie Sprach-CAPTCHA und nicht hörbare Wasserzeichen, um den Missbrauch der Technologie zu verhindern.
🌍 In der Testphase wurde das Tool bereits in über 80 Ländern weit verbreitet genutzt, und Benutzer laden die generierten Inhalte aktiv herunter.
Detaillierter Link: https://play.supertone.ai/
8. Tencent E-Sign wird eine Funktion zur KI-gestützten Vertragserstellung einführen
Der Tencent E-Sign-WeChat-Account hat kürzlich angekündigt, in Kürze eine Funktion zur KI-gestützten Vertragserstellung einzuführen. Mit Hilfe der Large Language Models HunYuan und DeepSeek soll Benutzern ein komfortabler Service zur Vertragserstellung und -verwaltung geboten werden. Mit KI kann Herr Wang mühelos einen WG-Vertrag erstellen und die notwendigen Klauseln hinzufügen, während Frau Li schnell potenzielle Risiken in Lieferantenverträgen prüfen kann. Auch Rechtsanwälte wie Herr Zhang können Verträge effizient verwalten und Informationsverluste vermeiden. Diese Funktion wird die Effizienz und Genauigkeit der Vertragsabwicklung erheblich verbessern.
【AiBase Zusammenfassung:】
🤖 KI kann Verträge mit einem Klick erstellen, den Erstellungsprozess vereinfachen und die Benutzerfreundlichkeit verbessern.
🔍 KI fungiert als Risikoscanner und kann potenziell nachteilige Klauseln in Verträgen schnell erkennen.
📂 KI ermöglicht eine intelligente Vertragsverwaltung und hilft Benutzern, schnell wichtige Informationen zu finden und das „Verschwinden“ von Verträgen zu vermeiden.
9. Shenzhen Futian und Guangzhou nehmen „KI-Beamte“ in Betrieb: Einsatz des DeepSeek-Large-Language-Models
Der Bezirk Futian in Shenzhen und die Stadt Guangzhou haben nacheinander „KI-Beamte“ auf Basis des DeepSeek-Large-Language-Models in Betrieb genommen, was einen wichtigen Fortschritt im Aufbau einer intelligenten Regierungsverwaltung darstellt. Der in Futian eingeführte KI-Mitarbeiter deckt bereits 240 Geschäftsfelder ab und steigert die Effizienz der Regierungsdienste deutlich. Die Zeit für die Erstellung individueller Anpassungen wurde erheblich verkürzt, und die Prüfzeit wurde um 90 % reduziert. Auch Guangzhou treibt den Aufbau eines intelligenten Regierungssystems auf Basis von DeepSeek voran und zeigt das Potenzial von KI-Technologie bei der Optimierung von Regierungsdiensten.
【AiBase Zusammenfassung:】
🚀 Der Bezirk Futian hat KI-Mitarbeiter eingeführt, die 240 Geschäftsfelder abdecken und die Effizienz der Regierungsdienste steigern.
⏱️ Die Zeit für die Erstellung individueller Anpassungen wurde von 5 Tagen auf Minuten verkürzt, und die Prüfzeit wurde um 90 % reduziert.
🌐 Guangzhou baut ein intelligentes Regierungssystem auf Basis von DeepSeek auf und treibt den Aufbau einer digitalen neuen Antriebskraft voran.
10. NetEase Youdao präsentiert SpaceOne, die erste KI-native Lernhardware in China, mit integriertem DeepSeek-R1
NetEase Youdao hat am 18. Februar die revolutionäre Lernhardware SpaceOne, einen Vollbild-Antwort-Stift, vorgestellt, die erste KI-native Bildungshardware in China, die tiefgreifend mit den Fähigkeiten großer Sprachmodelle integriert ist. Das Produkt basiert auf der „Skizzenpapier-artigen Deduktion“ als Kern, überwindet die Grenzen traditioneller Problemlösungswerkzeuge und bietet eine tiefgreifende Erklärung für alle Aufgabentypen, die mehrere Fächer wie Mathematik, Physik und Chemie abdeckt und die Lerneffizienz erheblich steigert.
【AiBase Zusammenfassung:】
🖊️ SpaceOne integriert das DeepSeek-R1-Inferenzmodell, das durch die visuelle schrittweise Zerlegung von schwierigen Problemen den Denkprozess eines Lehrers simuliert und 10 Hauptfächer abdeckt.
📱 Mit einem gleitenden Gehäuse und einem 4,4-Zoll-Augenschutz-Vollbild wird die Effizienz der vertikalen Anzeige um 350 % gesteigert und das Lernerlebnis optimiert.
🌐 Es ist mit einem 78-Millionen-Wort-Wortschatz und einem mobilen 4G-Modul ausgestattet und unterstützt die Übersetzung von Hunderten von Sprachen, wodurch die Einschränkungen der regionalen Bildungsressourcen überwunden werden.
11. OpenAI-Mitgründer gründet SSI, erhält über 10 Milliarden US-Dollar Finanzierung, Bewertung über 30 Milliarden US-Dollar
Ilya Sutskever, Mitgründer von OpenAI, hat für sein neues Unternehmen „Safe Superintelligence“ (SSI) über 10 Milliarden US-Dollar an Finanzmitteln eingeworben, die Bewertung liegt bereits bei über 30 Milliarden US-Dollar, was es zu einem der wertvollsten privaten Technologieunternehmen weltweit macht. SSI konzentriert sich auf die Entwicklung sicherer KI-Systeme, hat aber noch keine Einnahmen erzielt. Das erste Produkt wird „Safe Superintelligence“ sein. Sutskever betonte, dass das Unternehmen vollständig von externen Einflüssen abgeschirmt sein und sich nicht an komplexen Produktwettbewerben beteiligen werde.
【AiBase Zusammenfassung:】
🌟 SSI erhält über 10 Milliarden US-Dollar an Finanzmitteln, die Bewertung liegt bei über 30 Milliarden US-Dollar.
🚀 Das Unternehmen konzentriert sich auf die Entwicklung sicherer KI-Systeme und hat derzeit noch keine Einnahmen.
🤖 Sutskever sagte, dass das erste Produkt des Unternehmens „Safe Superintelligence“ sein wird und andere Projekte vorerst zurückgestellt werden.
12. OpenAI erwägt Sonderaktien, um sich gegen feindliche Übernahmen durch Musk und andere zu schützen