Willkommen beim AI-Daily-Bereich! Hier finden Sie täglich neue Einblicke in die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Neuigkeiten aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Douyin integriert Doubao AI: ByteDance startet Super-KI-Ökosystem-Strategie

Die Douyin-App testet derzeit die Integration von Doubao AI, was die beschleunigte Umsetzung der KI-Ökosystemstrategie von ByteDance zeigt. Durch die Bereitstellung von Zugängen in der Kurzvideo-Oberfläche und der Nachrichtenliste zielt Douyin darauf ab, die Barrieren zwischen KI-Produkten und Traffic-Plattformen zu durchbrechen, die KI-Fähigkeiten zu verbessern und mehr Nutzer-Traffic zu generieren. ByteDance treibt intern mehrere KI-Produkt-Geschäftsfelder voran und zeigt so ein umfassendes KI-Produkt-Ökosystem.image.png

【AiBase Zusammenfassung:】

📱 Douyin testet die Integration von Doubao AI und bietet zwei strategische Zugänge, um die KI-Fähigkeiten und den Nutzer-Traffic zu verbessern.

💡 ByteDance fördert intern mehrere KI-Produktlinien, die verschiedene Bereiche abdecken und ein umfassendes KI-Ökosystem aufzeigen.

🏆 Internet-Giganten legen großen Wert auf die Anwendung von KI-Technologie im Content-Ökosystem und eröffnen eine neue Ära der KI-Service-Ökosysteme.

2. Starke Allianz! JiMeng integriert DeepSeek: Vom Prompt zur Zeichnung in einem Schritt

Die Zusammenarbeit zwischen JiMeng und DeepSeek bietet KI-Mal-Enthusiasten große Vorteile. Dank der intelligenten Prompt-Generierungsfunktion von DeepSeek müssen sich Nutzer keine Gedanken mehr über kreative Inspiration machen. Sie müssen lediglich ihre Anforderungen eingeben, um präzise Prompts zu erhalten, mit denen sie hochwertige Bilder generieren können. Diese innovative Zusammenarbeit steigert nicht nur die Effizienz, sondern macht den Malprozess auch flüssiger und angenehmer.

image.png

【AiBase Zusammenfassung:】

🖌️ JiMeng integriert DeepSeek und bietet eine intelligente Prompt-Generierungsfunktion, die die kreativen Herausforderungen der Nutzer löst.

✨ Nutzer müssen nur einfache Anforderungen eingeben, DeepSeek generiert dann detaillierte und präzise Prompts, was die Effizienz steigert.

🌟 Die von DeepSeek generierten Prompts sind von hoher Qualität und leiten die KI effektiv zur Generierung hochwertiger Bilder. Das Nutzerfeedback ist positiv.

3. Grok Sprachmodus vollständig freigeschaltet: 11 Modi online, integrierte Untertitel machen es zum englischen Lernwerkzeug

Der KI-Assistent Grok von xAI stellt seinen mit Spannung erwarteten Sprachmodus allen Nutzern zur Verfügung und bietet 11 einzigartige Sprachinteraktionsmodi und eine Funktion für Sprach-Untertitel. Dieses Update verbessert nicht nur das interaktive Nutzererlebnis, sondern bietet auch Englischlernenden ein neues Lernwerkzeug. Die Nutzer reagieren begeistert auf dieses Update. Obwohl es derzeit nur Englisch unterstützt, wird die vielfältige Ausdrucksweise und die Flüssigkeit von Grok von den Nutzern hoch gelobt, und die Erwartung auf zukünftige Unterstützung weiterer Sprachen wächst stetig.

image.png

【AiBase Zusammenfassung:】

🎤 Der Sprachmodus von Grok ist jetzt für alle Nutzer verfügbar und bietet 11 einzigartige Interaktions-Stile, darunter 2 Modi mit 18+ Beschränkungen.

📚 Die neue Funktion für Sprach-Untertitel hilft Nutzern, Inhalte besser zu verstehen und ist ein praktisches Werkzeug zum Englischlernen.

🌍 Nutzer loben die Flüssigkeit und den emotionalen Ausdruck von Grok und erwarten zukünftig die Unterstützung weiterer Sprachen.

4. Vivo reorganisiert und gründet neue KI-Abteilung, verlagert das Training großer Modelle auf Endgeräte

Vivo hat kürzlich seine Organisationsstruktur grundlegend überarbeitet und eine neue KI-Abteilung gegründet, was die kontinuierlichen Investitionen und die strategische Ausrichtung im Bereich der Künstlichen Intelligenz zeigt. Die neue Abteilung wird sich auf das Training großer Modelle auf Endgeräten konzentrieren und die kommerzielle Bewertung aussetzen, was die Bedeutung von Vivo für die langfristige Entwicklung der KI-Technologie unterstreicht. Darüber hinaus hat Vivo DeepSeek-R1 eingeführt, um die Intelligenz des KI-Assistenten zu verbessern und das Nutzererlebnis weiter zu steigern.

image.png

【AiBase Zusammenfassung:】

🆕 Vivo gründet eine neue KI-Abteilung, was die kontinuierlichen Investitionen und die strategische Ausrichtung des Unternehmens in der KI-Technologie zeigt.

📉 Aufgrund von Management-Interventionen hat Vivo beschlossen, die Kommerzialisierung großer KI-Modelle vorerst nicht zu bewerten und die Finanzmittel-Investitionen auszusetzen.

🚀 Das kürzlich eingeführte DeepSeek-R1 verbessert die Intelligenz des KI-Assistenten, und das Nutzererlebnis wurde deutlich verbessert.

5. Neue Technologie Fast3R: Rekonstruktion von Tausenden von Bildern in 3D mit einem Klick – erstaunlich schnell!

Fast3R ist eine innovative Technologie zur mehrperspektivischen 3D-Rekonstruktion, die bis zu 1500 Bilder in einer einzigen Vorwärtsausbreitung verarbeiten kann und die Rekonstruktionsgeschwindigkeit deutlich erhöht. Im Vergleich zu traditionellen DUSt3R-Methoden nutzt Fast3R eine auf Transformer basierende Architektur zur parallelen Verarbeitung von Ansichtsinformationen, wodurch der komplexe Ausrichtungsprozess entfällt, die Inferenzgeschwindigkeit erhöht und die Fehlerakkumulation reduziert wird.

image.png

【AiBase Zusammenfassung:】

🌟 Die Fast3R-Technologie kann bis zu 1500 Bilder in einer einzigen Vorwärtsausbreitung verarbeiten und die Geschwindigkeit der 3D-Rekonstruktion deutlich erhöhen.

⚡ Die Transformer-Architektur von Fast3R unterstützt die parallele Verarbeitung und entfällt den komplexen Ausrichtungsprozess traditioneller Methoden.

🚀 Im Vergleich zu DUSt3R zeigt Fast3R deutliche Vorteile in Bezug auf Zeit und Speicherverbrauch und eignet sich für groß angelegte 3D-Rekonstruktionsanwendungen.

Detaillierter Link:https://fast3r-3d.github.io/

6. Atombombe im Bereich der Musikkomposition! DiffRhythm erscheint: 10 Sekunden KI-Hit, Gesang und Begleitung mit einem Klick!

Das Erscheinen von DiffRhythm markiert eine neue Ära in der Musikkomposition. Es nutzt ein Diffusionsmodell, um Musik von Ende zu Ende automatisch zu generieren. Nutzer müssen nur Text und Stil eingeben, um innerhalb von 10 Sekunden einen vollständigen Song zu erhalten. DiffRhythm kann nicht nur Begleitmusik generieren, sondern auch automatisch Texte erstellen, die perfekt zur Melodie passen. Dies revolutioniert die traditionelle Musikkomposition und läutet eine neue Ära der KI-Musikkomposition ein.

image.png

【AiBase Zusammenfassung:】

🎤 DiffRhythm nutzt ein Diffusionsmodell für die End-zu-End-Musikkomposition. Nutzer müssen nur Text und Stil eingeben, um einen vollständigen Song zu generieren.

⚡ Die Generierungsgeschwindigkeit ist extrem hoch. Ein 4:45-minütiger Song wird in nur 10 Sekunden erstellt, 50-mal schneller als traditionelle Methoden.

🎼 Ein leistungsstarkes großes Sprachmodell ist integriert, das automatisch Texte erstellt und diese perfekt mit der Melodie abgleicht. Dies revolutioniert die traditionelle Kompositionsweise.

Detaillierter Link:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7. Microsoft veröffentlicht Open-Source-Bildmodell ART, kann mehrschichtige transparente Bilder generieren

Im Bereich der Bildgenerierung revolutioniert die von Microsoft-Forschern entwickelte „Anonymous Region Transformer“ (ART)-Technologie die Interaktion von Nutzern mit Generierungsmodellen. Durch das Layout anonymer Bereiche kann ART mehrschichtige transparente Bilder direkt anhand globaler Text-Prompts generieren und einen schichtweisen Bereichs-Beschneidemechanismus einführen, wodurch die Generierungseffizienz deutlich gesteigert wird – 12-mal schneller als traditionelle Methoden.

image.png

【AiBase Zusammenfassung:】

🌟 ART kann anhand globaler Text-Prompts und des Layouts anonymer Bereiche direkt mehrschichtige transparente Bilder generieren.

⚡️ Durch den schichtweisen Bereichs-Beschneidemechanismus wird die Effizienz der Bildgenerierung deutlich gesteigert – 12-mal schneller als traditionelle Methoden.

💡 Ein neuer, hochwertiger Autoencoder unterstützt die präzise Steuerung und Generierung mehrschichtiger transparenter Bilder und fördert die interaktive Inhaltserstellung.

Detaillierter Link:https://art-msra.github.io/

8. KI-Mindmap-Tool MindMapper: Link einfügen und interaktive Mindmap generieren

Im Zeitalter der Informationsflut ist die Mind Mapper-Anwendung zu einem leistungsstarken Werkzeug für die Gedankenorganisation geworden. Sie kann die Ideen der Nutzer in lebendige Mindmaps umwandeln. Mit der Eingabe von URLs, YouTube-Video-Links oder Text-Prompts können schnell interaktive Mindmaps generiert werden.image.png

【AiBase Zusammenfassung:】

🖥️ Mind Mapper kann Ideen in lebendige Mindmaps umwandeln und unterstützt die Eingabe von URLs, Video-Links und Text-Prompts.

🎨 Mit der Mermaid.js-Technologie sind die Mindmaps nicht nur ästhetisch, sondern auch dynamisch interaktiv, sodass Nutzer leicht detaillierte Informationen erhalten können.

📤 Die Mindmaps können als PNG-Bilder heruntergeladen und geteilt werden, um Wissen und Inspiration zu verbreiten.

Detaillierter Link:https://github.com/misbahsy/MindMapper

9. Lei Jun auf dem ersten Vertreter-Kanal: Xiaomi wird die neuesten KI-Technologien auf alle Endgeräte anwenden

Auf dem ersten „Vertreter-Kanal“ der dritten Sitzung des 14. Nationalen Volkskongresses beantwortete der Gründer von Xiaomi, Lei Jun, Fragen von Journalisten und diskutierte eingehend die Rolle von Xiaomi in der Fertigungsindustrie und die Richtung der technologischen Innovation. Er betonte, dass die Fertigungsindustrie die Grundlage des Landes sei und Xiaomi die Forschung und Entwicklung, insbesondere im Bereich der Künstlichen Intelligenz, verstärken werde, um die technologische Erfahrung der Verbraucher zu verbessern und die chinesische Modernisierung zu unterstützen.

image.png

【AiBase Zusammenfassung:】

🏭 Die Fertigungsindustrie ist die Grundlage des Landes. Xiaomi wird den Weg der technologischen Innovation und der hochwertigen Entwicklung konsequent verfolgen.

💰 Xiaomi plant, in den Jahren 2021 bis 2025 105 Milliarden Yuan in Forschung und Entwicklung zu investieren, wobei 2025 voraussichtlich 30 Milliarden Yuan investiert werden, wobei KI-bezogene Geschäfte ein Viertel ausmachen.

🌍 Xiaomi setzt sich dafür ein, die neuesten KI-Technologien in Bereichen wie Smartphones, Automobilen und Smart Homes einzusetzen und den Einfluss auf dem Weltmarkt zu stärken.

10. AiShi Technology schließt A5-Finanzierungsrunde ab und zielt auf neue Höhen im Bereich der KI-Videogenerierung

AiShi Technology gab kürzlich den Abschluss einer A5-Finanzierungsrunde bekannt, die von Jingya Capital allein finanziert wurde. Das Finanzierungsvolumen übersteigt 400 Millionen Yuan, was das Unternehmen zu einem Star-Unternehmen im Bereich der KI-Videogenerierung macht. Das 2023 gegründete Unternehmen wurde von Wang Changhu, dem ehemaligen Leiter der visuellen Technologie bei ByteDance, gegründet. Das Team verfügt über einen starken Hintergrund und hat schnell die Gunst vieler Investoren gewonnen. Die Finanzierung wird für die Beschleunigung der Forschung und Entwicklung und die Gewinnung von Talenten verwendet, um führende große KI-Videogenerierungsmodelle und -anwendungen zu entwickeln.

image.png

【AiBase Zusammenfassung:】

📈 AiShi Technology hat eine A5-Finanzierungsrunde abgeschlossen, das Finanzierungsvolumen übersteigt 400 Millionen Yuan, was das Unternehmen zu einem Star-Unternehmen im Bereich der KI-Videogenerierung macht.

🌍 Sein Produkt PixVerse hat über 40 Millionen Nutzer und 15 Millionen monatlich aktive Nutzer, was die führende Technologie demonstriert.

💼 Das Unternehmen plant, die Modellentwicklung und die Gewinnung von hochrangigen Talenten zu beschleunigen und den B2B-Unternehmensservice aktiv auszubauen. Es steht vor Herausforderungen bei der Kommerzialisierung.