Willkommen im Abschnitt „AI-Tageszeitung“! Hier findest du täglich den Leitfaden für die Erkundung der Welt des künstlichen Intellekts. Wir präsentieren dir hier die spannendsten Inhalte aus dem Bereich KI und konzentrieren uns dabei auf Entwickler, damit du Trends in der Technologie und innovative Anwendungen von AI-Produkten verstehen kannst.

Frische AI-Produkte ausprobieren: https://top.aibase.com/

1. Xiaomi übergibt mehrere „Kimi“-Marken an Moon in the Dark

Xiaomi übergab die Marken „Kimi“ an Moon in the Dark, ein Unternehmen, das sich auf KI-Hilfsprogramme spezialisiert. Dies könnte ein strategischer Ressourcenoptimierungsschritt von Xiaomi sein, gleichzeitig hilft es Moon in the Dark dabei, sein Geschäftsmodell für intelligente Hilfsprogramme weiterzuentwickeln.

image.png

„AiBase Zusammenfassung:“

🌟 Xiaomi übergab mehrere „Kimi“-Marken an Beijing Moon in the Dark Technology Co., Ltd., um nicht-kernbezogene Markenressourcen zu optimieren.

🤖 Das KIMI-KI-Hilfsprogramm von Moon in the Dark wurde im Jahr 2023 veröffentlicht, und dieser Markentransfer unterstützt dessen Entwicklung.

🔍 Dieser Handel könnte beiden Unternehmen bessere Marktchancen bieten und die Entwicklung von intelligenten Hilfsprogrammen vorantreiben.

2. Microsoft Bing stellte das neue Video-Creator-Tool Bing Video Creator vor

Microsoft Bing hat mit OpenAI Sora-Modell basierend das Tool Bing Video Creator vorgestellt. Nutzer können kostenlos kurze Videos über Textangaben erstellen, jedoch ist es derzeit nur für mobile Geräte verfügbar und die Generierung ist langsam.

image.png

„AiBase Zusammenfassung:“

✨ Die neue Funktion: Bing Video Creator wird erstmals kostenlos angeboten, Nutzer können kurze Videos durch einfache Textbeschreibungen generieren.

📱 Einschränkung: Derzeit nur für mobile Geräte verfügbar, noch nicht für Desktop-Version, was die Benutzererfahrung beeinträchtigt.

💰 Belohnungsmechanismus: Nutzer können durch Suchen oder Einkaufen Punkte sammeln, nach der kostenlosen Generierung von 10 Videos muss man zahlen, um fortzufahren.

3. ElevenLabs führt das neue Sprachinteraktions-Plattform Conversational AI 2.0 ein: AI-Sprachassistent versteht dich besser als Menschen

ElevenLabs veröffentlichte Conversational AI 2.0, eine Plattform, die in Bezug auf Konversationsflüssigkeit, Mehrsprachigkeit und Unternehmensanwendung große Fortschritte macht und neue Möglichkeiten für Kundenservice, Marketing und Inhaltserstellung bietet.

image.png

„AiBase Zusammenfassung:“

Erweiterte Rundsprache-Modellierung eingeführt, um genau den Gesprächsrhythmus des Nutzers zu erfassen und Unterbrechungen zu vermeiden, um die Konversationsflüssigkeit zu verbessern.

Unterstützung von über 32 Sprachen, mit integriertem automatischen Spracherkennungsfeature, um globale Unternehmenskundenbetreuung zu erleichtern.

Integrierte RAG-Technologie ermöglicht die Extraktion von Informationen aus dem Unternehmenswissen, um Antwortqualität und Genauigkeit zu gewährleisten.

Weitere Informationen: https://elevenlabs.io/blog/conversational-ai-2-0

4. Google Gemini Live-Funktion landet auf iOS-Plattform, neue AI-Erfahrungen starten

Die Gemini Live-Funktion von Google ist sowohl für iOS als auch für iPadOS verfügbar und unterstützt AI-basierte Bilderkennung und Bildinhalt. Aktuell ist sie kostenlos nutzbar. Die Funktion bietet durch Kamera und Bildschirmfreigabe einen bequemen Informationszugriff, aber aktuell nur für Nutzer in den USA.

image.png

„AiBase Zusammenfassung:“

✨ Gemini Live ist nun für iOS/iPadOS verfügbar, AI kann Objekte schnell erkennen und Informationen bereitstellen.

📱 Bildschirmfreigabefunktion ermöglicht es Nutzern, Inhalte einfach zu teilen und die Interaktion zu verbessern.

🌍 Funktion ist derzeit nur in den USA verfügbar, Google strebt eine breitere Anwendung von AI-Technologien an.

5. Character.AI stellt die neue Funktion AvatarFX vor, Nutzer können individuelle Animationsvideos erstellen

Character.AI stellte das Tool AvatarFX vor, das es Nutzern ermöglicht, individuelle Animationsvideos zu erstellen, und fügte neue Funktionen wie „Szenario“ und „Strömung“ hinzu. Allerdings gibt es Probleme mit Missbrauch.

image.png

„AiBase Zusammenfassung:“

🌟 Character.AI stellte das Tool AvatarFX vor, das es Nutzern ermöglicht, individuelle Animationsvideos zu erstellen.

🎬 Neue Funktionen wie „Szenario“ und „Strömung“ ermöglichen Nutzern die freie Freigabe von Charakterentwicklungen.

⚠️ Character.AI wurde wegen Missbrauchsereignissen verklagt, der Plattform liegen Sicherheitsrisiken zugrunde.

Weitere Informationen: https://blog.character.ai/character-ai-unveils-new-ways-to-create/

6. OpenAI verschob Codex CLI von Node.js auf Rust, um Performance und Sicherheit zu optimieren

OpenAI kündigte an, dass sein AI-Programmierschnittstelle Codex CLI von Node.js auf Rust migriert wurde. Diese Maßnahme brachte Verbesserungen in Bezug auf Performance, Sicherheit und Zero-Deps-Installation.

image.png

„AiBase Zusammenfassung:“

🌟 Codex CLI wurde von TypeScript und Node.js auf Rust migriert, was Performance-Optimierung und Sicherheit erhöht.

🔒 Rust erreicht Zero-Deps-Installation, unterstützt Sandbox-Umgebung, erhöht die Cross-Plattform-Kompatibilität.

🚀 Rust-spezifische Merkmale ermöglichen es Codex CLI, als Modell-Kontext-Protokoll-Client und -Server zu dienen, mit hervorragender Leistung.

7. NUS stellte OmniConsistency vor: Kostenarme Bildstilisierung mit perfekter Konsistenz, die GPT-4o herausfordert!

Das Team von National University of Singapore veröffentlichte das Projekt OmniConsistency, das durch ein einzigartiges Lernframework und modulares Architektur kostengünstig Bildstilisierung und perfekte Konsistenz kombiniert, entwicklerfreundliche Werkzeuge bereitstellt.

image.png

„AiBase Zusammenfassung:“

✨ Kombiniert Bildstiltransfer mit Konsistenz durch gelernte Paarbilder, benötigt lediglich 2600 hochwertige Bilder und 500 Stunden GPU-Rechenleistung, um atemberaubende Ergebnisse zu erzielen.

🔄 Modulares Architektur unterstützt bestehende StilisierungsLoRA-Module, leicht in verschiedene Projekte integrierbar.

🌟 Fügt kommerzielle Fähigkeiten in das Open-Source-Ökosystem ein, um die Entwicklung von KI-Kunst zu fördern.

Weitere Informationen: https://github.com/showlab/OmniConsistency

8. Hume AI veröffentlicht EVI 3: Ein Sprachassistent, der deine Emotionen versteht und schneller ist als GPT-4o!

Hume AI veröffentlicht die dritte Version des sprachbasierten Interaktionsmodells EVI3 mit ausgezeichneter Fähigkeit zur Emotionsverarbeitung und einer personalisierten Interaktionserfahrung, was einen bedeutenden Durchbruch in der emotionalen Interaktion und natürlichen Kommunikation darstellt.

image.png

„AiBase Zusammenfassung:“

✨ EVI3 kann genaue Emotionen in der Sprache des Nutzers erkennen und entsprechende Stimmlagen und Persönlichkeitsmerkmale generieren, um emotionales Intelligence und Sprachinteraktion zu integrieren.

🚀 Niedrige Latenz und intelligente Antwort, mit einem Inferenz-Latency von 300 ms, übertreffen GPT-4o in Ausdrucksfähigkeit und Natürlichkeit.

🌐 Mehrere Szenarien unterstützen, einschließlich Kundendienst und Content-Erstellung, künftig erweiterte Unterstützung für weitere Sprachen für globalen Einsatz.

Weitere Informationen: https://demo.hume.ai/

9. Insiderbericht: Apple besitzt ein AI-Modell mit 150 Milliarden Parametern, das sich mit ChatGPT messen kann – aber es wird nicht veröffentlicht

Apple wird bei WWDC eine Basisversion öffentlich machen, deren Leistung begrenzt ist, während seine fortschrittlichere interne AI-Modelle keine Öffentlichkeit finden werden. Führungskrise verzögerte mehrere AI-Projekte, WWDC war eher eine Marketing-Premiere.

image.png

„AiBase Zusammenfassung:“

🍎 Apples geplantes AI-Modell hat ungefähr 3 Mrd. Parameter, geringe Performance und beschränkt auf grundlegende Funktionen.

🚀 Apple hat größere interne AI-Modelle mit bis zu 150 Mrd. Parametern, aber diese werden nur für interne Tests verwendet, ohne öffentliche Verfügbarkeit geplant.

⏳ Apple führt intern große Meinungsverschiedenheiten, mehrere AI-Projekte wurden verschoben, WWDC enthält meist kleinere Updates statt innovativer Funktionen.

10. Google stellte die AI-Edge-Gallery-App vor, um offline-AI-Berechnungen auf Smartphones zu ermöglichen

Google stellte die AI-Edge-Gallery-App vor, die es Nutzern ermöglicht, komplexe AI-Modelle auf ihrem Smartphone offline auszuführen. Dies erhöht die Privatsphäre und unterstützt viele AI-Funktionen, aber die Installation und Nutzung bietet noch Raum für Verbesserungen.

image.png

„AiBase Zusammenfassung:“

🌟 Google stellte die AI-Edge-Gallery-App vor, die offline-AI-Berechnungen ermöglicht und die Privatsphäre erhöht.

📱 Die App unterstützt Hugging Face Modelle zum Download, bietet mehrere AI-Funktionen wie Mehrfachgespräche und Bildfragen, alles lokal verarbeitet.

🔒 Lokale Verarbeitung löst Privatsphäreprobleme, besonders für medizinische und finanzielle Branchen.

Weitere Informationen: https://github.com/google-ai-edge/gallery

11. Cerebras öffnet den Zugang zu seinem Inferenz-API vollständig für Entwickler, täglich Millionen kostenlose Tokens

Cerebras Systems gab seinen Inferenz-API den volllständigen Zugang frei, entfernte Wartelistenbeschränkungen und bietet täglich Millionen kostenlose Tokens, was die Effizienz der AI-Inferenz signifikant steigert, besonders in Bereichen wie reale Sprach- und Videobearbeitung.

image.png

„AiBase Zusammenfassung:“

🚀 Der Inferenz-API-Zugang ist kostenlos und täglich Millionen kostenlose Tokens verfügbar, signifikante Kostenreduktion für Entwickler.

⚡ Die Inferenzgeschwindigkeit ist 20-mal schneller als GPUs, besonders für komplexe Inferenzmodelle und Codegenerierungstasks optimal.

🌐 Unterstützt weit verbreitete Open-Source-Modelle, eignet sich gut für Hugging Face und Meta-Plattformen, vereinfacht den Entwicklungsprozess.

12. Nvidia und MIT veröffentlichen den Framework Fast-dLLM, AI-Inferenz Geschwindigkeit steigt um 27,6-mal

Nvidia arbeitete zusammen mit MIT und Hong Kong University an dem Framework Fast-dLLM, das durch innovative Mechanismen die Inferenzgeschwindigkeit von Diffusionsmodellen signifikant erhöht, wobei die Qualität der Erzeugung erhalten bleibt, um starke Unterstützung für AI-Anwendungen zu bieten.

image.png

„AiBase Zusammenfassung:“