Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich Ihren Wegweiser durch die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Themen aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Sensationell! Stability AIs SD3.5L erhält drei neue ControlNet-Funktionen – Bildgenerierung auf höchstem Niveau

Stability AI hat eine neue Version von Stable Diffusion 3.5 Large veröffentlicht, die drei neue ControlNet-Funktionen umfasst: Blur, Canny und Depth. Diese verbessern die Bildgenerierungsfähigkeit deutlich. Das Modell kann von Nutzern kostenlos und nicht-kommerziell verwendet werden. Kleine Unternehmen und Kreative mit einem Jahresumsatz von unter 1 Million US-Dollar dürfen es sogar kommerziell kostenlos nutzen.

image.png

【AiBase Zusammenfassung:】

🌟 Drei neue ControlNet-Funktionen: Blur, Canny und Depth verbessern die Bildgenerierung.

💼 Kostenlose Nutzung: Privatpersonen und Unternehmen mit einem Jahresumsatz unter 1 Million US-Dollar können das Modell kostenlos nutzen.

🔒 Sicherheit im Fokus: Stability AI ergreift Maßnahmen gegen den Missbrauch des Modells.

Mehr Infos: https://stability.ai/news/sd3-5-large-controlnets

2. Kimi testet KI-Videoerstellungsfunktion: Täglich 100 Sekunden kostenlose Kreativität

Das KI-Chat-Tool Kimi testet derzeit seinen innovativen KI-Videoerstellungsdienst – den Kimi-Kreativraum. Dieser befindet sich in der Grauton-Testphase und soll Nutzern neue kreative Ausdrucksmöglichkeiten bieten. Mit 12 voreingestellten Stilvorlagen und einer benutzerdefinierten Erstellungsfunktion lassen sich personalisierte Musikvideos erstellen. Täglich stehen 100 Sekunden kostenlose Videogenerierung zur Verfügung.

image.png

【AiBase Zusammenfassung:】

🎨 Der Kimi-Kreativraum bietet 12 voreingestellte Stile und benutzerdefinierte Funktionen für die individuelle Videogestaltung.

🎶 Täglich können 100 Sekunden Video kostenlos erstellt werden, was die Flexibilität der Kreation deutlich erhöht.

💡 Die Funktion unterstützt detaillierte Beschreibungen von Videoszenen und bietet so mehr Möglichkeiten für kreative Ausdrucksformen und fördert die Entwicklung der KI-Videogenerierungstechnologie.

3. Grenzenlos! Zhishu AI veröffentlicht aktualisierte Version von AutoGLM – Steuerung aller Apps mit einem Satz

Zhishu AI hat kürzlich mehrere aktualisierte Versionen von AutoGLM veröffentlicht, darunter eine Browser- und eine Desktop-Version, die beeindruckende Fähigkeiten zur App-übergreifenden Steuerung zeigen. Mit nur einem Satz können Nutzer zwischen verschiedenen Anwendungen wechseln und diese steuern, was die Effizienz enorm steigert.

【AiBase Zusammenfassung:】

⚡ App-übergreifende Steuerung: Nutzer können mit nur einem Satz zwischen verschiedenen Anwendungen wechseln und diese steuern, was die Effizienz deutlich erhöht.

🖥️ GLM-PC-Sprachsteuerung: Der Computer lässt sich per Sprachbefehl steuern, was Arbeitsabläufe vereinfacht und für Arbeitnehmer eine große Hilfe ist.

🌟 AutoGLM Allrounder: Unterstützt gängige Apps, Nutzer können problemlos Aufgaben wie Bestellen und Suchen erledigen. Dies zeigt die Intelligenz und Flexibilität von KI.

4. Tesla „Optimus“-Roboter verbessert: Geschicktere und empfindlichere Hände!

Tesla hat das Handdesign seines humanoiden Roboters „Optimus“ erheblich verbessert. Er verfügt nun über 22 Freiheitsgrade und eine weiche Schutzschicht, was seine Beweglichkeit und sein Tastgefühl verbessert. Diese Innovation eröffnet neue Möglichkeiten für den Einsatz des Roboters in Haushalten, im Gesundheitswesen und in der Industrie und zeigt Teslas kontinuierliche Forschung im Bereich der Robotik.

【AiBase Zusammenfassung:】

🤖 Das neue Handdesign bietet 22 Freiheitsgrade und erhöht so die Beweglichkeit und Präzision.

🛡️ Die neue Schutzschicht verbessert das Tastgefühl und ermöglicht den sicheren Umgang mit empfindlichen Gegenständen.

⚙️ Alle Aktuatoren sind im Unterarm integriert. Die Sensorintegration und die Gewichtsreduzierung sollen bis Ende des Jahres abgeschlossen sein.

5. Amazon entwickelt neues multimodales Sprachmodell „Olympus“, das auf der AWS-Konferenz vorgestellt werden könnte

Amazon entwickelt ein multimodales großes Sprachmodell namens „Olympus“, das voraussichtlich nächste Woche auf der AWS re:Invent-Konferenz vorgestellt wird. Das Modell kann nicht nur Text, sondern auch Bilder und Videos verarbeiten und bietet ein breites Anwendungspotenzial.

【AiBase Zusammenfassung:】

💡 Das neue Modell „Olympus“ verarbeitet Text, Bilder und Videos und unterstützt die natürliche Sprachsuche nach bestimmten Videoclips.

🚀 Das Modell wird voraussichtlich nächste Woche auf der AWS re:Invent-Konferenz offiziell vorgestellt und könnte Teil von AWS Bedrock sein.

🔧 Amazons KI-Strategie umfasst nicht nur Software, sondern auch die Entwicklung von Hardware, einschließlich einer Reihe von Spezialchips für Training und Inferenz.

6. Rhymes AI präsentiert revolutionäres Text-Bild-Video-Generierungsmodell Allegro-TI2V

Das kürzlich von Rhymes AI vorgestellte Modell Allegro-TI2V stellt einen großen Fortschritt in der Text-zu-Video-Generierung dar. Es unterstützt eine Kontextlänge von bis zu 79,2 K und eine Ausgabeauflösung von 720 × 1280 und bietet eine effiziente Videogenerierung, die den Bedürfnissen von Kreativen in den Bereichen Film, Spiele und digitale Kunst entspricht.

【AiBase Zusammenfassung:】

🚀 Allegro-TI2V unterstützt eine Kontextlänge von bis zu 79,2 K und eine Auflösung von 720 × 1280. Die Videogenerierungsgeschwindigkeit beträgt bis zu 15 Bilder pro Sekunde.

🎨 Das Modell führt zwei neue Modi ein: die fortlaufende und die Zwischen-Videogenerierung, was die Flexibilität und Effizienz der Videokreation deutlich erhöht.

💻 Rhymes AI veröffentlicht Allegro-TI2V unter der Apache2.0-Lizenz. Nutzer können es einfach installieren und verwenden. Die Anwendungsperspektiven sind vielversprechend.

Mehr Infos: https://huggingface.co/rhymes-ai/Allegro-TI2V

7. Erschreckend! KI erstellt mit nur zwei Stunden Interview eine perfekte Persönlichkeitsimitierung mit 85% Genauigkeit!

Ein Forschungsteam hat in Zusammenarbeit mit Google DeepMind eine neue KI-Anwendung entwickelt, die nach nur zwei Stunden Interview eine Persönlichkeitssimulation mit einer Genauigkeit von 85 % erstellen kann. Diese Technologie basiert auf dem ChatGPT-Sprachmodell und erfasst durch Fragen und Aufzeichnungen der Antworten die Persönlichkeitsmerkmale.

image.png

【AiBase Zusammenfassung:】

🔍 Das KI-Modell erstellt nach einem zweistündigen Interview eine Persönlichkeitssimulation mit 85%iger Genauigkeit.

💡 Diese Technologie soll die Kosten und den Zeitaufwand für soziologische Studien senken und die Effektivität und Reichweite von Untersuchungen verbessern.

🤖 Die simulierte Persönlichkeit wird als „Agent“ bezeichnet und könnte zukünftig die Mensch-Maschine-Interaktion bei Arbeitsassistenten und persönlichen Robotern verbessern.

Mehr Infos: https://techxplore.com/journals/arxiv/

8. Gudong Technology präsentiert binokulare Vollfarb-AI+AR-Brille: Unsichtbares Tragen + HD-Objektiv

Die von Gudong Technology vorgestellten Brillen Star1 und Star1S repräsentieren die perfekte Kombination aus KI und AR-Technologie und bieten Vollfarbanzeige und leistungsstarke KI-Funktionen. Die Brillen wurden nicht nur hinsichtlich des Tragekomforts, sondern auch hinsichtlich der HD-Bildqualität und der Anwendung multi-modaler KI-Systeme optimiert. Die Star1S, die erste binokulare Array-Lichtwellenleiter-AR-Brille in Vollfarbe der Branche, soll im Dezember auf den Markt kommen.

【AiBase Zusammenfassung:】

🖼️ Die Star1S ist die erste binokulare Array-Lichtwellenleiter-AR-Brille in Vollfarbe und bietet höheren Tragekomfort und Bildschärfe.

🤖 Ausgestattet mit einem multimodalen KI-System bietet die Star1S ganztägige, lange Akkulaufzeiten in verschiedenen Umgebungen und erfüllt die Anforderungen verschiedener Szenarien.

📱 Kompatibel mit gängigen Anwendungen können Nutzer über die Brille direkt telefonieren und Videos ansehen – die Funktionalität ähnelt der eines Smartphones.

9. ChatGPT feiert zweijähriges Jubiläum – über 200 Millionen Nutzer

ChatGPT hat seit seiner Einführung im Jahr 2022 eine rasante Entwicklung durchgemacht und ist zu einem unverzichtbaren digitalen Werkzeug im Alltag geworden. Die Nutzerzahlen sind innerhalb kurzer Zeit auf über 200 Millionen gestiegen, mit monatlich 3,1 Milliarden Zugriffen. Die Einführung der neuen Version GPT-4o und der Suchfunktion hat das Nutzererlebnis verbessert, doch es bestehen weiterhin Probleme hinsichtlich der Genauigkeit der Informationen und ethischer Fragen. OpenAI arbeitet intensiv an der Lösung dieser Herausforderungen, um den Service und das Vertrauen der Nutzer weiter zu optimieren.

【AiBase Zusammenfassung:】

🌐 Die Nutzerzahlen von ChatGPT sind innerhalb von zwei Jahren explodiert, und es ist zu einem wichtigen digitalen Assistenten im Haushalt geworden.

🔍 Die neue Suchfunktion verbessert den Zugriff auf Informationen und stellt eine Herausforderung für traditionelle Suchmaschinen dar.

⚖️ ChatGPT steht weiterhin vor Herausforderungen hinsichtlich der Genauigkeit der Informationen und ethischer Fragen. Es müssen weitere Lösungen gefunden werden.

10. Rasantes Wachstum! xAI erreicht in etwas mehr als einem Jahr eine Bewertung von 50 Milliarden US-Dollar

Das KI-Unternehmen xAI von Elon Musk hat innerhalb von nur 16 Monaten eine Bewertung von 50 Milliarden US-Dollar erreicht und damit viele Wettbewerber übertroffen. Im Vergleich zu OpenAI zeigt das schnelle Wachstum von xAI sein starkes Potenzial und seine Marktattraktivität im KI-Bereich. Das Unternehmen hat seine Position in der Branche durch Finanzierungen und technologische Innovationen, insbesondere den Bau von Supercomputern, weiter gefestigt.

【AiBase Zusammenfassung:】

🚀 xAI hat innerhalb von 16 Monaten eine Bewertung von 50 Milliarden US-Dollar erreicht und damit mehrere Wettbewerber übertroffen.

💰 Kürzlich wurden 5 Milliarden US-Dollar an Finanzmitteln für den Kauf von NVIDIA-Chips zur Unterstützung des Baus von Supercomputern eingeworben.

🤖 Der Chatbot Grok ist zu einem starken Wettbewerber auf dem Markt geworden und verbessert seine Reaktionsfähigkeit durch das Training in sozialen Medien.