Willkommen bei der Reihe „AI Daily“! Hier ist Ihr tägliches Leitfaden für die Welt der Künstlichen Intelligenz. Jeden Tag präsentieren wir Ihnen die aktuellen Themen aus dem Bereich KI, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu verstehen und innovative Anwendungen von KI-Produkten kennenzulernen.

Frische KI-Produkte klicken Sie hierhttps://top.aibase.com/

1. Bilibili testet ein neues AI-Videocreation-Tool „Huasheng AI“, in 3 Minuten fertiggestellt

Bilibili testet ein neues AI-Videocreation-Tool namens „Huasheng AI“, das Benutzern hilft, schnell Videoinhalte zu erstellen, wobei die Qualität der fertigen Videos hoch ist. Gleichzeitig fördert Bilibili auch die Anwendung von KI-Technologie, wie beispielsweise selbstentwickelte große Sprachmodelle und mehrsprachige Übersetzungsfeatures.

image.png

【AiBase Zusammenfassung:】

🎥 Huasheng AI kann Videos schnell mit Text oder Audio erstellen.

🔄 Benutzer können entweder intelligent Materialien auswählen oder Vorlagen für die Videocreation verwenden.

🌐 Bilibili hat bereits ein selbstentwickeltes großes Sprachmodell veröffentlicht, das mehrsprachige Echtzeitübersetzungen unterstützt.

2. Kunlun Wanshi gibt das Modell „Skywork UniPic 2.0“ frei

Die Kunlun Wanshi Gruppe gab während der SkyWork AI-Technologie-Veröffentlichungswoche das Modell „Skywork UniPic 2.0“ frei. Dieses einheitliche multimodale Modell erreicht eine effiziente, qualitativ hochwertige und einheitliche multimodale Generierungsfähigkeit durch eine leichte Gestaltung der Generations- und Bearbeitungsmodulen sowie gemeinsames Training des multimodalen Verständnismodells.

image.png

【AiBase Zusammenfassung:】

🧠 Skywork UniPic 2.0 ist ein einheitliches multimodales Modell, das Text- und Bildeingaben unterstützt und die Fähigkeit zur Bildgenerierung und -bearbeitung erweitert.

🚀 Auf Basis der SD3.5-Medium-Architektur wird durch gemeinsames Training die integrierte Fähigkeit zur Verständigung, Generierung und Bearbeitung erreicht.

💡 Die Einführung von Verstärkendem Lernen und einer schrittweisen Doppelaufgabenstrategie verbessert das Verständnis komplexer Befehle und die Konsistenz der Bildgenerierung.

Weitere Informationen: https://unipic-v2.github.io/

3. Alibaba Tongyi Qianwen stellt Qwen Code offiziell vor!

Alibaba Cloud hat den AI-Programmierintelligenzagenten Qwen Code vorgestellt, der Entwicklern starke und benutzerfreundliche Werkzeuge bietet, gleichzeitig die Kosten senkt und die Verbreitung von KI im Softwareentwicklungssektor fördert.

image.png

【AiBase Zusammenfassung:】

🤖 Qwen Code ist ein AI-Programmierintelligenzagent, der über die Befehlszeilenschnittstelle arbeitet und Aufgaben wie Code-Generierung, -Ergänzung, -Debugging und -Erklärung unterstützt.

🌐 Alibaba Cloud Tongyi Qianwen bietet chinesischen Nutzern täglich 2000 kostenlose Aufrufe, während ausländische Nutzer 1000 erhalten.

🚀 Qwen Code basiert auf der Qwen3-Coder-Serie und verfügt über starke technische Unterstützung, wobei die Leistung mit führenden Modellen der Branche vergleichbar ist.

4. Musk kritisiert Apple für „Vorteilnahme“ von OpenAI, Apple reagiert nicht nachgiebig!

Musk behauptete, dass Apple im App Store OpenAI bevorzugt, während Apple antwortete, dass die Plattform fair und gerecht gestaltet sei. Die Spannungen zwischen beiden Seiten steigen, was möglicherweise rechtliche und marktwirtschaftliche Konfrontationen in der Zukunft auslösen könnte.

image.png

【AiBase Zusammenfassung:】

🍎 Musk behauptet, dass Apple im App Store OpenAI bevorzugt und dadurch andere KI-Unternehmen beeinträchtigt.

⚖️ Apple betont, dass die App Store-Designs fair und gerecht sind und sicherstellen, dass Entwickler Exposure erhalten.

🔥 Musk droht, rechtliche Maßnahmen gegen Apple einzuleiten, wodurch sich die Spannungen weiter verschärfen.

5. Tencent Huan Yuan veröffentlicht das Multimodalverständnismodell Large-Vision mit 52B Parametern, das beliebige Auflösungen und Szenarien unterstützt

Das Team von Tencent Huan Yuan hat ein neues Multimodalverständnismodell namens Huan Yuan Large-Vision veröffentlicht. Das Modell verwendet eine MoE-Architektur mit 52B Parametern und unterstützt beliebige Bildauflösungen, Videos und 3D-Räume. Gleichzeitig wurde die Verständnisfähigkeit in multilingualen Szenarien verbessert und liefert eine starke technische Grundlage für KI-Vision-Dienste.

image.png

【AiBase Zusammenfassung:】

🖼️ Unterstützt beliebige Bildauflösungen ohne komplexe Vorbereitungsoperationen.

🧠 Nutzt eine MoE-Architektur, um Leistung und Effizienz zu balancieren.

🌐 Verbessert die Verständnisfähigkeit in multilingualen Szenarien und unterstützt multilinguale multimodale Anwendungen.

6. Offizielle Ablehnung des geplanten DeepSeek-R2-Modells im August

Der offizielle Vertreter von DeepSeek lehnte die Gerüchte ab, dass sein nächstes großes Modell DeepSeek-R2 im Zeitraum vom 15. bis 30. August veröffentlicht werden sollte. Obwohl es früher Gerüchte gab, dass R2 im März oder Mai veröffentlicht werden würde, wurden diese alle von der offiziellen Seite abgelehnt. Der genaue Veröffentlichungszeitpunkt und die technischen Details des R2-Modells wurden bislang noch nicht bekanntgegeben.

image.png

【AiBase Zusammenfassung:】

📌 Der offizielle Vertreter von DeepSeek lehnte die Gerüchte über die Veröffentlichung von R2 im August ab.

📌 Der Veröffentlichungszeitpunkt und die Details des R2-Modells wurden noch nicht offiziell bekanntgegeben.

📌 Das DeepSeek-Team verbessert weiterhin die Leistung des Modells und ist noch nicht bereit, es offiziell einzusetzen.

7. OpenAI präsentiert das kostengünstige ChatGPT Go-Paket: Nur 399 Rupien, weltweite Nutzer staunen

OpenAI hat das ChatGPT Go-Paket mit extrem niedrigen Preisen (399 indischen Rupien) für Nutzer auf den Markt gebracht, das mehr KI-Dienstleistungen bietet, darunter längere Gesprächsunterstützung, Datei-Uploads und Bildgenerierung, um den Zugang zu erleichtern und mehr Nutzer anzuziehen.

image.png

【AiBase Zusammenfassung:】

🤖 Das ChatGPT Go-Paket bietet mehr Gesprächsmöglichkeiten und Funktionen zum Upload von Dateien.

🎨 Nutzer genießen stärkere Fähigkeiten zur Bildgenerierung.

📊 Das Go-Paket enthält auch fortgeschrittene Datenanalyse-Funktionen.

8. KI-Newcomer Perplexity investiert 34,5 Milliarden US-Dollar, will Google Chrome kaufen

Perplexity bot 34,5 Milliarden US-Dollar in bar an, um den Google Chrome-Browser zu kaufen, um Google's Antitrust-Probleme zu bekämpfen. Seine Zusicherung, Chromium offen zu halten und Chrome als Standard-Einstellung zu bewahren, zeigte tiefes Verständnis des Marktes und der Wettbewerbslandschaft.

image.png

【AiBase Zusammenfassung:】

💰 Perplexity bot 34,5 Milliarden US-Dollar in bar, um Chrome zu kaufen und zeigt damit großes Ambition.

🔒 Versprach, Chromium offen zu halten und Chrome als Standard-Einstellung zu bewahren, um regulatorische Bedenken zu reduzieren.

🌐 Chrome hat einen Marktanteil von 68 % und könnte zu einem intensiven Bieterkampf führen.

9. Anthropic’s Claude Sonnet 4 Modell unterstützt bis zu 1 Million Wörter

Anthropic hat das Claude Sonnet 4-Modell vorgestellt, das seine Kontext-Wort-Token-Begrenzung auf 1 Million erweitert hat und so die Flexibilität der Entwicklung signifikant erhöht hat. Gleichzeitig wurde eine neue Preismodellierung eingeführt und wetteifert mit Google Gemini.

image.png

【AiBase Zusammenfassung:】

🤖 Das Claude Sonnet 4-Modell von Anthropic unterstützt bis zu 1 Million Kontext-Wort-Token und erhöht die Flexibilität der Entwicklung.

💰 Neue Preisgestaltung unterscheidet sich nach verschiedenen Worttoken-Bereichen, wodurch Entwickler durch Batch-Verarbeitung Kosten sparen können.

🔄 OpenAI hält sich zurück bezüglich langer Kontextanforderungen, steht aber unter Wettbewerbsdruck von Anthropic und Google Gemini.

10. ChatGPT Update! GPT-5-Modus wechselbar, 4o kehrt zurück, Erlebnis wärmer

OpenAI hat eine wichtige Aktualisierung für ChatGPT durchgeführt, bei der GPT-4o als Standardmodell wiederhergestellt wurde und für GPT-5 verschiedene Modi eingeführt wurden. Gleichzeitig wurde die Interaktionspersönlichkeit des KI-Systems optimiert, sodass sie wärmer und nutzerfreundlicher ist und die Gesamterfahrung verbessert wird.

image.png

【AiBase Zusammenfassung:】

✨ GPT-5 unterstützt drei Modi, um verschiedene Szenarien zu bedienen.

🔄 Das Modell-Selektor-Tool wurde optimiert, wodurch zahlende Nutzer flexiblen Zugriff auf verschiedene Modelle haben.

💬 Die Interaktionspersönlichkeit des KI-Systems wurde verbessert, um die Nutzererfahrung und Natürlichkeit zu erhöhen.