Willkommen bei der Rubrik „AI Daily“! Hier ist Ihr tägliches Leitfaden für die Exploration der Welt der künstlichen Intelligenz. Jeden Tag präsentieren wir Ihnen die aktuellen Themen aus dem Bereich KI, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu verstehen und innovative Anwendungen von KI-Produkten kennenzulernen.

Frische KI-Produkte klicken Sie hier:https://app.aibase.com/zh

1. DeepSeek veröffentlicht V3.2-exp-Modell mit innovativer seltener Aufmerksamkeitsmechanik – API-Kosten werden um die Hälfte reduziert

DeepSeek hat ein neues Experimentiermodell namens V3.2-exp veröffentlicht. Durch die innovative „seltene Aufmerksamkeit“-Mechanik reduzierte es signifikant die Rechenkosten für langfristige Kontextverarbeitung. Das Modell kombiniert den „Blitz-Indexer“ und das „feinkörnige Token-Auswahlsystem“, um die Effizienz bei der Verarbeitung langer Textabschnitte zu erhöhen und zeigte in frühen Tests einen Vorteil von 50 % bei den API-Kosten.

image.png

【AiBase Zusammenfassung:】

⚡ DeepSeek stellte das V3.2-exp-Modell vor, das eine seltene Aufmerksamkeitsmechanik zur Optimierung der Verarbeitung langer Kontexte verwendet.

🔍 Der Blitz-Indexer und das feinkörnige Token-Auswahlsystem arbeiten zusammen, um die Effizienz des Modells zu steigern.

💰 Frühe Tests zeigen, dass die API-Kosten um bis zu 50 % gesunken sind, was eine wirtschaftliche Lösung für KI-Anwendungen bietet.

2. Anthropic legt nach! Claude Sonnet4.5 schlägt GPT-5, „König“ der Codierung wird geboren

Anthropic hat das Claude Sonnet4.5-Modell veröffentlicht, das sich in Codierungsaufgaben und komplexen Aufgaben gut schlägt und eines der besten Codierungsmodelle ist. Seine Leistung wurde deutlich verbessert, es unterstützt mehrere Plattformen und verfügt auch über Verbesserungen in Sicherheit und Ausrichtung.

image.png

【AiBase Zusammenfassung:】

✅ Claude Sonnet4.5 zeigt hervorragende Leistung in Codierungsbenchmark-Tests und erreicht eine autonome Arbeitszeit von über 30 Stunden.

🔧 Neue Funktionen wie Checkpoints, Kontextbearbeitung und Speicherwerkzeuge erhöhen die Entwicklereffizienz und Nützlichkeit.

🔒 Sicherheit wird betont, Risikoverhalten wird reduziert und es eignet sich für Szenarien mit hohem Risiko.

3. ChatGPT chatten und gleichzeitig kaufen! KI-revolutionäre E-Commerce: Ein-Klick-Bestellung, ohne Browser-Wechsel

ChatGPT bietet die Funktion „Sofortzahlung“ an, sodass Benutzer direkt im Chat-Fenster eine einzelne Kaufaktion durchführen können, ohne Links oder Browser zu wechseln. Diese Funktion wird durch den „Agentenhandelsvertrag“ entwickelt, der von OpenAI und Stripe gemeinsam entwickelt wurde, und unterstützt verschiedene Zahlungsweisen. Es wird auch auf mehrere Warenkörbe und internationale Märkte ausgebaut.

image.png

【AiBase Zusammenfassung:】

💡 ChatGPT bringt die Funktion „Sofortzahlung“ ein, sodass Bestellungen direkt im Chat-Fenster erfolgen können.

🔒 Der „Agentenhandelsvertrag“ sorgt für sichere, einfache und kompatible Zahlungsweisen.

🌐 In Zukunft wird es auf mehrere Warenkörbe und internationale Märkte ausgebaut, um die Nutzererfahrung zu verbessern.

4. OpenAI bereitet eine KI-Version von TikTok vor: Alle Videoinhalte der ganzen Welt werden von KI erstellt

OpenAI wird bald eine soziale Anwendung basierend auf dem Sora2-Modell veröffentlichen, genannt „KI-TikTok“. Alle Inhalte werden von KI generiert. Die Anwendung ist ähnlich wie TikTok, hat jedoch eine Videolänge von 10 Sekunden und unterstützt die Benutzeridentitätsprüfung sowie die Nutzung von Gesichtszügen. Darüber hinaus legt OpenAI großen Wert auf Sicherheit und Urheberrechte, um die Nutzererfahrung zu verbessern und Benutzerabwanderung zu verhindern.

image.png

【AiBase Zusammenfassung:】

🎥 Sora2-Modell generiert Videos mit einer Länge von 10 Sekunden, fokussiert sich auf kurze und prägnante Inhalte.

🔒 Benutzer können ihre Identität authentifizieren, und Sora2 kann ihr Bild für die Videoerstellung verwenden und anderen Benutzern erlauben, es zu markieren.

🛡️ OpenAI sendet Erinnerungen, um sicherzustellen, dass Benutzer bei der Nutzung ihrer Bilder informiert sind, und verarbeitet Urheberrechtsfragen.

5. Claude Code 2.0 überraschend aktualisiert: Checkpoint + VS Code-Plugin, Programmiergeschwindigkeit steigt um das Dreifache

Anthropic hat Updates für Claude Code v2.0 und Claude Sonnet4.5-Modelle veröffentlicht, die die Autonomie und Integration von KI in der Programmierung deutlich verbesserten. Claude Code bietet Entwicklern durch Mechanismen wie Checkpoints, Optimierungen des Endgeräts und der IDE sowie API-Erweiterungen eine effizientere Programmiererfahrung.

image.png

【AiBase Zusammenfassung:】

✅ Claude Code v2.0 führt die Checkpoint-Funktion ein, damit die KI den Zustand automatisch speichern und zurücksetzen kann, um die Sicherheit der Entwicklung zu erhöhen.

🔧 Der VS Code-native Erweiterung befindet sich in der Beta-Testphase und bietet Inline-Differenzvorschau und grafische Interaktion, um die Zusammenarbeitseffizienz zu steigern.

📈 Das Sonnet4.5-Modell erreichte bei den OSWorld-Benchmark-Tests einen Punktestand von 61,4 und zeigte hervorragende Leistungen, insbesondere beim Aufbau komplexer Agentensysteme.

6. Baidu Maps aktualisiert Xiaodu Think 2.0: Intelligentes Reiseassistenten vollständig weiterentwickelt

Baidu Maps hat im siebten Weltenergiefahrzeugkonferenz Xiaodu Think 2.0 vorgestellt. Dieses Modell ist das erste im Branchenbereich, das eine tiefgreifende End-to-End-Sprachsprach-Größemodelle integriert und bietet den Nutzern intelligenter und personalisierteren Reiseservice. Seine Kernvorteile umfassen: Einführung der Karten-Reise-Wissensdatenbank und Echtzeit-Suchdaten zur Verbesserung der Verständnisfähigkeit für komplexe Reiseabsichten; Aufbau einer kreuzgeräte-Memory-Unit zur nahtlosen Verknüpfung zwischen verschiedenen Geräten; sowie Fähigkeit zur sofortigen, kurzfristigen und langfristigen Erinnerung, um personalisierte Empfehlungen anzubieten.

image.png

【AiBase Zusammenfassung:】

🚗 Baidu Maps integriert die Karten-Reise-Wissensdatenbank und Echtzeit-Suchdaten, um das Verständnis und die Schlussfolgerungsfähigkeit für komplexe Reiseabsichten zu verbessern.

📱 Kreuzgeräte-Memory-Unit ermöglicht nahtlose Verknüpfung zwischen Mobiltelefonen, Fahrzeuggeräten usw., um die Nutzererfahrung zu verbessern.

🧠 Das intelligente Assistenten verfügt über Fähigkeiten der sofortigen, kurzfristigen und langfristigen Erinnerung, um personalisierte Empfehlungen anzubieten.

7. Ant Group open-sourcet das weltweit erste Trillion-Parameter-Modell Ring-1T-preview

Das von Ant Group veröffentlichte Ring-1T-preview ist das weltweit erste offene Quellcode-Modell mit Trillion-Parametern für Inferenz. Es zeigte in verschiedenen Tests hervorragende Leistungen, übertraf mehrere bekannte offene Quellcode-Modelle und nähert sich GPT-5. Das Modell zeigt starke Fähigkeiten in der natürlichen Sprachinferenz und Codegenerierung, und das Team arbeitet an weiteren Trainings, um sein Potenzial voll auszuschöpfen.

image.png

【AiBase Zusammenfassung:】

🌟 Das weltweit erste offene Quellcode-Modell mit Trillion-Parametern für Inferenz, Ring-1T-preview, wird veröffentlicht.

🚀 In den AIME25- und CodeForces-Tests zeigte es hervorragende Leistungen und nähert sich dem Niveau von GPT-5.

🧠 Das Team arbeitet an nachtrainierten Modellen, um die Fähigkeit zur natürlichen Sprachinferenz zu verbessern.

8. DeepMind stellt „Frame Chain“-Konzept vor: Video-Modelle könnten vollständige visuelle Verständnis erreichen

Das von DeepMind vorgestellte „Frame Chain“ (CoF)-Konzept brachte eine wegweisende Fortschritt in der Video-Generierungstechnologie. Diese Technologie ermöglicht es Video-Modellen, in Zeit und Raum zu inferieren und zeigt ähnliche allgemeine Fähigkeiten wie Sprachmodelle. Das Veo3-Modell zeigte in verschiedenen visuellen Aufgaben hervorragende Leistungen und zeigte starke Wahrnehmungs-, Modellierungs- und Steuerungsfähigkeiten.

image.png

【AiBase Zusammenfassung:】

🎥 Frame Chain-Technologie ermöglicht es Video-Modellen, über Zeit und Raum zu inferieren und die Intelligenz der Video-Generierung zu verbessern.

🧠 Veo3-Modell zeigt starke allgemeine visuelle Fähigkeiten und kann verschiedene nicht trainierte Aufgaben bewältigen.

🚀 DeepMind prognostiziert, dass zukünftige allgemeine Video-Modelle möglicherweise spezialisierte Modelle ersetzen und eine neue Ära der Maschinenvisuell fördern.

Weitere Informationen: https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf