Willkommen im AI-Tagesbericht! Hier finden Sie einen Leitfaden für Ihre tägliche Entdeckung der Welt des künstlichen Intellekts. Wir präsentieren Ihnen täglich die heißesten Themen aus dem Bereich der KI und konzentrieren uns dabei auf Entwickler, damit Sie Trends erkennen und innovative Anwendungen der KI kennenlernen können.

Frische KI-Produkte erfahren Sie hier: https://top.aibase.com/

1. DeepSeek R1-0528 erschütternd veröffentlicht: kostenlos mit 128K Kontext, Leistung nahe bei OpenAI o3!

Die Version DeepSeek R1-0528 wurde veröffentlicht und unterstützt einen kontextuellen Umfang von 128K. Die Inferenz- und Codegenerierungsfähigkeiten wurden erheblich verbessert und bleiben kostenlos nutzbar.

image.png

[AiBase Zusammenfassung:]

🌟 Unterstützung für 128K extrem großen Kontexts, signifikante Verbesserung der Präzision im Textrückruf, ideal für komplexe Aufgaben.

💻 Optimierte Codegenerierungs- und Schreibfähigkeiten, schnelle und genaue Generierung, vergleichbar mit Topmodellen.

💰 Freie Nutzung senkt die Benutzerschwelle und stellt traditionelle KI-Geschäftsmodelle in Frage.

Details: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

2. ByteDance veröffentlicht den Bild-Agent "Xiaoyunque AI", ein Werkzeug für schnelles Erstellen von Videos und Bildern

ByteDance hat den neuen Bild-Agenten 'Xiaoyunque AI' vorgestellt, eine intelligente Kreativitätstool, die durch einfache Befehle hochwertige Videos und Bilder erstellt und die technische Schwelle für die Inhaltserstellung senkt.

image.png

[AiBase Zusammenfassung:]

🌟 Benutzer müssen nur einen einfachen Befehl eingeben, dann denkt "Xiaoyunque AI" nach und generiert erfolgreiche Videos und Bilder, um "Inspiration zum Resultat zu bringen".

📚 Basierend auf ByteDances eigener "Yunque"-Großmodell, das tiefe Lernen und multimodale Technologien integriert, bietet es starke Bildgenerierungs- und Videobearbeitungsfähigkeiten.

📱 Derzeit verfügbar für Android-Clients, iOS-Version erwartet sich für Juni, was die Entwicklung von AI-Kreationen in weiterführende Anwendungsszenarien vorantreiben könnte.

3. Neue Version von Keling 2.1 veröffentlicht: Preis um 65% gesenkt, Leistung deutlich gesteigert

Keling 2.1 ist offiziell online gegangen, der Preis ist um 65% gesunken, was die Wirtschaftlichkeit deutlich erhöht. Drei neue Qualitätsmodelle wurden hinzugefügt, um unterschiedliche Benutzerbedürfnisse zu erfüllen. Das Erstellergebnis ist besser als in der Vorgängerversion, die Geschwindigkeit ist schneller und eignet sich für Kurzfilme und Werbung.

image.png

[AiBase Zusammenfassung:]

🌟 Der Preis von Keling 2.1 ist um 65% gesunken, was die Wirtschaftlichkeit deutlich erhöht.

⚡ Drei Modelle: Standardversion, Hochqualitätsversion und Meisterversion, um verschiedene Benutzerbedürfnisse zu decken.

📈 Erstellergebnisse sind besser als in der Vorgängerversion, Geschwindigkeit ist schneller, eignet sich für Kurzfilme und Werbung.

4. Opera Neon veröffentlicht, das erste Agentenbrowser der Welt, führt intelligentes Chatting und automatisierte Aufgaben in die Web4.0-Era

Opera Neon ist das weltweit erste Agentenbrowser, der durch künstliche Intelligenz unterstützte intelligente Chatting, Aufgabenautomatisierung und Inhaltskreation neu definiert, wie wir das Internet erleben.

image.png

[AiBase Zusammenfassung:]

🌐 Opera Neon ist das weltweit erste "vollständig agentenbasierte" Browser, das Suchaufgaben, Formulardatenausfüllung, Einkäufe usw. automatisch ausführt, um Benutzerleistungen zu steigern.

💬 Die integrierte AI-Hilfe "Neon Chat" unterstützt mehrere Sprachen und kann Informationen aus Websites extrahieren und passende Antworten in Kontext liefern, was die Interaktion natürlicher macht.

💻 "Neon Make" generiert Spiele, Websites usw. durch einfache Befehle und bietet eine ganzheitliche Erfahrung von Idee bis Produkt, um Kreativität freizusetzen.

Details: https://www.operaneon.com/

5. Meta veröffentlicht Multi-SpatialMLLM: Revolution in der räumlichen Verständigung multipler AI-Modellarten

Meta und die Chinese University of Hong Kong haben das Multi-SpatialMLLM-Modell veröffentlicht, das durch die Integration von Tiefer Perception, visuellem Matching und dynamischer Perception drei Komponenten verbessert die räumliche Verständigungsmacht von multimodalen großen Sprachmodellen, wobei es bei verschiedenen Benchmarktests herausragende Ergebnisse zeigt.

image.png

[AiBase Zusammenfassung:]

🌟 Das Multi-SpatialMLLM-Modell überwindet durch drei Komponenten die Grenzen der einzelbildigen Analyse und verbessert die räumliche Verständigung.

📊 Das neue Modell verwendet das MultiSPA-Dataset und fünf Aufgaben zur Ausbildung und steigert erheblich die räumliche räumliche Schlussfolgerungsfähigkeit.

🏆 Bei verschiedenen Benchmarktests zeigt Multi-SpatialMLLM signifikant bessere Genauigkeiten als traditionelle Modelle.

6. Tongyi Lab und Peking University veröffentlichen neue Technologie ZeroSearch: Aktiviert die Recherchefähigkeit von LLMs, Kosten senken um 88%

ZeroSearch ist ein innovatives Framework, das durch die Simulation eines Suchmaschinen den Recherchekapazitäten von großen Sprachmodellen aktiviert und die Trainingskosten um 88% senkt, wobei die Klarheit der Inferenz und die Effizienz der Antwortextraktion verbessert werden.

image.png

[AiBase Zusammenfassung:]

✨ ZeroSearch generiert Recherchedokumente durch große Sprachmodelle, ohne echte Suchen, was Kosten und Rauschen signifikant senkt.

🔍 Das Framework verwendet strukturierte Trainingsmuster und "Simulationsfineuning", um die Qualität der generierten Dokumente und die Generalisierungsfähigkeit des Modells zu verbessern.

🚀 Experimente zeigen, dass ZeroSearch besser als traditionelle Methoden ist, insbesondere bei großen Modellen, was die Entwicklung intelligenter Recherchetechnologien vorantreibt.

Details: https://arxiv.org/pdf/2505.04588

7. ByteDance startet neue AI-Videoredaktionsanwendung "Jian Xiaoying", um Leben zu dokumentieren

ByteDance hat die neue App "Jian Xiaoying" für AI-gestützte Videoredaktion vorgestellt, um den Einstieg in die Kreativität zu erleichtern und Benutzer zu ermöglichen, qualitativ hochwertige Videos zu erstellen.

image.png

[AiBase Zusammenfassung:]

🎥 ByteDance startet die App "Jian Xiaoying", um Benutzer beim Erstellen qualitativ hochwertiger Videos zu unterstützen.

🤖 Die App integriert AI-Technologien, um die Schwelle für Videokreation zu senken und Benutzer zum Teilen ihres Lebens zu ermutigen.

💡 Der "Douyin" Modell von Huoshan-Engine bietet der App starke Unterstützung, um die Videoverarbeitungseffizienz zu steigern.

8. MotionPro ist in der Branche angekommen! AI-basierte Videogenerierung revolutioniert, 40 ms pro Frame präzise Steuerung, Film- und Spielindustrie steht vor einer Änderung

MotionPro ist ein Präzisionsmotorsteuerungssystem speziell für Bild-zu-Videogeneration, das durch Regionenpfade und Bewegungsmasken Technologien feine Kontrolle bietet, um Flexibilität und Präzision in der Videogenerierung zu erreichen.

image.png

[AiBase Zusammenfassung:]

✨ MotionPro löst durch Regionenpfade und Bewegungsmasken Technologien das Problem grober Bewegungssteuerung in traditionellen I2V-Generierungen, um natürlichere und feinere Effekte zu erreichen.

🎥 Gleichzeitige Kontrolle von Objekt- und Kamerabewegungen, keine speziellen Datensätze erforderlich, Unterstützung komplexer Kamerapfade und Objektbewegungen.

🌐 Ökosystem der Open-Source-Community unterstützt, optimierte Trainingsframeworks und Datenbauprogramme, um Entwicklern den schnellen Einstieg zu ermöglichen und den Branchenfortschritt zu fördern.

Details: https://huggingface.co/papers/2505.20287

9. Musk's xAI schließt 300 Millionen US-Dollar Deal mit Telegram ab, um den AI-Chatbot Grok AI zu starten

Telegram und xAI haben zusammengearbeitet, wobei xAI 300 Millionen US-Dollar investierte, um den AI-Chatbot Grok AI zu deployen, um das Benutzererlebnis von Telegram zu verbessern und Einnahmen zu steigern.

image.png

[AiBase Zusammenfassung:]

Telegram und xAI haben zusammengearbeitet, wobei xAI 300 Millionen US-Dollar investierte, um Grok AI zu deployen.

Grok AI wird das Kommunikationserlebnis von Telegram-Benutzern verbessern und intelligente Chatdienste bereitstellen.

Die Partnerschaft diversifiziert Telegrams Einnahmequellen und beschleunigt den Prozess der sozialen Medienintelligenz.

10. OpenAI-CFO enthüllt: Neustrukturierung der Architektur öffnet Tür für mögliche Börsennotierung

OpenAI führt eine Organisationsumstrukturierung durch, um für eine Börsennotierung vorzubereiten, aber der Zeitpunkt hängt vom Marktablauf ab. Microsoft hat über 13 Milliarden US-Dollar investiert, und OpenAI transformiert sich in eine gemeinnützige Gesellschaft, um die Rendite an die Aktionäre und die soziale Verantwortung zu balancieren.

image.png

[AiBase Zusammenfassung:]

🌟 OpenAI strukturiert seine Architektur neu, um für zukünftige Börsennotierungen vorzubereiten, aber die Notierung hängt vom Marktablauf ab.

💰 Microsoft hat über 13 Milliarden US-Dollar investiert, OpenAI transformiert sich in eine gemeinnützige Gesellschaft, um die Rendite an die Aktionäre und die soziale Verantwortung zu berücksichtigen.

📈 Stabilität ist entscheidend, die Notierung hängt von einer vollständigen Vorbereitung der Firma und einem geeigneten Marktwindows ab.

11. Pixel Cake's "Fangtang Großmodell" erfolgreich genehmigt, wird der erste registrierte Bildgroßmodell im Bildungssektor

Das selbstentwickelte "Fangtang Großmodell" von Pixel Cake wurde vom Nationalen Büro für Cybersicherheit genehmigt, was das erste registrierte Anwendungsgrad-Bildgroßmodell im Bildungssektor darstellt. Dies markiert einen technologischen Durchbruch und die Konformität mit der Regulierung, was die Entwicklung in den Bereichen Werbung und Film vorantreiben wird.

image.png

[AiBase Zusammenfassung:]

🌟 Das Fangtang Großmodell wurde erfolgreich vom Nationalen Büro für Cybersicherheit registriert, das erste registrierte Anwendungsgrad-Bildgroßmodell im Bildungssektor.

🚀 Die Selbstentwicklung unterstreicht die technologische Leistungsfähigkeit und Innovationsfähigkeit von Pixel Cake im Bereich AI, was die Entwicklung von Bildgenerierungstechnologien vorantreibt.