Willkommen in der Kolumne 【AI-Tageszeitung】! Hier ist dein Wegweiser, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Wir präsentieren dir täglich die wichtigsten Inhalte aus dem AI-Bereich und konzentrieren uns auf Entwickler, damit du Trends verstehst, innovative AI-Anwendungen kennenlernst.

Frische AI-Produkte erfahren Sie hier: https://top.aibase.com/

1. Tongyi Qwen 3 große Modelle weltweit sensationell: Download-Zahlen über 12,5 Millionen, abgeleitete Modelle über 130.000+

Nach einem Monat nach dem Open-Source-Start des Tongyi Qwen 3 großen Modells hat es weltweit mehr als 12,5 Millionen Downloads erreicht. Es zeigt herausragende Performance auf mehreren führenden AI-Open-Plattformen, insbesondere mit über 130.000 abgeleiteten Modellen auf Hugging Face, was es zur Nummer eins weltweit macht.

image.png

[AiBase Zusammenfassung:]

🚀 Nach nur einem Monat weltweites Gesamtdownloads von über 12,5 Millionen, zeigt es starke Attraktivität.

🌐 Unterstützung für verschiedene Versionen, jede Version hat über eine Million Downloads, deckt breite Bedürfnisse ab.

🌟 Anzahl der abgeleiteten Modelle über 130.000, führt auf Hugging Face weltweit an erster Stelle, zeigt hohe Innovationsfreudigkeit.

2. Jiemo Bilder 3.0 intelligente Referenz-Funktion online!

Der KI-Erstellungs-Plattform JiemoAI von ByteDance wurde die intelligente Referenz-Funktion eingeführt, was die Designbarriere drastisch reduziert und normale Benutzer in der Lage macht, professionelle Poster einfach zu erstellen.

image.png

[AiBase Zusammenfassung:]

✨ Starke chinesische Sprachverständlichkeit, filmartige Generierungseffekte, umbricht traditionelle Designprozesse.

🌟 Unterstützt einfaches Generieren von Designwerken in bestimmten Stilen, abdeckt verschiedene Szenarien.

💯 Präzise Detailsretention, geringe Kosten, hohe Effizienz, eignet sich für Benutzer aller Ebenen, um ihre Kreativität schnell umzusetzen.

3. ZhipuAI veröffentlicht offiziell den Enterprise Super-Helfer Agent CoCo

Heute hat ZhipuAI seinen Unternehmens-Super-Helfer Agent CoCo veröffentlicht, dessen Kernkonzept "Versteht dich und das Unternehmen, kann arbeiten und liefern" ist, um die Produktivität der Unternehmen zu steigern.

image.png

[AiBase Zusammenfassung:]

🌟 CoCo ist Ergebnisorientiert und unterstützt die gesamte Arbeitsabläufe, um die maximalen Ergebnisse der Aufgaben zu gewährleisten.

💼 Führt ein einzigartiges Gedächtnismodell ein, bietet individuelle Dienstleistungen und verfolgt branchenspezifische Dynamiken aktiv.

🔗 Kann nahtlos in bestehende Systeme integriert werden, verbindet vorhandene Ressourcen und erstellt einen individuellen intelligenten Assistenten.

Weiterführende Informationen: https://aiworker.aminer.cn/ai_worker/verification?utm_source=zhipuai_social&utm_medium=wechat&utm_campaign=p250609

4. Baidu veröffentlicht Finanzbranchen-Großmodell, intelligente Einheiten werden neuer Wettbewerbsfokus

In der Konferenz über intelligente Wirtschaft im Jahr 2025 hat Baidu Cloud seinen Finanzbranchen-Großmodell Qianfan Huijin vorgestellt, um effizientere AI-Lösungen für die Finanzbranche bereitzustellen. Shen Dou betonte die Bedeutung der Branchen-Großmodelle und demonstrierte BaiDus innovative Ergebnisse in Bezug auf intelligente Einheiten.

image.png

[AiBase Zusammenfassung:]

📊 Baidu Cloud veröffentlicht Qianfan Huijin, spezialisiert auf Finanzgebiete, um Branchenanforderungen an Präzision und Aktualität zu erfüllen.

💼 Baidu hat bereits mit 65% der zentralen Staatsunternehmen zusammengearbeitet, was zeigt, dass seine Technologie stark auf dem Markt akzeptiert wird.

🤖 Intelligente Einheiten sind der neue Wettbewerbsfokus, Baidu hilft durch leichte Anpassung der Unternehmens-Digitalisierung.

5. Xiaohongshu veröffentlicht erstes Open-Source-Großmodell dots.llm1: 11,2 Billionen nicht-synthesierte Daten verbessern Chinesisch-Leistung

Xiaohongshu hat sein erstes großes Open-Source-Modell dots.llm1 veröffentlicht, das ein Experten-Mischungsmodell mit 1420 Milliarden Parametern hat und auf 11,2 Billionen hochwertigen nicht-synthetisierten Daten trainiert wurde, wobei es bei chinesischen Tests hervorragend abschneidet.

image.png

[AiBase Zusammenfassung:]

🌟 dots.llm1 verwendet ein Experten-Mischungsmodell mit 1420 Milliarden Parametern, um Trainings- und Inferenzkosten signifikant zu senken.

📊 Verwendet 11,2 Billionen nicht-synthetische Daten, Mittelwert der chinesischen Tests 91,3, übertreffen viele Wettbewerber.

🔍 Integrierte strenge Datenbearbeitungs-Pipelines, um die Qualität und Zuverlässigkeit der Trainingsdaten sicherzustellen.

Weiterführende Informationen: https://huggingface.co/rednote-hilab/dots.llm1.base/tree/main

6. Mechanische Arme können auch „große Modelle nutzen“! Hugging Face LeRobot massiv Open Source, AI-Roboterentwicklungsschwelle drastisch gesenkt!

Hugging Face hat mit LeRobot ein Projekt vorgestellt, das durch die Integration fortschrittlicher Algorithmen und Entwicklungstools einen effizienten, benutzerfreundlichen Roboter-AI-Entwicklungsumgebung bietet und die Hardware-Anpassungskosten und technische Schwelle drastisch senkt.

image.png

[AiBase Zusammenfassung:]

Einheitliche Schnittstellen für mehrere Hardwaretypen, senkt die Kosten der Hardwareanpassung für Entwickler.

Integrierte große Mengen an vortrainierten Modellen, um schnell aktuelle Roboter-Kontrollmodelle zu laden.

Intelligente Bewertung und effiziente Trainingsfunktionen beschleunigen den Entwicklungsprozess und erhöhen die Wiederverwendbarkeit der Modelle.

Weiterführende Informationen: https://github.com/huggingface/lerobot

7. ChatGPT-Stimme aktualisiert: natürlichere Sprachausdrucksfähigkeit und neue Funktion zur realzeit Übersetzung

OpenAI hat die Stimmfunktion von ChatGPT komplett aktualisiert, einschließlich natürlicher Sprachausdrucksfähigkeit und der neuen Funktion zur realzeit Übersetzung, aber es gibt Probleme mit der Tonqualität und dem Auftreten von "Halluzinationen".

image.png

[AiBase Zusammenfassung:]

🌟 Natürlichere Sprachausdrucksfähigkeit, reichhaltiger Emotionenausdruck.

🌍 Neue Funktion zur realzeit Übersetzung, unterstützt Mehrsprachengespräche.

⚠️ Probleme mit der Tonqualität und auftretenden seltsamen Tönen.

8. Google Gemini-Anwendung hat bei Android-Downloads ChatGPT übertroffen, aber Benutzeraktivität bleibt unzureichend

Schon seit April 2025 hat die Google-Anwendung Gemini weltweit bei Android-Downloads ChatGPT übertroffen, mit einer wöchentlichen Installation von über 6 Millionen, aber die Benutzeraktivität beträgt nur 4,9%, weit unterhalb von ChatGPTs 42,52%. Trotz des deutlichen Anstiegs der Downloads muss Gemini den täglichen Einsatz seiner Nutzer steigern.

image.png

[AiBase Zusammenfassung:]

🌟 Gemini-Anwendung hat wöchentliche Downloads von über 6 Millionen erreicht, übertroffen ChatGPT.

📉 ChatGPTs Downloads sanken auf weniger als 3 Millionen pro Woche, aber die Benutzeraktivität liegt noch immer bei 42,52%.

🔄 Gemini muss die tägliche Benutzeraktivität steigern, um langfristig im Markt konkurrenzfähig zu bleiben.

9. MonkeyOCR erscheint mit 3B-Little-Modell: 3B kleiner Modell schlägt Gemini

Als leichtgewichtiges Dokumentenanalysemuster zeigt MonkeyOCR in der englischsprachigen Dokumentenanalyse hervorragende Performance, besonders bei Formeln und Tabellenanalysen. Es ist nicht nur schnell, sondern verwendet auch das innovative Dreier-Triple-Paradigma "Struktur-Erkennung-Beziehung", was der Branche neue Technikrichtungen bietet.

image.png

[AiBase Zusammenfassung:]

Affen 🐒 MonkeyOCR schlägt mit 3B Parametern Gemini2.5Pro und Qwen2.5-VL-72B bei vielen Dokumentenanalyseaufgaben, besonders bei Formelauswertungen um 15,0%.

Blitz ⚡ MonkeyOCR hat eine Analysegeschwindigkeit von 0,84 Seiten/s, wesentlich schneller als MinerU und Qwen2.5-VL-7B, eignet sich für Unternehmensanwendungen mit schnellen Reaktionen.

Rädchen 🔧 Sein Dreier-Triple-Paradigma verbessert die Analysetreue und senkt gleichzeitig Ressourcenbedarf, um flexibles AI-Analyseangebot für Unternehmen zu bieten.

Weiterführende Informationen: https://arxiv.org/abs/2506.05218

10. Google Veo 3 FAST/TURBO-Modus online! Fünffache Kosten-Nutzen-Relation, AI-Videogenerierung in der „Super-Geschwindigkeitszeit“!

Google hat mit Veo3 den neuen FAST/TURBO-Modus eingeführt, der die Videogenerierungskosten drastisch senkt und die Effizienz steigert. Außerdem unterstützt es Videos mit natürlicher Tonqualität, was für Inhaltsersteller weitere Möglichkeiten bietet.

image.png

[AiBase Zusammenfassung:]

FAST/TURBO-Modus bietet fünfmal so viel Kosten-Nutzen-Relation, senkt die Generierungskosten und eignet sich für häufige Videoproduktionen.

Unterstützt native Audiosynthese, um Soundtrack und Bild synchron zu machen, was die Einbettungserfahrung erheblich verbessert.

Während schnelle Generierung und hohe Qualitätsdetails gleichzeitig möglich sind, erfüllt es die Vielfalt von Anforderungen von Sozialmedien bis hin zu professionellen Gebieten.

11. Google AI Studio Richtlinienänderung: Zugang zu Gemini2.5Pro-Modellen für kostenlose Benutzer „begrenzt“

Google wird seine AI-Modellnutzungsrichtlinien ändern und den freien Zugang zu Gemini2.5Pro-Reihenmodellen stoppen, indem es auf ein System mit API-Schlüsseln umsteigt. Dennoch können kostenlose Benutzer weiterhin die Gemini2.0-Reihenmodelle verwenden, allerdings mit begrenzter Funktionalität.

image.png

[AiBase Zusammenfassung:]

💎 Google hat offiziell den freien Zugriff auf Gemini2.5Pro-Reihenmodelle gestoppt und auf ein API-Schlüsselsystem umgestellt.

🚀 Derzeit können kostenlose Benutzer noch die Gemini2.0-Reihenmodelle nutzen, aber deren Leistung ist nicht mit Gemini2.5Pro vergleichbar.

🌟 Entwickler müssen die Leistung und Kosten abwägen, und in Zukunft könnten hochwertige Modelle vollständig kommerziell verfügbar sein.