Willkommen bei der Rubrik „AI Daily“! Dies ist Ihr tägliches Leitfaden für die Exploration der Welt der künstlichen Intelligenz. Jeden Tag präsentieren wir Ihnen aktuelle Themen aus dem Bereich der KI, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu verstehen und innovative Anwendungen von KI-Produkten kennenzulernen.

Frische KI-Produkte klicken Sie hier für mehr Informationen:https://top.aibase.com/

1. Kunlun Wanzhi veröffentlicht offiziell das SkyReels-A3-Modell: Fotos können mit Sprache synchronisiert werden

Das SkyReels-A3-Modell der Kunlun Wanzhi Gruppe basiert auf dem DiT-Video-Verbreitungsmodell und ermöglicht die Erstellung von digitalen Menschen, die durch Audio gesteuert werden. Das Modell kann Personen in statischen Bildern oder Videos dazu bringen, laut Sprechtext zu sprechen oder zu singen und unterstützt auch die Änderung von Dialogen sowie die Steuerung der Kameraführung, was effiziente und bequeme KI-Technologielösungen für Werbung, Live-Verkäufe und Musik-MVs bietet.

image.png

【AiBase Zusammenfassung:】

📷 SkyReels-A3 kann Personen in statischen Bildern oder Videos dynamisch darstellen, basierend auf dem Sprechtext.

🎥 Es unterstützt die Ausgabe von Videos mit bis zu 60 Sekunden Länge pro Szene und unbegrenzte Längen bei mehreren Szenen, um verschiedene kreative Anforderungen zu erfüllen.

🔄 Es bietet acht voreingestellte Kameraführungseinstellungen, deren Stärke anpassbar ist, um professionelle Kameraführungseffekte zu erzielen.

Weitere Informationen: https://skyworkai.github.io/skyreels-a3.github.io/

2. xAI, ein Unternehmen von Elon Musk, gibt das Grok 4 KI-Modell dauerhaft kostenlos frei

xAI gab bekannt, dass das Grok4 KI-Modell dauerhaft kostenlos für globale Nutzer verfügbar sein wird und fortschrittliche KI-Tools bereitstellt.

image.png

【AiBase Zusammenfassung:】

🤖 Das Grok4 KI-Modell wird weltweit kostenlos für alle Nutzer zur Verfügung stehen.

⚙️ Es bietet Auto-Modus und Experten-Modus, um verschiedenen Nutzern zu entsprechen.

🌐 Die kostenlose Freigabe könnte die Verbreitung und Anwendung von KI-Technologie fördern.

3. Open AI veröffentlicht eine wichtige GPT-5 Prompt-Guide: Erschließung neuer Dimensionen in der KI-Programmierung und Multimodalität

Der Artikel beschreibt detailliert das von Open AI veröffentlichte GPT-5-Modell und den offiziellen Prompt-Guide. Der Guide betont die Verbesserungen des Modells bei komplexen Aufgaben, Programmierung und multimodaler Interaktion. Er bietet Optimierungsstrategien wie die Anpassung der Inferenzkraft, die Kontrolle der Agentenverhaltensneigung sowie die Nutzung von Werkzeugen, um den Nutzern zu helfen, das volle Potenzial von GPT-5 zu nutzen.

image.png

【AiBase Zusammenfassung:】

🧠 GPT-5 verbessert die Leistung bei Agentenaufgaben, Code-Generierung und Befehlsbefolgung durch präzise Prompt-Design.

💻 Es unterstützt die Generierung von Frontend-Oberflächen, das Debuggen großer Code-Bibliotheken und die Verbesserung der Code-Generierungseffizienz mit Responses API.

🖼️ Es führt multimodale Interaktionsfunktionen ein, einschließlich Text-, Bild- und Sprachverarbeitung sowie individueller Einstellungen, um die Praxistauglichkeit zu erhöhen.

Weitere Informationen: https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide

4. Baidu Search bringt AI-Suche auf der PC-Version offiziell online

Baidu Search hat eine Reihe von KI-Funktionen auf der PC-Version offiziell eingeführt und verwandelte den traditionellen Informationskanal in einen Aufgaben-Zentrum. Neue Module wie „Super Intelligent Double Line Box“ und „Workbench“ integrieren KI-Lesetools, KI-Schreibwerkzeuge und KI-PPT-Werkzeuge und steigern die Sucheffizienz und Büroerfahrung der Nutzer. Darüber hinaus hat die monatliche aktive Nutzerzahl von Baidu AI Search bereits über 322 Millionen erreicht und bleibt der führende Anbieter im nationalen KI-Suchmarkt.

image.png

【AiBase Zusammenfassung:】

🧠 Baidu Search hat auf der PC-Version KI-Funktionen offiziell eingeführt und die Benutzererfahrung verbessert.

🛠️ Das neue „Workbench“-Modul integriert KI-Lesetools, Schreibwerkzeuge und PPT-Werkzeuge.

📈 Die monatlich aktiven Nutzerzahlen haben 322 Millionen erreicht, wodurch Baidu die führende Position im nationalen KI-Suchmarkt sichert.

5. Windows 11 Copilot-App greift kostenlos auf GPT-5 zu, mit weniger Einschränkungen als ChatGPT

Microsoft kündigte an, dass die Copilot-App in Windows 11 und Windows 10 nun vollständig GPT-5-Intelligenzmodus unterstützt. Diese Funktion wird durch Web-Route-Technologie realisiert, sodass Benutzer den Intelligenzmodus ohne Aktualisierung aktivieren können, und die Nutzungseinschränkungen sind strenger als bei ChatGPT.

image.png

【AiBase Zusammenfassung:】

🌟 Copilot unterstützt nun den GPT-5-Intelligenzmodus und bietet eine flüssigere Benutzererfahrung.

💬 Im Vergleich zu ChatGPT sind die Nutzungseinschränkungen von Copilot lockerer und bieten mehr Freiheit.

🖥️ Benutzer können Copilot und GPT-5 einfach über einen Schritt kostenlos zugreifen und Informationen bequem erhalten.

6. Übertrifft OpenAI! Baichuan Intelligence öffnet seinen medizinischen Großmodell Baichuan-M2 global

Das von Baichuan Intelligence veröffentlichte Open-Source-Medizin-Verstärkungsmodell Baichuan-M2 erreichte in der HealthBench-Bewertung 60,1 Punkte und übertraf das Modell gpt-oss120b von OpenAI und war international führend gegenüber anderen Open-Source-Größmodellen. Das Modell wurde extrem leichtgewichtig verarbeitet und kann auf einer einzigen Karte eingesetzt werden, was die Kosten für medizinische Einrichtungen deutlich senkt. Darüber hinaus ist die Fähigkeit des Baichuan-M2, komplexe medizinische Probleme zu lösen, mit GPT-5 vergleichbar und zeigt großes Anwendungspotenzial.

image.png

【AiBase Zusammenfassung:】

🌟 Baichuan-M2 erreichte in der HealthBench-Bewertung 60,1 Punkte und ist das führende Open-Source-Medizin-Modell weltweit.

💡 Das Modell wurde leichtgewichtig verarbeitet und kann auf einer einzelnen Karte eingesetzt werden, was die Kosten für medizinische Einrichtungen erheblich senkt.

🚀 Baichuan-M2 hat die Fähigkeit, komplexe medizinische Probleme zu lösen, mit GPT-5 vergleichbar und hat großes Anwendungspotenzial.

Weitere Informationen: https://huggingface.co/baichuan-inc/Baichuan-M2-32B

7. Apple kündigt an: GPT5 wird in iOS 26 integriert: iOS 26 wird ChatGPT5 integrieren

Apple kündigte an, dass das ChatGPT-5-Modell in das kommende iOS 26-System integriert wird, was die Leistung von Apple Intelligence erheblich verbessern und eine Reihe neuer Funktionen wie Echtzeitübersetzung und Optimierung der Inhaltsuche bringen wird. Benutzer können diese Funktionen ohne OpenAI-Konto verwenden, aber mit verbundenem Konto können sie mehr Vorteile genießen.

image.png

【AiBase Zusammenfassung:】

🧠 ChatGPT-5 wird in iOS 26 integriert und verbessert die Leistung von Apple Intelligence.

🌐 Neue Funktionen wie Echtzeitübersetzung verbessern das internationale Kommunikations-Erlebnis.

💰 Mit einem verbundenen OpenAI-Konto können Sie Rabatte bei Abonnements genießen und mehr Optionen wählen.

8. Google veröffentlicht BlenderFusion: Ein neues Framework für 3D-Visual Editing und Generative Synthese

Google veröffentlichte BlenderFusion, ein innovatives Framework, das die Fähigkeiten für 3D-Visual Editing und Generative Synthesis verbessert und Kreativen und Designern intuitive und effiziente Werkzeuge zur Verfügung stellt.

image.png

【AiBase Zusammenfassung:】

🎨 BlenderFusion integriert fortgeschrittene 3D-Editierwerkzeuge und Diffusionsmodelle und ermöglicht effizientes 3D-Visual Editing und Generative Synthesis.

🛠️ Der Workflow des Frameworks besteht aus drei Phasen: Hierarchie, Bearbeitung und Synthese, wodurch Benutzer 3D-Objekte leicht bearbeiten und endgültige Bilder generieren können.

📈 Google's BlenderFusion optimiert Modelle und verbessert die Fähigkeit, komplexe Szenen zu verarbeiten, und unterstützt Kreative dabei, ihre Ideen umzusetzen.

Weitere Informationen: https://blenderfusion.github.io/

9. Kitten TTS: Sehr kleines TTS-Modell mit nur 15 Millionen Parametern

Kitten TTS ist ein Open-Source-Modell für Text-to-Speech mit nur 15 Millionen Parametern und einem Volumen unter 25 MB, das für die Installation auf verschiedenen Geräten geeignet ist. Es unterstützt die Ausführung ohne GPU und kann auf gewöhnlichen CPUs hochwertige Sprachsynthese leisten und bietet einfache Installations- und Verwendungshandbücher, damit Benutzer schnell loslegen können.

image.png

【AiBase Zusammenfassung:】

🐱 Kitten TTS ist ein Open-Source-Text-zu-Sprache-Modell mit einem Volumen unter 25 MB, das für verschiedene Geräte geeignet ist.

⚡ Das Modell unterstützt die Ausführung ohne GPU und ermöglicht hochwertige Sprachsynthese auf gewöhnlichen CPUs.

🚀 Kitten TTS bietet einfache Installations- und Verwendungshandbücher, damit Benutzer schnell Audios erstellen können.

Weitere Informationen: https://huggingface.co/KittenML/kitten-tts-nano-0.1

10. MiniCPM-V 4.0, eine visuelle Modell, mobile Anwendung ist flüssiger

MiniCPM-V4.0 ist die neueste Version der MiniCPM-V-Reihe und zeigt hervorragende Leistungen in der visuellen Verständnis, der Verarbeitung von mehreren Bildern und Videos und erreichte in der OpenCompass-Bewertung 69,0 Punkte, wodurch es mehrere ähnliche Modelle übertraf. Es wurde speziell für mobile Geräte entworfen, hat schnelle Reaktionszeiten und keine Überhitzungsprobleme und bietet verschiedene Verwendungsmöglichkeiten und Open-Source-Tools, um den Benutzern den Einstieg zu erleichtern.

image.png

【AiBase Zusammenfassung:】

🌟 MiniCPM-V4.0 erreichte in der OpenCompass-Bewertung 69,0 Punkte und übertraf mehrere ähnliche Modelle.

📱 Das Modell wurde für mobile Geräte entworfen, hat schnelle Reaktionszeiten und keine Überhitzungsprobleme.

📚 Open-Source-iOS-Anwendung und detaillierte Anleitung zur Nutzung, wodurch Benutzer leichter starten können.

Weitere Informationen: https://huggingface.co/openbmb/MiniCPM-V-4

11. Stripe-Bericht: Die KI-Wirtschaft wächst rasant, die Umsatzsteigerung übertreffen SaaS um das Dreifache