A Zeitung: Bilibili aktualisiert das Anime-Video-Generationsmodell AniSora V3; ByteDance öffnet die 4D-Video-Generations-Framework EX-4D; DeepSWE öffnet ein KI-Agentensystem und steigt stark auf

Willkommen bei der Rubrik „AI Daily“! Hier ist Ihre tägliche Leitlinie für die Erkundung der Welt der künstlichen Intelligenz. Jeden Tag präsentieren wir Ihnen die aktuellen Themen aus dem Bereich KI, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu verstehen und innovative Anwendungen von KI-Produkten kennenzulernen.

Frische KI-Produkte Klicken Sie hier, um mehr zu erfahren:https://top.aibase.com/

1. EX-4D von ByteDance revolutioniert mit Open Source: Einzelbildvideos in freie Perspektiven 4D-Filme

EX-4D ist ein 4D-Videogenerierungsrahmenwerk, das vom PICO-MR-Team von ByteDance entwickelt wurde. Es kann hochwertige, mehrseitige 4D-Videosequenzen aus Einzelbildvideos generieren. Diese Technologie löst die Herausforderungen der traditionellen Videogenerierungstechnik bei der Generierung mehrseitiger Videos mithilfe von tiefen verschlossenen Netzen (DW-Mesh) und einem leichten Anpassungsarchitekturmodell und übertrifft in den Leistungsindikatoren deutlich.

【AiBase-Zusammenfassung:】
💡 EX-4D nutzt tiefes verschlossenes Netz (DW-Mesh), um hochwertige Generierung von Einzelbildern in mehrseitige Bilder zu erreichen.
🔍 Durch Rendering-Masken und Tracking-Masken Strategien lösen sie das Problem des Mangels an mehrseitigen Daten.
🚀 In Indikatoren wie FID, FVD und VBench übertreffen sie bestehende Open-Source-Methoden deutlich und zeigen hervorragende Leistung.
Weitere Details: https://github.com/tau-yihouxiang/EX-4D

2. Bilibili veröffentlicht Open-Source-Modell AniSora V3, das eine Vielzahl von Stilen für Anime-Videos erzeugt

Bilibili hat eine große Aktualisierung seines Open-Source-Modells AniSora V3 angekündigt, die die Qualität der Generierung, die Bewegungsglättigkeit und die Stilvielfalt erheblich verbessert hat. Dieser Version basiert auf den Modellen CogVideoX-5B und Wan2.1-14B und kombiniert Verstärkungslernen mit menschlicher Rückmeldung (RLHF), um verschiedene Stile von Anime-Videos zu generieren und Kreativen stärkere Werkzeuge zu bieten.

【AiBase-Zusammenfassung:】
✨ AniSora V3 optimiert durch räumlich-zeitliche Maske Module die Kontrolle über Animation-Aufgaben.
🚀 Unterstützt mehrere Aufgaben, einschließlich der Generierung von Videos aus einzelnen Bildern, Schlüsselbild-Interpolation und Lippen-Synchronisation.
📦 Öffentliche Ökosysteme fördern die Zusammenarbeit der Community, Entwickler können Code und Datensätze über GitHub erhalten.
Weitere Details: https://t.co/I3HPKPvsBV

3. DeepSWE, ein Open-Source-AI-Agent-System, steigt stark auf, basierend auf Qwen3-32B

DeepSWE ist ein Open-Source-AI-Agent-System, das auf dem Qwen3-32B-Modell basiert. Es wird durch Verstärkungslernen trainiert und zeigt hervorragende Leistungen im SWE-Bench-Verified-Test. Das System verwendet das rLLM-Framework und verbesserte GRPO++-Algorithmen und zeigt starke Lernfähigkeit und Anwendungspotenzial in Softwareingeniuraufgaben.

【AiBase-Zusammenfassung:】
🧠 DeepSWE basiert auf dem Qwen3-32B-Modell und wurde vollständig durch Verstärkungslernen trainiert. Die Open-Source-Informationen wurden vollständig veröffentlicht.
🏆 Im SWE-Bench-Verified-Test zeigte DeepSWE hervorragende Leistungen, mit einer Pass@1-Genauigkeit von 59 %, was es zur führenden offenen Agenten macht.
💡 Es verwendet das rLLM-Framework und verbesserte GRPO++-Algorithmen, wodurch DeepSWE in realen Softwareingeniuraufgaben starke Lernfähigkeit und Anwendungspotenzial zeigt.
Weitere Details: https://huggingface.co/agentica-org/DeepSWE-Preview

4. ByteDance öffnet neuen Modell VINCIE-3B: 3 Milliarden Parameter, unterstützt kontextuelle kontinuierliche Bildbearbeitung

ByteDance hat das VINCIE-3B-Modell, das kontextuelle kontinuierliche Bildbearbeitung unterstützt, geöffnet. Das Modell wurde auf Basis der MM-DiT-Architektur entwickelt und kann aus Videos lernen und effiziente Bildbearbeitung durchführen. Seine technischen Highlights umfassen Video-gestützte Trainings, Block-kausalitätsdiffusions-Transformer und dreifache Agentenaufgaben-Training, die die Qualität und Effizienz der Bildbearbeitung erheblich verbessern.

【AiBase-Zusammenfassung:】
🎥 Video-gestützte Trainings: VINCIE-3B nutzt kontinuierliche Frames aus Videos, um automatisch Textbeschreibungen und Bildsequenzen zu extrahieren und multimodale Trainingsdaten zu erstellen.
🧠 Block-kausaler Diffusions-Transformer: Das Modell verwendet block-kausale Aufmerksamkeit, um kausale Aufmerksamkeit zwischen Text und Bildblöcken zu ermöglichen, während innerhalb der Blöcke bidirektionale Aufmerksamkeit besteht.
🔄 Dreifach-Agenten-Aufgaben-Training: Durch drei Aufgaben wie Vorhersage des nächsten Frames, Vorhersage der Segmentierung des aktuellen Frames und Vorhersage der Segmentierung des nächsten Frames wird das Verständnis dynamischer Szenen und Objektbeziehungen des Modells gesteigert.
Weitere Details: https://huggingface.co/ByteDance-Seed/VINCIE-3B

5. Stability AI öffnet Stable Audio Open Small, ein mobiles Audio-Erstellungstool

Stability AI hat gemeinsam mit Arm das stabile Audio Open Small-Modell vorgestellt, ein leichtgewichtiges Text-zu-Audio-Generierungsmodell, das für mobile Geräte optimiert ist. Das Modell läuft lokal auf mobilen Geräten, unterstützt Offline-Verarbeitung und verfügt über Merkmale wie hohe Effizienz, geringe Latenz und hohe Ausgabeverfügbarkeit. Es fördert die Umwandlung von KI-Audio-Generierungstechnologie in Edge-Computing und mobile Geräte.

【AiBase-Zusammenfassung:】
📱 Leichtgewichtiges Design: Parameter reduziert auf 341 M, geeignet für mobile Geräte.
🔊 Hochwertige Audiogenerierung: Unterstützung für Stereoton, keine Notwendigkeit einer Cloudverarbeitung.
🌐 Open-Source-Entwicklerunterstützung: Unterliegt der Community-Lizenz, senkt die technische Hürde und fördert kreative Anwendungen.
Weitere Details: https://huggingface.co/stabilityai/stable-audio-open-small

6. Google stellt Gemini for Education vor! Freie KI-Tools überrollen globales Bildungswesen

Google hat ein neues KI-Werkzeugpaket namens Gemini for Education vorgestellt, das auf der neuesten Generation von Gemini2.5Pro-Modellen und LearnLM-Lernmodellen basiert. Es bietet kostenlosen, starken und effizienten Lern- und Unterrichtssupport für Lehrer und Schüler weltweit. Das Werkzeug deckt 30 Funktionen ab und unterstützt 40 Sprachen, um Bildungsmitarbeitende und Schüler durch KI-Technologie zu unterstützen und eine persönlichere und effizientere Lernerfahrung zu schaffen.

【AiBase-Zusammenfassung:】
🌍 Globale Bildungsförderung: Unterstützung für 40 Sprachen und Abdeckung von 230 Ländern und Regionen.
📚 Kostenlos verfügbar: Für alle Google Workspace for Education-Nutzer vollständig kostenlos, um Bildungsgleichheit zu fördern.
🔒 Sicherheit und Privatsphäre: streng nach den Datenschutzbedingungen, um die Sicherheit der Nutzerdaten sicherzustellen.

7. Topview Avatar 2 begeistert! KI-Digitalmenschen revolutionieren E-Commerce, Mode-Ära endet?

Topview Avatar 2 bringt durch bahnbrechende Funktionen und lebensechte Effekte eine revolutionäre Erfahrung für internationale E-Commerce und Inhaltscreators. Seine innovativen KI-Digitalmenschen-Technologien ermöglichen natürliche Interaktionen zwischen Produkten und Digitalmenschen und erhöhen erheblich die Effizienz und Qualität der Videoproduktion.

【AiBase-Zusammenfassung:】
🌍 Erster KI-Digitalmensch „Trägt“ Produkte weltweit, um realistischere Interaktionseffekte zu erreichen.
⚙️ Ein-Klick-Generierung von maßgeschneiderten Videos, Unterstützung für mehrsprachige Mundbewegungen, um die Marketingflexibilität zu erhöhen.
🚀 Revolutioniert die traditionelle UGC-Videomethode, senkt den Einstiegshürden für E-Commerce und hilft Marken, globalisiert zu werden.
Weitere Details: https://www.topview.ai/ai-product-avatar

8. Perplexity launcht Max-Abonnementsplan: Monatlich 200 US-Dollar für unbegrenzte KI-Produktivität

Perplexity hat einen Premium-Abonnementsplan namens Max eingeführt, der monatlich 200 US-Dollar oder jährlich 2000 US-Dollar kostet, um die Bedürfnisse häufiger Benutzer und Profis zu erfüllen. Der Plan bietet unbegrenzten Zugriff auf Labs, Priorität bei der Nutzung neuer Funktionen sowie Unterstützung für aktuelle Frontline-Modelle und markiert eine weitere Vertiefung seiner Arbeit im Bereich KI-Produktivitätstools.

【AiBase-Zusammenfassung:】
🧠 Unbegrenzte Labs-Abfragen: Erfüllt die Anforderungen professioneller Benutzer an tiefe Forschung und komplexe Projekte.
🚀 Prioritätszugriff auf Frontline-Modelle: Stellt sicher, dass Benutzer immer an der Technologiefront bleiben.
🔒 Prioritätsunterstützung: Bietet spezialisierte Infrastruktur und schnellere Kundenreaktionszeiten.

9. Cursor wagte es, Mitarbeiter zu gewinnen! Claude Code Kernperson wechselt zu Wettbewerbern

Cursor gewann zwei Kernpersönlichkeiten von Anthropic, was den Wettbewerb im Bereich KI-Programmierung verstärkt. Obwohl Anthropic mit Personalabwanderung konfrontiert ist, bleibt sein Geschäft stark und seine Einnahmen und Bewertung steigen erheblich. Anysphere verbessert durch diese Mitarbeiter weiterhin ihre Produktwettbewerbsfähigkeit.

【AiBase-Zusammenfassung:】
🧠 Cursor gelang es, Kernpersonal von Anthropic zu gewinnen, was die technische Stärke verstärkte.
💼 Boris Cherny und Cat Wu schlossen sich Anysphere an und förderten die Produktinnovation.
📈 Anthropic hat schnelles Geschäftsverhalten, sowohl Einnahmen als auch Bewertung stiegen erheblich.

10. OpenAI erklärt: Robinhood hat „OpenAI-Token“ veröffentlicht, aber es hat nichts damit zu tun

Der Artikel zeigt, dass Robinhood in Europa OpenAI und SpaceX Token-basierte Aktien eingeführt hat, aber OpenAI betonte klar, dass diese Token nicht ihre Anteile sind und keine Zusammenarbeit mit Robinhood gibt. Obwohl Robinhood zeitlich begrenzte Rabatte anbot, um Nutzer anzuziehen, können US-Bürger nicht teilnehmen. Dieses Ereignis löste eine lebhafte Reaktion am Markt aus, und der Aktienkurs von Robinhood stieg kurzzeitig.

【AiBase-Zusammenfassung:】
💰 OpenAI betont, dass „OpenAI-Token“ nicht ihre Anteile sind und keine Zusammenarbeit mit Robinhood gibt.
⚠️ Robinhood verwendete Token-basierte Aktien, um Investoren anzuziehen, aber US-Bürger können nicht teilnehmen.
📈 Der Aktienkurs von Robinhood stieg aufgrund dieser Nachricht und erreichte ein historisches Hoch.

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

A Zeitung: Bilibili aktualisiert das Anime-Video-Generationsmodell AniSora V3; ByteDance öffnet die 4D-Video-Generations-Framework EX-4D; DeepSWE öffnet ein KI-Agentensystem und steigt stark auf

站长之家

Dieser Artikel stammt aus dem AIbase-Tagesbericht