Am 9. Oktober kündigte Elon Musks Unternehmen xAI seinen neuesten Videogenerationsmodell Imagine v0.9 an und markiert damit einen großen Durchbruch in der multimodalen KI-Erstellung. Im Vergleich zur früheren Version v0.1 hat das neue Modell eine umfassende Verbesserung in den Bereichen Bildqualität, natürlicher Bewegungen und Audio-Generierung.

 Drei Kernverbesserungen

  • Bildqualität: Das Bild hat eine höhere Auflösung und mehr Details, wodurch es dem professionellen Filmniveau nahekommt.

  • Bewegungsgenerierung: Die Bewegungen von Personen und Szenen sind flüssiger und natürlicher, mit keinem sichtbaren Übergang.

  • Audiokapazitäten: Neue native Audiogenerierung ermöglicht die gleichzeitige Erzeugung von Hintergrundmusik, Dialogen und Gesang.

 Sofortige Erstellung von filmreifen Werken

Imagine v0.9 ermöglicht „schnelle Generierung ohne Nachbearbeitung“, wobei vollständige Videos erzeugt werden können. Es unterstützt intelligente Komposition und Kontrolle der Kamerabewegung, sodass Kreativen innerhalb von Sekunden kurze oder lange Filme mit filmreicher Erzählweise erstellen können.

Modell-Spezialfeatures

  • Synchronisation von Soundeffekten: Bild und Soundeffekte werden auf Ebene der Bilder abgestimmt, was die Immersion erhöht.

  • Dynamische Kameraeffekte: Unterstützung für automatisches intelligentes Fokusieren, Tiefenschärfe-Anpassung und andere Filmkamerasprache.

  • Natürliche Dialoge und Gesangsgenerierung: Figuren können klare, emotionale Sprache oder Gesang generieren.

  • Tanz- und Rhythmuserkennung: Das AI kann den Musikrhythmus präzise erfassen und koordinierte Bewegungen generieren.

xAI erklärt, dass die Einführung von Imagine v0.9 neue Grenzen für die KI-Videocreation eröffnet. Nutzer können mit Textanweisungen schnell vollständige multimedialer Werke mit visueller Erzählung, auditive Darstellung und Rhythmus erstellen.