In den letzten Tagen hat die israelische Technologiefirma Lightricks die neueste Version ihres offenen Quellcodes für die AI-gesteuerte Videogenerierung veröffentlicht – den verfeinerten LTX-Video-13B-Modell (LTXV-13B v0.9.7-distilled). Dieses Modell basiert auf 13 Milliarden Parametern und nutzt mehrstufige Renderungstechnologien sowie effiziente Quantifizierungsoptimierungen, um die Videogenerierungsgeschwindigkeit auf weniger als 10 Sekunden zu steigern. Damit erreicht es einen neuen Meilenstein in der Technologie der künstlichen Intelligenz für die Videogenerierung. AIbase analysiert diese bahnbrechende Entwicklung und führt Sie durch ihre technischen Highlights und Auswirkungen auf die Branche.

image.png

Projektadresse: https://github.com/Lightricks/LTX-Video

Modelladresse: https://huggingface.co/spaces/Lightricks/ltx-video-distilled

Technische Durchbrüche: HD-Videos in 10 Sekunden generieren

Der verfeinerte LTX-Video-13B-Modell verwendet fortschrittliche mehrstufige Renderungstechnologien, um Videos von niedriger Auflösungsskizzen Schritt für Schritt bis hin zu hochauflösenden Bildqualität zu verfeinern, was die Videogenerierung erheblich beschleunigt. AIbase hat erfahren, dass dieses Modell auf Verbraucher-GPUs wie der NVIDIA RTX4090 innerhalb von 10 Sekunden Videos mit einer Auflösung von 1216×704 generieren kann, was etwa fünfmal schneller ist als seine Vorgängermodell. Für eine Voransicht mit niedriger Auflösung reichen sogar 3 Sekunden aus. Diese Geschwindigkeitsverbesserung ermöglicht es, Echtzeit-Videogenerierung zu realisieren und den Schöpfern bisher unerreichte Effizienz zu bieten.

Darüber hinaus unterstützt das Modell Schlüsselrahmen-Editierungen, Kamerabewegungssteuerungen und Multikamerasequenzen, was Benutzern eine größere kreative Freiheit gibt. Ob dynamische Szenen oder komplexe menschliche Bewegungen – LTXV-13B kann glatte Bewegungsverläufe und klare Details liefern, wobei die Videoqualität professionellen Filmwerken gleichkommt.

Offen Source macht's möglich: Hochwertige Videos auch mit geringem Speicherbedarf

Als völlig offenes Modell setzt LTX-Video-13B seinen Verpflichtungen gegenüber einer technologischen Öffentlichkeit fort. AIbase hat bemerkt, dass dieses Modell spezielle Versionen im Format fp8 und LoRA-Adapter-Versionen bietet, was den Hardware-Anforderungen deutlich entgegenkommt. Selbst auf Geräten mit geringem Speicher kann Benutzer das Modell nutzen und qualitativ hochwertige Videos erstellen. Diese Eigenschaft ist besonders für unabhängige Kreatoren und kleine und mittlere Unternehmen von großem Nutzen und senkt dabei die Kosten für die AI-basierte Videoproduktion erheblich.

Das Modell ist sowohl auf Hugging Face als auch auf GitHub verfügbar und wird durch ComfyUI kompatibel gemacht, sodass Entwickler es problemlos in bestehende Arbeitsabläufe integrieren können. Lightricks bietet darüber hinaus kostenlose Lizenzierung für Unternehmen mit einem jährlichen Umsatz unter 10 Millionen US-Dollar an, um die Verbreitung der AI-Videotechnologie weiter voranzutreiben.

Effizienz und Qualität vereint: Das Geheimnis einer 30-fachen Geschwindigkeitssteigerung

Neben seiner beeindruckenden Geschwindigkeit zeigt das verfeinerte LTX-Video-13B-Modell auch eine erhebliche Verbesserung in der Videoqualität. Dank der Zusammenarbeit mit Shutterstock und Getty Images wurde das Modell mit hochwertigen Videodatensätzen trainiert, wodurch die generierten Videos ein filmisches Aussehen haben und eine stärkere Szenenkontinuität aufweisen. AIbase hat erfahren, dass dessen Kerntechnologie UEfficient Q8 die Leistung des Modells auf Verbraucherhardware optimiert hat, sodass selbst auf normalen Laptop-Computern eine effiziente Ausführung erfolgt.

Im Vergleich zu ähnlichen Modellen ist die Generierungsgeschwindigkeit des LTXV-13B 30-mal höher, wobei die Durchschnittszeit für die Erstellung eines Videos nur 37,59 Sekunden beträgt, während Konkurrenten unter gleichen Bedingungen fast 25 Minuten benötigen. Diese enorme Steigerung macht es in Echtzeitanwendungen, bei virtuellen Sprechern (VTubing) usw., zu einem großartigen Potenzial.

Industrieauswirkungen: Die Herausforderung an OpenAI und Google durch nationale Kraft

Die Veröffentlichung dieses Modells durch Lightricks gilt der Branche als starke Herausforderung an Topmodelle wie OpenAI Sora und Google Veo. AIbase analysiert, dass LTX-Video-13B durch einen geringeren Trainingsaufwand (nur einige zehn Millionen US-Dollar) ähnlich hohe Leistungen erzielt wie die Spitzenmodelle, was die Innovationsfähigkeit von Open Source-Communities und kleinen und mittleren Technologieunternehmen in der AI-Branche demonstriert. Seine Beiträge wie die mehrstufige Renderungstechnologie und die VACE-Modellinferenz sorgen für neue Impulse im Bereich der AI-basierten Videogenerierung weltweit.

Für Kreative bedeutet dies, dass sie keine teuren professionellen Geräte mehr brauchen, um qualitativ hochwertige Animationen, Kurzfilme oder Marketingvideos zu erstellen. AIbase prognostiziert, dass dieses Modell die Verbreitung von AI-basierten Videotools in den Bereichen Film, Werbung und soziale Medien beschleunigen wird und damit das Content-Creation-Ökosystem neu gestaltet.

Die „Deepseek Moment“ in der AI-Videogenerierung

Als Fachmedien für KI hält AIbase die Veröffentlichung des verfeinerten LTX-Video-13B-Modells nicht nur für das technische Höhepunktstück von Lightricks, sondern auch für einen kollektiven Erfolg der offenen KI-Community. Seine außerordentliche Geschwindigkeit und geringen Hardwareanforderungen brechen technische Barrieren für die Videogenerierung auf und ermöglichen es immer mehr Menschen, an intelligentem Schaffen teilzuhaben.