先日、イスラエルのテクノロジー企業であるLightricksは、そのオープンソースのAIビデオ生成モデルの最新バージョンである「LTX-Video-13B distilled model」(LTXV-13B v0.9.7-distilled)をリリースしました。このモデルは130億パラメーターを基にし、マルチスケールレンダリング技術と効率的な量子化最適化により、ビデオ生成時間を驚異的に10秒以内に短縮しました。これにより、AIビデオ生成技術における新たなマイルストーンが樹立されました。AIbaseはこの画期的な進展を詳しく解説し、その技術的な特長や業界への影響についても探ります。

image.png

プロジェクトURL: https://github.com/Lightricks/LTX-Video

モデルURL: https://huggingface.co/spaces/Lightricks/ltx-video-distilled

技術的革新: 10秒で高品質ビデオ生成

LTX-Video-13B distilled modelは、進化的なマルチスケールレンダリング技術を採用しており、低解像度のスケッチから徐々に高画質へと精錬することで、ビデオ生成時間を大幅に短縮しています。AIbaseによると、このモデルはNVIDIA RTX4090などのコンシューマー向けGPU上で、1216×704解像度のビデオを10秒以内に生成できることが可能です。前世代のモデルと比べて約5倍速くなり、低解像度プレビューではわずか3秒で完了します。このような速度の飛躍により、リアルタイムビデオ生成が可能となり、クリエイターには未体験の効率を提供しています。

さらに、このモデルはキーフレーム編集、カメラモーション制御、マルチショットシーケンスに対応しており、ユーザーの創造力を最大限に広げています。動的なシーンや複雑な人物アクションでも、より滑らかな動きの軌道と鮮明な詳細が表現され、映画並みのクオリティを達成します。

オープンソースによる恩恵: 低スペックデバイスでもAIビデオを扱える

完全にオープンソースのモデルとして、LTX-Video-13B distilled modelはLightricksの技術を広く共有するというコミットメントを引き継いでいます。AIbaseが注目したのは、このモデルが量子化バージョン(fp8)やLoRAアダプト版を導入したことで、ハードウェア要件を大幅に下げたことです。低スペックのデバイスでも、このモデルを使って高品質なビデオを生成することが可能です。この特徴は特にインディークリエイターや中小企業にとって魅力的であり、AIビデオ制作コストを大幅に削減します。

モデルはHugging FaceとGitHubで公開されており、ComfyUIによる互換性も提供されています。これにより、開発者は既存のワークフローに簡単に統合できます。また、年間収益が1000万ドル以下の中堅企業には無料ライセンスが提供され、AIビデオ技術の普及をさらに推進します。

効率と品質の両立: 30倍速の秘密

LTX-Video-13B distilled modelは驚異的なスピードだけでなく、ビデオ品質も大幅に向上しています。ShutterstockやGetty Imagesとの協力により、高品質なビデオデータセットで学習を行った結果、生成されるビデオは映画のような雰囲気を持ち、シーンのつながりも強化されています。AIbaseが得た情報によると、そのコア技術であるUEfficient Q8は消費級ハードウェアでのパフォーマンスを最適化しており、一般的なノートパソコンでも効率的に動作させることができます。

類似モデルと比較すると、LTXV-13Bの生成速度は30倍向上し、平均生成時間はわずか37.59秒です。これに対し、競合製品は同等のハードウェア上で約25分かかるため、その差は顕著です。このパフォーマンスの跳躍により、リアルタイム生成やVTuber(仮想YouTuber)などでの活用に大きな可能性が広がっています。

業界への影響: OpenAIやGoogleに対する挑戦

業界では、Lightricksの今回のリリースがOpenAI SoraやGoogle Veoといった大手モデルに強い挑戦となると見られています。AIbaseの分析によれば、LTX-Video-13B distilled modelは数千万ドルという低い訓練コストでトップレベルのパフォーマンスを実現し、オープンソースコミュニティや中堅企業のAI分野での革新力を示しています。マルチスケールレンダリングやVACEモデル推論などの貢献は、グローバルなAIビデオ生成技術の発展に新たな活力を与えました。

クリエイターにとっては、高品質なアニメーションや短編映像、マーケティングビデオを作成するために高価な専門機材が必要ではなくなりました。AIbaseは予測しています。このモデルは映画・広告・SNS領域でのAIビデオツールの普及を加速し、コンテンツ制作の生態系を再構築すると考えられます。

AIビデオ生成の「Deepseek moment」

専門メディアとしてのAIbaseは、LTX-Video-13B distilled modelのリリースがLightricksの技術的頂点であるだけでなく、オープンソースAIコミュニティにとっての一大勝利であると評価しています。その超高速生成能力と低スペックハードウェア要件により、AIビデオ生成の技術的障壁を打ち破り、より多くの人々が知能化されたクリエイティブ活動に参加できるようになりました。