稀宇科技はビデオ生成分野で新たな進展を遂げ、新しいビデオ生成モデル「Hailuo02」を正式にリリースしました。
報道によると、Hailuo02は体操アクションなどの非常に複雑なシナリオを処理する際に優れたパフォーマンスを発揮し、現在のところこの効果を実現できる唯一のモデルです。昨年8月末にビデオ生成モデルのデモウェブページが公開されて以来、稀宇科技が提供する「海螺ビデオ」製品はクリエイターに3億7千万本以上のビデオを生成させました。今回のHailuo02のリリースにより、ビデオ制作の敷居がさらに低くなり、作成品質も向上しました。
Hailuo02の背後には「Noise-aware Compute Redistribution (NCR)」というコアアーキテクチャが存在します。このアーキテクチャにより、同等のパラメータ量でもトレーニングと推論の効率が2.5倍向上しました。これにより、クリエイターのコストを増やさずにより大きなパラメータ規模を採用でき、モデルの表現力を大幅に向上させることができます。また、推論最適化の余地も考慮され、モデル全体のパラメータ量は前バージョンの3倍に拡張されました。
より多くのデータを学習できるように、総パラメータ量が増加したことで、トレーニング効率も向上しました。前バージョンとの比較でデータ量が4倍になり、その質と多様性も大きく改善されました。これにより、新しいモデルは複雑な命令の遵守や物理的な表現において顕著な向上を見せ、複雑な命令にも完全に応答できるようになりました。また、クリエイターは相対的に手頃な価格で、オリジナルの1080pビデオを生成できます。
Artificial Analysis Video Arenaでのテストでは、Hailuo02の初期バージョンが世界ランキングで第2位を獲得しました。現在、このモデルは海螺ビデオのウェブサイト、アプリケーション、およびオープンプラットフォームAPIで全面的にアップデートされ、768p-6s、768p-10s、1080p-6sの3つのバージョンが提供されています。稀宇科技は引き続き業界最良の価格でクリエイターにサービスを提供し、生成速度の向上、好みの調整、高機能の実現、技術と芸術の結合に関する限界の探求など、迅速なアップデートを計画しています。