生数科技は、動画大規模モデルViduのQ1リファレンス画像生成機能が一般ユーザー向けに正式リリースされたことを発表しました。今回の機能リリースにより、多主体一貫性技術の限界を突破し、AIによる画像生成と動画生成のビジネスプロダクションチェーンを完結させ、AIマルチモーダル創作を新たな段階へと進めることが目的です。
Vidu Q1リファレンス画像生成機能は「5つの特徴」を中心に展開されています。まず、最大で7枚のリファレンス画像を同時に入力できるため、制作プロセスにおける制御性が大幅に向上します。次に、Vidu Q1は複数の主体やシーンでの生成能力においてより一貫性があり、繰り返し生成しても人物や主体の顔や特徴が常に一貫しており、高い再現性とリアルさを確保します。さらに、ユーザーは1枚の画像と1つの説明文だけで、服や背景を自由に変更することができ、高い自由度の創作が可能です。
生数科技は、Vidu Q1リファレンス画像生成の多画像リファレンス時代は一貫性技術における大きな飛躍であり、複雑なシナリオでの柔軟な創作を可能にし、画像生成の現実感と適用性を強化したと述べています。過去のAIクリエイティブツールは主にインスピレーションを引き出すものでしたが、Vidu Q1はAIの役割をコンテンツ生産の主導者に拡張し、ユーザーは監督のみで済むため、コンテンツ生産のハードルを大きく下げました。
具体的な応用では、Vidu Q1は合成、置換、変換の3つの生成モードを提供しています。例えば、異なる人物を同じシーンに合成したり、既存の写真の背景を新しいシーンに置き換えたりすることで、簡単にカスタマイズされたコンテンツを作成できます。また、このツールは衣類デザイン、広告宣伝、クリエイティブマーケティングなどの分野での応用可能性が大きく、デザイナーおよび小売業者が迅速かつ高品質な素材を生成するのに役立ちます。
生数科技の今回の革新は、AI画像生成ツールが商業化アプリケーションにおいて新たな重要な節目を示しています。同社はこの先進技術を通じて、業界内の企業や個人ユーザーがマルチモーダル創作の新時代を開くことを目指し、実際にAI技術が生産力を高める目標を達成したいと考えています。