生数科技は9月25日に、その新世代の図生動画大規模モデル「Vidu Q2」を正式にリリースしました。このモデルは「Vidu Q2でAIが演劇を楽しむ」というテーマを掲げており、「微細な表情生成」に特に注力しており、ユーザーにこれまでにない視覚体験を提供しています。
Vidu Q2の最大の特徴は、極端な表情変化の正確な捉え方であり、ズーム・パン技術と組み合わせることで、動画の生成速度と意味理解能力を向上させています。つまり、生成された動画では、AIが自然な顔の表情変化を模倣するだけでなく、さまざまなシーンでフレーム移動を柔軟に使用し、各フレームが生き生きとした感情を表現できるようになります。
多様なユーザーのニーズに対応するために、Vidu Q2は豊富なモード選択を提供しており、画像から動画生成、最初と最後のフレームからの動画生成、および調整可能な長さ(2〜8秒)のオプションがあります。さらに、ユーザーは映画のようなスタイルや速いテンポの動画を生成することも可能です。これにより、創作がより簡単で楽しくなります。このような柔軟性により、動画制作がより簡単にされ、コンテンツクリエイターの創作の自由度が大幅に向上します。
このモデルを通じて、生数科技はAI技術が創造業界に更好地サービスを提供することを目指しており、すべてのユーザーが高品質な映像作品を簡単に作成できるようにしています。AIがさまざまな分野で広く利用される中、Vidu Q2の登場は図生動画技術の発展に新たな力を注入したのです。