Viduは、生数科技と清華大学が共同で発表した、中国初の長時間、高整合性、高動的ビデオ大規模モデルです。独自のDiffusionとTransformerを融合したアーキテクチャU-ViTを採用し、最長16秒、解像度1080Pの高解像度ビデオコンテンツをワンクリックで生成できます。Viduは現実世界の物理現象をシミュレートできるだけでなく、豊かな想像力も持ち合わせており、マルチカメラ生成、時空間の一貫性などの特徴を備えています。その急速な進歩は、チームがベイジアン機械学習とマルチモーダル大規模モデルにおける長年の蓄積と数々の独創的な成果によるものです。Viduの登場は、生数科技のマルチモーダルネイティブ大規模モデル分野における継続的な革新能力とリーダーシップを示しており、将来に向けて、柔軟なアーキテクチャによりより広範なモダリティに対応し、マルチモーダル汎用能力の境界をさらに拡大していきます。