智源オープンソース無標識ビデオ学習3D生成モデルSee3D
北京智源人工知能研究院(BAAI)は最近、大規模な無標識インターネットビデオを用いて学習できる革新的な3D生成モデルSee3Dを発表しました。この技術的ブレークスルーは、「See Video,Get3D」という理念への重要な一歩を意味します。See3Dモデルは従来のカメラパラメーターに依存せず、ビジュアルコンディショニング技術を採用し、ビデオの視覚的手がかりのみを用いて、カメラの方向を制御でき、幾何学的に一貫性のある多視点画像を生成します。この手法は、高価な3Dデータやカメラのキャリブレーションを回避します。