DeepMindプロジェクトMegaSaM:通常の動画を入力するだけでカメラの視点と被写界深度を推定し、動画シーンを構築
最近、Googleの深層学習チームと複数の大学の研究者らが共同で、「MegaSaM」という新しいシステムを発表しました。このシステムは、通常のダイナミックビデオから、カメラパラメーターと深度マップを迅速かつ正確に推定できます。この技術の登場により、日常生活で撮影されたビデオの可能性が大きく広がり、特にダイナミックシーンのキャプチャと分析において大きな進歩をもたらします。従来のモーション構造再構成(Structure from Motion、SfM)や単眼同時位置推定とマッピング(SLAM)