北京智源人工智能研究院(BAAI)近日宣佈推出一款創新的3D生成模型See3D,該模型能夠利用大規模無標註的互聯網視頻進行學習。這一技術突破標誌着向“See Video, Get3D”的理念邁進了重要一步。See3D模型不依賴於傳統的相機參數,而是採用視覺條件技術,僅通過視頻中的視覺線索生成相機方向可控且幾何一致的多視角圖像。這種方法避免了昂貴的3D或相機標註的需求,能夠高效地從互聯網視頻中學習3D先驗。
Bytedance
$1.2
輸入tokens/百萬
$3.6
輸出tokens/百萬
4
上下文長度
$0.8
$2
256
$0.15
$1.5
$8