騰訊開源混元世界模型1.1,支持多視圖和視頻輸入,實現單卡部署並提升生成速度。該模型能在數秒內從視頻或圖片生成專業3D場景,推動3D重建技術普及,讓普通用戶輕鬆使用專業工具。
騰訊開源HunyuanWorld-Voyager模型,具備原生3D重建能力。該視頻擴散框架基於單張輸入圖像生成具有世界一致性的3D點雲,爲開發者提供創新AI產品應用。
騰訊AI團隊Hunyuan最新開源3D世界模型HunyuanWorld-Voyager登頂WorldScore榜單,憑藉卓越的相機控制、內容對齊和3D一致性表現超越競品。該模型具備原生3D重建能力,支持單張圖像生成點雲,爲3D重建、深度估計等應用帶來突破性進展。
騰訊發佈HunyuanWorld-Voyager視頻擴散框架,通過單張圖像生成3D點雲,支持自定義相機路徑實現沉浸式探索。作爲全球首個原生3D重建超遠距離世界模型,它無需後處理即可生成精確深度信息和RGB視頻,重新定義AI驅動的VR、遊戲和仿真空間智能。
高保真可動畫 3D 人類重建模型,快速生成動畫角色。
高分辨率、高精度的深度估計方法
從單張圖片重建逼真的3D人體模型
4D場景創建工具,使用多視圖視頻擴散模型
facebook
MapAnything是一個端到端訓練的Transformer模型,能夠以多種模態作為輸入,直接回歸場景的分解度量3D幾何結構。該模型支持超過12種不同的3D重建任務,包括多圖像SfM、多視圖立體視覺、單目度量深度估計等。
yslan
STream3R是一種基於因果Transformer的可擴展序列3D重建模型,將點雲圖預測重新定義為僅解碼器的Transformer問題。它引入流式處理框架,利用因果注意力高效處理圖像序列,能夠很好地泛化到各種具有挑戰性的場景,包括傳統方法經常失效的動態場景。
kvuong2711
AerialMegaDepth是一個專注於空地重建與視角合成的深度學習模型,能夠從航拍圖像中重建3D場景並生成新視角。
3DAIGC
LHM是一個前饋式模型,可在數秒內從單張圖像重建可動畫的3D人體。
LHM是一個前饋模型,可在數秒內從單張圖像重建可動畫的3D人體。通過在大規模視頻數據集上使用圖像重建損失進行訓練,我們的模型對多樣化的現實場景展現出強大的泛化能力。
zhang3z
dust3r 是一個用於從圖像生成3D模型的深度學習模型,支持多視圖3D重建。
stanfordmimi
由六種大規模、可泛化的2D/3D變分自編碼器組成的醫學影像處理模型家族,能夠將醫學圖像編碼為壓縮的潛在表徵,並實現高保真度的圖像重建。
Kai422kx
DAS3R是一種用於靜態場景重建的3D模型,採用動態感知高斯潑濺技術,能夠從圖像生成高質量的3D重建效果。
stabilityai
SPAR3D是基於SF3D的大型重建模型,可在1秒內從單張圖像生成帶紋理UV展開的3D網格資產,具備即時編輯能力。
Junyi42
MonST3R是一種在運動存在下估算幾何形狀的簡單方法,能夠從圖像中重建3D場景。
VFusion3D是一個通過少量3D數據與大量合成多視角數據訓練的大型前饋式3D生成模型,是首個研究可擴展3D生成/重建模型的工作。
jadechoghari
VFusion3D是一個大型前饋式3D生成模型,通過少量3D數據和大量合成多視角數據進行訓練,探索可擴展的3D生成/重建模型。
naver
DUSt3R是一個用於從圖像輕鬆實現幾何3D視覺的模型,能夠從單張或多張圖像重建3D場景。
TripoSR是由Stability AI與Tripo AI聯合開發的快速前饋式3D生成模型,專注於從單張圖像快速重建3D模型。
一個基於OpenSCAD的MCP服務器,通過AI生成多視角圖像並重建為參數化3D模型,支持遠程CUDA加速處理。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的服務,支持多視角重建、AI圖像生成、遠程CUDA處理和工作流審批,最終輸出OpenSCAD兼容的模型文件。
VGGT-MPS是基於蘋果芯片優化的3D視覺重建工具,使用Metal Performance Shaders加速,能夠從單張或多張圖像生成深度圖、相機姿態和3D點雲,支持稀疏注意力實現城市級重建。