Meta AI推出SAM3D模型,包含通用物體和人體專用兩套權重。僅需單張2D照片即可生成帶紋理、材質和幾何一致性的3D資產,效果優於現有主流方案。該模型通過聯合編碼空間位置與語義信息,預測像素的3D座標和表面法向,具備物理正確性,可直接應用於AR/VR、機器人和影視製作等領域。
李飛飛World Labs推出Marble 3D世界模型公測版,支持文本、圖像、視頻等多模態輸入,快速生成可交互虛擬宇宙,助力開發者探索AI技術應用。
知名AI專家李飛飛的World Labs推出Marble3D世界模型公測版,支持文本、圖像、視頻或3D佈局直接生成完整可導航的3D虛擬世界。用戶可實時交互編輯,並導出高斯濺射、三角網格或視頻格式。此次公測標誌着該產品從實驗室概念轉向實用工具。
人工智能專家李飛飛聯合創辦的World Labs推出首款商業化世界模型Marble,支持文本、圖片、視頻及3D佈局生成可編輯3D環境。產品提供免費增值和付費訂閱,適用於遊戲、影視、VR等領域。距公司完成2.3億美元融資僅一年多,展現快速發展勢頭。
通過 AI 設計代理快速生成專業圖像、視頻和 3D 模型。
騰訊混元3D驅動的圖片轉3D與STL轉換器,快速生成高精度3D模型
Hitem3D是由AI驅動的下一代3D模型生成器,速度快且精度高。
幾秒鐘內用 AI 生成高質量 3D 模型。
tencent
$18
輸入tokens/百萬
輸出tokens/百萬
32k
上下文長度
GatorBarbarian
TRELLIS Text XL是一個大型3D生成模型,是TRELLIS的文本條件版本,模型大小為XL。該模型基於論文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能夠根據文本描述生成高質量的3D內容。
Ashmotv
animat3d_style_wan-lora是基於AI Toolkit by Ostris訓練的LoRA模型,專門用於文本到視頻生成,可為圖像生成帶來獨特的3D動畫風格效果。該模型基於Wan2.2-T2V-A14B基礎模型進行微調,支持多種主流AI平臺使用。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的關鍵組件,是一個基於語義圖像條件化的ControlNet模型。它能夠根據文本描述生成2D圖像,同時嚴格遵循輸入語義圖像的佈局約束,主要用於3D室內場景合成。
lhjiang
AnySplat是一種先進的3D高斯散點渲染模型,能夠從不同視角的圖像高效生成高質量的3D場景。該模型具有快速推理能力和良好的泛化性能,為3D重建和渲染提供了創新的解決方案。
shakamone
TRELLIS是一個基於圖像條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D生成。
davidleiva4999
TRELLIS的文本條件版本,採用XL大模型規模,是一款強大的3D生成模型。
ImrozeAslamMalik
LGM是一個整合了多視角擴散模型的圖像轉3D工作流,能夠從單張圖像生成高質量3D內容。
Surn
TRELLIS圖像條件版本是一個大型3D生成模型,能夠從圖像生成3D內容。
larsquaedvlieg
TRELLIS是一個基於文本條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D內容生成。
TRELLIS是一個大型3D生成模型,通過結構化3D潛變量實現可擴展與多功能的3D內容生成。
TRELLIS文本XL模型是一個大型3D生成模型,能夠根據文本描述生成3D內容。
multimodalart
FLUX.1-dev是一個基於通量模型的文本生成圖像模型,支持LoRA技術和擴散模型架構,專注於生成等距視角的3D圖標。
MonsterMMORPG
TRELLIS圖像條件版本是一個大型3D生成模型,能夠根據輸入的2D圖像生成對應的3D模型。
jetx
TRELLIS的條件圖像版本,一個大型3D生成模型,能夠從2D圖像生成3D內容。
gordon-0115
一個實驗性的自然語言到3D模型生成流程,基於改進的預訓練多視角擴散模型
Borcherding
基於FLUX.1-dev模型的LoRA適配器,專為生成標誌、圖標和表情符號設計,支持微軟FluentUI風格等多種3D渲染效果。
kvuong2711
AerialMegaDepth是一個專注於空地重建與視角合成的深度學習模型,能夠從航拍圖像中重建3D場景並生成新視角。
VAST-AI
TripoSG-scribble 是一個基於塗鴉圖像和文本提示快速生成3D模型的AI工具,是TripoSG的變體,適用於創意設計和快速原型構建。
cavargas10
基於文本條件的大型3D生成模型,採用XL規模架構,能夠根據文本描述生成3D內容
Yntec
C3是一個基於Stable Diffusion 1.5的文本生成圖像模型,專注於生成高質量的角色、風景和3D圖像。
MCP STL 3D浮雕生成器是一個將2D圖像轉換為3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反轉等功能,適合3D打印和渲染。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
遊戲資產生成器利用AI模型和MCP協議,通過文本提示快速生成2D和3D遊戲資源。
一個基於OpenSCAD的MCP服務器,通過AI生成多視角圖像並重建為參數化3D模型,支持遠程CUDA加速處理。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的服務,支持多視角重建、AI圖像生成、遠程CUDA處理和工作流審批,最終輸出OpenSCAD兼容的模型文件。
TRELLIS Blender插件將先進的文本/圖像生成3D模型功能集成到Blender中,支持通過文本或圖像生成帶紋理的3D網格,並提供細節調整功能。插件還集成了MCP服務,可與Cursor/Windsurf等工具通信。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的工具,支持多視角重建和遠程處理。
Meshy AI MCP服務器是一個用於與Meshy AI API交互的模型上下文協議服務器,提供從文本和圖像生成3D模型、應用紋理、重新網格化模型等功能。