微軟開源圖像轉3D工具TRELLIS.2,僅需一張圖片即可快速生成帶材質的3D模型,輸出.glb格式文件,兼容Blender、Unity等平臺。該工具採用4B模型,支持512³至1536³分辨率圖像處理,在NVIDIA H100顯卡上,生成512³模型僅需約3秒。
蘋果開源SHARP模型,僅用不到一秒即可將2D照片轉爲物理比例準確的3D場景,大幅提升3D內容創作效率。
拓竹科技推出“印你”3D手辦生成器,基於騰訊混元3D3.0大模型,用戶上傳圖片即可生成高質量可打印3D模型,降低定製門檻,爲愛好者和新手提供便捷創作工具。
快手旗下可靈AI發佈“主體庫”,爲O1多模態視頻模型增加長期記憶功能。用戶上傳單張角色圖,系統可生成3D視角補全和多光線變體,支持跨場景一鍵調用角色,主體一致性超96%。流程包括上傳圖片自動處理、AI補全多角度視圖,實現從單圖到3D記憶的轉換。
微軟Trellis 2 AI,快速將圖像轉為含PBR紋理的高質量3D模型
基於Meta的SAM 3D模型,可秒將單張圖像轉換成高質量3D模型。
先進AI技術,可將文字和圖像瞬間轉化為3D模型,無需3D建模經驗。
SAM 3D:AI驅動,秒速將2D圖像轉化為專業級3D模型
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
HIT-TMG
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全開源全模態模型,採用全模態 3D RoPE 和動態容量專家混合架構,顯著提升了以語言為中心的多模態理解、推理和生成能力。該版本集成了全模態理解以及音頻和圖像生成能力。
GatorBarbarian
TRELLIS Text XL是一個大型3D生成模型,是TRELLIS的文本條件版本,模型大小為XL。該模型基於論文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能夠根據文本描述生成高質量的3D內容。
Ashmotv
animat3d_style_wan-lora是基於AI Toolkit by Ostris訓練的LoRA模型,專門用於文本到視頻生成,可為圖像生成帶來獨特的3D動畫風格效果。該模型基於Wan2.2-T2V-A14B基礎模型進行微調,支持多種主流AI平臺使用。
facebook
MapAnything是一個端到端訓練的Transformer模型,能夠以多種模態作為輸入,直接回歸場景的分解度量3D幾何結構。該模型支持超過12種不同的3D重建任務,包括多圖像SfM、多視圖立體視覺、單目度量深度估計等。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的關鍵組件,是一個基於語義圖像條件化的ControlNet模型。它能夠根據文本描述生成2D圖像,同時嚴格遵循輸入語義圖像的佈局約束,主要用於3D室內場景合成。
yslan
STream3R是一種基於因果Transformer的可擴展序列3D重建模型,將點雲圖預測重新定義為僅解碼器的Transformer問題。它引入流式處理框架,利用因果注意力高效處理圖像序列,能夠很好地泛化到各種具有挑戰性的場景,包括傳統方法經常失效的動態場景。
nvidia
ESM-2是NVIDIA基於TransformerEngine優化的蛋白質語言模型,能夠從氨基酸序列預測蛋白質3D結構。該模型採用掩碼語言建模目標訓練,在NVIDIA GPU上具有更快的訓練和推理速度。
ilkerzgi
這是一個LoRA模型,可將普通圖像轉換為具有黑色背景和3D視角的金屬風格圖像。
lhjiang
AnySplat是一種先進的3D高斯散點渲染模型,能夠從不同視角的圖像高效生成高質量的3D場景。該模型具有快速推理能力和良好的泛化性能,為3D重建和渲染提供了創新的解決方案。
shakamone
TRELLIS是一個基於圖像條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D生成。
davidleiva4999
TRELLIS的文本條件版本,採用XL大模型規模,是一款強大的3D生成模型。
unsloth
InternVL3-78B-Instruct是一個先進的多模態大語言模型,在多模態感知、推理和語言處理等方面表現出色。該模型通過原生多模態預訓練方法,將視覺和語言學習整合到統一訓練階段,在工具使用、GUI代理、工業圖像分析、3D視覺感知等多個領域展現出卓越能力。
ImrozeAslamMalik
LGM是一個整合了多視角擴散模型的圖像轉3D工作流,能夠從單張圖像生成高質量3D內容。
InternVL3-14B-Instruct 是一個先進的多模態大語言模型(MLLM),展示了卓越的多模態感知和推理能力,支持工具使用、GUI代理、工業圖像分析、3D視覺感知等多種任務。
InternVL3-2B-Instruct是先進的多模態大語言模型,相比前代有更出色的多模態感知和推理能力,擴展了工具使用、GUI代理、工業圖像分析、3D視覺感知等方面。採用原生多模態預訓練方法,將語言和視覺學習整合到單個預訓練階段。
InternVL3-78B是一款先進的多模態大語言模型,具備卓越的多模態感知和推理能力,在工具使用、GUI代理、工業圖像分析、3D視覺感知等領域表現出色,整體文本性能也十分優秀。
InternVL3-14B是一個先進的多模態大語言模型,在InternVL 2.5基礎上顯著提升了多模態感知和推理能力,並拓展了工具使用、GUI代理、工業圖像分析、3D視覺感知等領域的應用。
Surn
TRELLIS圖像條件版本是一個大型3D生成模型,能夠從圖像生成3D內容。
larsquaedvlieg
TRELLIS是一個基於文本條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D內容生成。
TRELLIS是一個大型3D生成模型,通過結構化3D潛變量實現可擴展與多功能的3D內容生成。
FreeCAD MCP是一個通過Claude Desktop控制FreeCAD的插件,支持從2D圖紙創建3D模型等多種設計功能。
MCP 3D打印機服務器是一個連接Claude與多種3D打印機管理系統的中間件,支持OctoPrint、Klipper、Duet等主流平臺,提供打印機控制、文件管理及高級STL模型處理功能。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
MCP STL 3D浮雕生成器是一個將2D圖像轉換為3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反轉等功能,適合3D打印和渲染。
SketchupMCP通過模型上下文協議(MCP)將Sketchup與Claude AI連接,實現雙向通信和3D建模控制。
MCP 3D打印服務器是一個連接Claude與多種3D打印機管理系統的協議服務器,支持OctoPrint、Klipper等多種打印機API,提供文件管理、打印控制和高級STL模型處理功能。
Blender與本地AI模型集成的開源項目,通過自然語言控制3D建模。
SketchupMCP是一個通過模型上下文協議(MCP)將Sketchup與Claude AI連接的整合工具,實現AI輔助3D建模和場景控制。
遊戲資產生成器利用AI模型和MCP協議,通過文本提示快速生成2D和3D遊戲資源。
MCP 3D打印機服務器是一個連接Claude與多種3D打印機管理系統的協議服務器,支持OctoPrint、Klipper、Duet等多種打印機API,提供文件管理、打印控制、STL模型處理等高級功能。
SketchupMCP是一個通過模型上下文協議(MCP)將Sketchup與Claude AI連接的項目,實現AI對Sketchup的直接控制和交互式3D建模。
一個基於OpenSCAD的MCP服務器,通過AI生成多視角圖像並重建為參數化3D模型,支持遠程CUDA加速處理。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的服務,支持多視角重建、AI圖像生成、遠程CUDA處理和工作流審批,最終輸出OpenSCAD兼容的模型文件。
MCP-Slicer是一個將3D Slicer與模型客戶端(如Claude)通過MCP協議連接的集成工具,支持通過自然語言直接操作3D Slicer進行醫學圖像處理和場景控制。
TRELLIS Blender插件將先進的文本/圖像生成3D模型功能集成到Blender中,支持通過文本或圖像生成帶紋理的3D網格,並提供細節調整功能。插件還集成了MCP服務,可與Cursor/Windsurf等工具通信。
3D-MCP是一個為3D軟件設計的通用模型上下文協議實現,通過統一的TypeScript接口讓LLM能夠跨Blender、Maya、Unreal等平臺交互。
Rhino 3D的MCP服務器實現項目,允許AI通過模型上下文協議創建和操作3D對象,包含Python和C#組件,目前處於開發階段。
這是一個8th Wall MCP服務器項目,允許用戶通過自然語言指令在Claude Desktop中構建WebAR體驗。它提供了超過66個工具,支持場景構建、3D模型管理、動畫添加、物理效果、資產搜索以及項目文件管理,並能與8th Wall Desktop和雲API集成。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的工具,支持多視角重建和遠程處理。
一個通過MCP協議與Sketchfab API交互的微服務,支持模型搜索和下載。