騰訊混元團隊開源HY-Motion1.0模型,基於DiT架構與流匹配技術,通過文本描述即可生成高質量3D骨骼動畫,兼容主流3D工具,大幅降低動畫製作門檻。該模型採用全階段訓練策略,利用超3000小時動作數據優化生成效果。
微軟開源圖像轉3D工具TRELLIS.2,僅需一張圖片即可快速生成帶材質的3D模型,輸出.glb格式文件,兼容Blender、Unity等平臺。該工具採用4B模型,支持512³至1536³分辨率圖像處理,在NVIDIA H100顯卡上,生成512³模型僅需約3秒。
拓竹科技推出“印你”3D手辦生成器,基於騰訊混元3D3.0大模型,用戶上傳圖片即可生成高質量可打印3D模型,降低定製門檻,爲愛好者和新手提供便捷創作工具。
快手旗下可靈AI發佈“主體庫”,爲O1多模態視頻模型增加長期記憶功能。用戶上傳單張角色圖,系統可生成3D視角補全和多光線變體,支持跨場景一鍵調用角色,主體一致性超96%。流程包括上傳圖片自動處理、AI補全多角度視圖,實現從單圖到3D記憶的轉換。
Meta的單圖像3D重建模型,融合SAM 3分割與幾何紋理佈局預測生成3D資產
通過 AI 設計代理快速生成專業圖像、視頻和 3D 模型。
騰訊混元3D驅動的圖片轉3D與STL轉換器,快速生成高精度3D模型
Hitem3D是由AI驅動的下一代3D模型生成器,速度快且精度高。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$2
HIT-TMG
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全開源全模態模型,採用全模態 3D RoPE 和動態容量專家混合架構,顯著提升了以語言為中心的多模態理解、推理和生成能力。該版本集成了全模態理解以及音頻和圖像生成能力。
GatorBarbarian
TRELLIS Text XL是一個大型3D生成模型,是TRELLIS的文本條件版本,模型大小為XL。該模型基於論文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能夠根據文本描述生成高質量的3D內容。
Ashmotv
animat3d_style_wan-lora是基於AI Toolkit by Ostris訓練的LoRA模型,專門用於文本到視頻生成,可為圖像生成帶來獨特的3D動畫風格效果。該模型基於Wan2.2-T2V-A14B基礎模型進行微調,支持多種主流AI平臺使用。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的關鍵組件,是一個基於語義圖像條件化的ControlNet模型。它能夠根據文本描述生成2D圖像,同時嚴格遵循輸入語義圖像的佈局約束,主要用於3D室內場景合成。
lhjiang
AnySplat是一種先進的3D高斯散點渲染模型,能夠從不同視角的圖像高效生成高質量的3D場景。該模型具有快速推理能力和良好的泛化性能,為3D重建和渲染提供了創新的解決方案。
shakamone
TRELLIS是一個基於圖像條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D生成。
davidleiva4999
TRELLIS的文本條件版本,採用XL大模型規模,是一款強大的3D生成模型。
ImrozeAslamMalik
LGM是一個整合了多視角擴散模型的圖像轉3D工作流,能夠從單張圖像生成高質量3D內容。
Surn
TRELLIS圖像條件版本是一個大型3D生成模型,能夠從圖像生成3D內容。
larsquaedvlieg
TRELLIS是一個基於文本條件的大型3D生成模型,採用結構化3D潛變量實現可擴展與多功能的3D內容生成。
TRELLIS是一個大型3D生成模型,通過結構化3D潛變量實現可擴展與多功能的3D內容生成。
TRELLIS文本XL模型是一個大型3D生成模型,能夠根據文本描述生成3D內容。
multimodalart
FLUX.1-dev是一個基於通量模型的文本生成圖像模型,支持LoRA技術和擴散模型架構,專注於生成等距視角的3D圖標。
MonsterMMORPG
TRELLIS圖像條件版本是一個大型3D生成模型,能夠根據輸入的2D圖像生成對應的3D模型。
jetx
TRELLIS的條件圖像版本,一個大型3D生成模型,能夠從2D圖像生成3D內容。
gordon-0115
一個實驗性的自然語言到3D模型生成流程,基於改進的預訓練多視角擴散模型
Borcherding
基於FLUX.1-dev模型的LoRA適配器,專為生成標誌、圖標和表情符號設計,支持微軟FluentUI風格等多種3D渲染效果。
kvuong2711
AerialMegaDepth是一個專注於空地重建與視角合成的深度學習模型,能夠從航拍圖像中重建3D場景並生成新視角。
VAST-AI
TripoSG-scribble 是一個基於塗鴉圖像和文本提示快速生成3D模型的AI工具,是TripoSG的變體,適用於創意設計和快速原型構建。
cavargas10
基於文本條件的大型3D生成模型,採用XL規模架構,能夠根據文本描述生成3D內容
MCP STL 3D浮雕生成器是一個將2D圖像轉換為3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反轉等功能,適合3D打印和渲染。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
遊戲資產生成器利用AI模型和MCP協議,通過文本提示快速生成2D和3D遊戲資源。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的服務,支持多視角重建、AI圖像生成、遠程CUDA處理和工作流審批,最終輸出OpenSCAD兼容的模型文件。
一個基於OpenSCAD的MCP服務器,通過AI生成多視角圖像並重建為參數化3D模型,支持遠程CUDA加速處理。
TRELLIS Blender插件將先進的文本/圖像生成3D模型功能集成到Blender中,支持通過文本或圖像生成帶紋理的3D網格,並提供細節調整功能。插件還集成了MCP服務,可與Cursor/Windsurf等工具通信。
OpenSCAD MCP服務器是一個通過文本或圖像生成參數化3D模型的工具,支持多視角重建和遠程處理。
Poly.Pizza MCP服務器是一個將免費低多邊形3D模型直接導入Unity項目的工具,支持模型搜索、批量導入、自動生成預製體和記錄版權信息。
Meshy AI MCP服務器是一個用於與Meshy AI API交互的模型上下文協議服務器,提供從文本和圖像生成3D模型、應用紋理、重新網格化模型等功能。