微软开源图像转3D工具TRELLIS.2,仅需一张图片即可快速生成带材质的3D模型,输出.glb格式文件,兼容Blender、Unity等平台。该工具采用4B模型,支持512³至1536³分辨率图像处理,在NVIDIA H100显卡上,生成512³模型仅需约3秒。
苹果开源SHARP模型,仅用不到一秒即可将2D照片转为物理比例准确的3D场景,大幅提升3D内容创作效率。
拓竹科技推出“印你”3D手办生成器,基于腾讯混元3D3.0大模型,用户上传图片即可生成高质量可打印3D模型,降低定制门槛,为爱好者和新手提供便捷创作工具。
快手旗下可灵AI发布“主体库”,为O1多模态视频模型增加长期记忆功能。用户上传单张角色图,系统可生成3D视角补全和多光线变体,支持跨场景一键调用角色,主体一致性超96%。流程包括上传图片自动处理、AI补全多角度视图,实现从单图到3D记忆的转换。
基于Meta的SAM 3D模型,可秒将单张图像转换成高质量3D模型。
先进AI技术,可将文字和图像瞬间转化为3D模型,无需3D建模经验。
SAM 3D:AI驱动,秒速将2D图像转化为专业级3D模型
Meta的单图像3D重建模型,融合SAM 3分割与几何纹理布局预测生成3D资产
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
HIT-TMG
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全开源全模态模型,采用全模态 3D RoPE 和动态容量专家混合架构,显著提升了以语言为中心的多模态理解、推理和生成能力。该版本集成了全模态理解以及音频和图像生成能力。
GatorBarbarian
TRELLIS Text XL是一个大型3D生成模型,是TRELLIS的文本条件版本,模型大小为XL。该模型基于论文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能够根据文本描述生成高质量的3D内容。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
facebook
MapAnything是一个端到端训练的Transformer模型,能够以多种模态作为输入,直接回归场景的分解度量3D几何结构。该模型支持超过12种不同的3D重建任务,包括多图像SfM、多视图立体视觉、单目度量深度估计等。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的关键组件,是一个基于语义图像条件化的ControlNet模型。它能够根据文本描述生成2D图像,同时严格遵循输入语义图像的布局约束,主要用于3D室内场景合成。
yslan
STream3R是一种基于因果Transformer的可扩展序列3D重建模型,将点云图预测重新定义为仅解码器的Transformer问题。它引入流式处理框架,利用因果注意力高效处理图像序列,能够很好地泛化到各种具有挑战性的场景,包括传统方法经常失效的动态场景。
nvidia
ESM-2是NVIDIA基于TransformerEngine优化的蛋白质语言模型,能够从氨基酸序列预测蛋白质3D结构。该模型采用掩码语言建模目标训练,在NVIDIA GPU上具有更快的训练和推理速度。
ilkerzgi
这是一个LoRA模型,可将普通图像转换为具有黑色背景和3D视角的金属风格图像。
lhjiang
AnySplat是一种先进的3D高斯散点渲染模型,能够从不同视角的图像高效生成高质量的3D场景。该模型具有快速推理能力和良好的泛化性能,为3D重建和渲染提供了创新的解决方案。
shakamone
TRELLIS是一个基于图像条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D生成。
davidleiva4999
TRELLIS的文本条件版本,采用XL大模型规模,是一款强大的3D生成模型。
unsloth
InternVL3-78B-Instruct是一个先进的多模态大语言模型,在多模态感知、推理和语言处理等方面表现出色。该模型通过原生多模态预训练方法,将视觉和语言学习整合到统一训练阶段,在工具使用、GUI代理、工业图像分析、3D视觉感知等多个领域展现出卓越能力。
ImrozeAslamMalik
LGM是一个整合了多视角扩散模型的图像转3D工作流,能够从单张图像生成高质量3D内容。
InternVL3-14B-Instruct 是一个先进的多模态大语言模型(MLLM),展示了卓越的多模态感知和推理能力,支持工具使用、GUI代理、工业图像分析、3D视觉感知等多种任务。
InternVL3-2B-Instruct是先进的多模态大语言模型,相比前代有更出色的多模态感知和推理能力,扩展了工具使用、GUI代理、工业图像分析、3D视觉感知等方面。采用原生多模态预训练方法,将语言和视觉学习整合到单个预训练阶段。
InternVL3-78B是一款先进的多模态大语言模型,具备卓越的多模态感知和推理能力,在工具使用、GUI代理、工业图像分析、3D视觉感知等领域表现出色,整体文本性能也十分优秀。
InternVL3-14B是一个先进的多模态大语言模型,在InternVL 2.5基础上显著提升了多模态感知和推理能力,并拓展了工具使用、GUI代理、工业图像分析、3D视觉感知等领域的应用。
Surn
TRELLIS图像条件版本是一个大型3D生成模型,能够从图像生成3D内容。
larsquaedvlieg
TRELLIS是一个基于文本条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS是一个大型3D生成模型,通过结构化3D潜变量实现可扩展与多功能的3D内容生成。
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的工具,支持多视角重建和远程处理。
MCP 3D打印机服务器是一个连接Claude与多种3D打印机管理系统的协议服务器,支持OctoPrint、Klipper、Duet等多种打印机API,提供文件管理、打印控制、STL模型处理等高级功能。
一个基于OpenSCAD的MCP服务器,通过AI生成多视角图像并重建为参数化3D模型,支持远程CUDA加速处理。
MCP-Slicer是一个将3D Slicer与模型客户端(如Claude)通过MCP协议连接的集成工具,支持通过自然语言直接操作3D Slicer进行医学图像处理和场景控制。
Rhino 3D的MCP服务器实现项目,允许AI通过模型上下文协议创建和操作3D对象,包含Python和C#组件,目前处于开发阶段。
SketchupMCP通过模型上下文协议(MCP)将Sketchup与Claude AI连接,实现双向通信和3D建模控制。
SketchupMCP是一个通过模型上下文协议(MCP)将Sketchup与Claude AI连接的整合工具,实现AI辅助3D建模和场景控制。
游戏资产生成器利用AI模型和MCP协议,通过文本提示快速生成2D和3D游戏资源。
SketchupMCP是一个通过模型上下文协议(MCP)将Sketchup与Claude AI连接的项目,实现AI对Sketchup的直接控制和交互式3D建模。
Trellis MCP是一个连接AI助手与Trellis 3D生成模型的接口服务,支持通过自然语言快速生成3D资产并导入Blender。该项目基于开源模型,需自行部署API后端,具有快速、免费的特点,但存在稳定性风险。
MCP 3D打印服务器是一个连接Claude与多种3D打印机管理系统的协议服务器,支持OctoPrint、Klipper等多种打印机API,提供文件管理、打印控制和高级STL模型处理功能。
3D-MCP是一个为3D软件设计的通用模型上下文协议实现,通过统一的TypeScript接口让LLM能够跨Blender、Maya、Unreal等平台交互。
这是一个8th Wall MCP服务器项目,允许用户通过自然语言指令在Claude Desktop中构建WebAR体验。它提供了超过66个工具,支持场景构建、3D模型管理、动画添加、物理效果、资产搜索以及项目文件管理,并能与8th Wall Desktop和云API集成。
TRELLIS Blender插件将先进的文本/图像生成3D模型功能集成到Blender中,支持通过文本或图像生成带纹理的3D网格,并提供细节调整功能。插件还集成了MCP服务,可与Cursor/Windsurf等工具通信。
MCP STL 3D浮雕生成器是一个将2D图像转换为3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反转等功能,适合3D打印和渲染。
Blender与本地AI模型集成的开源项目,通过自然语言控制3D建模。
MCP 3D打印机服务器是一个连接Claude与多种3D打印机管理系统的中间件,支持OctoPrint、Klipper、Duet等主流平台,提供打印机控制、文件管理及高级STL模型处理功能。
一个用于处理、验证、优化和分析3D模型(支持glTF/GLB格式)的MCP服务器,提供模型分析、格式转换、压缩和纹理优化等功能