微软开源图像转3D工具TRELLIS.2,仅需一张图片即可快速生成带材质的3D模型,输出.glb格式文件,兼容Blender、Unity等平台。该工具采用4B模型,支持512³至1536³分辨率图像处理,在NVIDIA H100显卡上,生成512³模型仅需约3秒。
拓竹科技推出“印你”3D手办生成器,基于腾讯混元3D3.0大模型,用户上传图片即可生成高质量可打印3D模型,降低定制门槛,为爱好者和新手提供便捷创作工具。
快手旗下可灵AI发布“主体库”,为O1多模态视频模型增加长期记忆功能。用户上传单张角色图,系统可生成3D视角补全和多光线变体,支持跨场景一键调用角色,主体一致性超96%。流程包括上传图片自动处理、AI补全多角度视图,实现从单图到3D记忆的转换。
快手Kling AI 2.6版本发布,首次集成音频生成功能,支持中英双语对白、歌唱与音效,实现文本、视频、音频一键同步生成。技术采用扩散变换器与3D时空联合注意力架构,提升复杂指令遵守率15%,并增强跨镜头角色一致性。视频输出保持10秒1080P高清,生成成本降低30%。
专业AI游戏素材生成器,支持从单张图片快速创建2D/3D动画及像素角色。
无需登录,用预设提示生成图像,免费试用3D图、头像等AI图像工具。
Meta的单图像3D重建模型,融合SAM 3分割与几何纹理布局预测生成3D资产
通过 AI 设计代理快速生成专业图像、视频和 3D 模型。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
HIT-TMG
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全开源全模态模型,采用全模态 3D RoPE 和动态容量专家混合架构,显著提升了以语言为中心的多模态理解、推理和生成能力。该版本集成了全模态理解以及音频和图像生成能力。
GatorBarbarian
TRELLIS Text XL是一个大型3D生成模型,是TRELLIS的文本条件版本,模型大小为XL。该模型基于论文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能够根据文本描述生成高质量的3D内容。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的关键组件,是一个基于语义图像条件化的ControlNet模型。它能够根据文本描述生成2D图像,同时严格遵循输入语义图像的布局约束,主要用于3D室内场景合成。
lhjiang
AnySplat是一种先进的3D高斯散点渲染模型,能够从不同视角的图像高效生成高质量的3D场景。该模型具有快速推理能力和良好的泛化性能,为3D重建和渲染提供了创新的解决方案。
tencent
混元3D-2是一款支持图像到3D、文本到3D转换的工具,为3D内容生成提供了强大的解决方案。
shakamone
TRELLIS是一个基于图像条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D生成。
davidleiva4999
TRELLIS的文本条件版本,采用XL大模型规模,是一款强大的3D生成模型。
ImrozeAslamMalik
LGM是一个整合了多视角扩散模型的图像转3D工作流,能够从单张图像生成高质量3D内容。
ImrozeAslam
混元3D 2.0是一个先进的大规模3D合成系统,用于生成高分辨率带纹理的3D资产。
Surn
TRELLIS图像条件版本是一个大型3D生成模型,能够从图像生成3D内容。
larsquaedvlieg
TRELLIS是一个基于文本条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS是一个大型3D生成模型,通过结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS文本XL模型是一个大型3D生成模型,能够根据文本描述生成3D内容。
multimodalart
FLUX.1-dev是一个基于通量模型的文本生成图像模型,支持LoRA技术和扩散模型架构,专注于生成等距视角的3D图标。
MonsterMMORPG
TRELLIS图像条件版本是一个大型3D生成模型,能够根据输入的2D图像生成对应的3D模型。
jetx
TRELLIS的条件图像版本,一个大型3D生成模型,能够从2D图像生成3D内容。
gordon-0115
一个实验性的自然语言到3D模型生成流程,基于改进的预训练多视角扩散模型
Borcherding
基于FLUX.1-dev模型的LoRA适配器,专为生成标志、图标和表情符号设计,支持微软FluentUI风格等多种3D渲染效果。
kvuong2711
AerialMegaDepth是一个专注于空地重建与视角合成的深度学习模型,能够从航拍图像中重建3D场景并生成新视角。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口项目,支持通过自然语言生成3D资产并导入Blender。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口工具,支持通过自然语言生成3D资产并导入Blender。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
一个利用AI生成游戏资源的工具,支持2D和3D资源创建,集成Hugging Face和MCP协议。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的工具,支持多视角重建和远程处理。
一个基于OpenSCAD的MCP服务器,通过AI生成多视角图像并重建为参数化3D模型,支持远程CUDA加速处理。
VGGT-MPS是基于苹果芯片优化的3D视觉重建工具,使用Metal Performance Shaders加速,能够从单张或多张图像生成深度图、相机姿态和3D点云,支持稀疏注意力实现城市级重建。
GH_mcp_server是一个通过LLMs直接与Rhino和Grasshopper交互的工具,支持分析3dm文件、3D建模及自动生成GHPython代码。
GH_mcp_server是一个通过LLM直接与Rhino和Grasshopper交互的工具,支持分析3DM文件、3D建模及自动生成Grasshopper的GHPython代码。
游戏资产生成器利用AI模型和MCP协议,通过文本提示快速生成2D和3D游戏资源。
Trellis MCP是一个连接AI助手与Trellis 3D生成模型的接口服务,支持通过自然语言快速生成3D资产并导入Blender。该项目基于开源模型,需自行部署API后端,具有快速、免费的特点,但存在稳定性风险。
SMMS项目构建了一个基于语义地图的MCP服务器,提供3D实例对象管理功能,包括数据库操作、RAG检索和认知拓扑图生成。
该项目是一个连接Claude桌面应用与Unreal Engine 5.3的Python服务器,通过文本指令实现3D场景的创建与编辑,支持基础物体生成、蓝图调用和场景操作等功能。
MCP STL 3D浮雕生成器是一个将2D图像转换为3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反转等功能,适合3D打印和渲染。
TRELLIS Blender插件将先进的文本/图像生成3D模型功能集成到Blender中,支持通过文本或图像生成带纹理的3D网格,并提供细节调整功能。插件还集成了MCP服务,可与Cursor/Windsurf等工具通信。
一个基于Model Context Protocol的交互式数据可视化服务器,提供关系图、散点图、3D可视化等多种图表生成功能,支持自动保存和实时显示。
Meshy AI MCP服务器是一个用于与Meshy AI API交互的模型上下文协议服务器,提供从文本和图像生成3D模型、应用纹理、重新网格化模型等功能。
该项目实现了一个MCP服务器,集成Venice AI图像生成功能,提供带审批/重新生成流程的交互式图像生成服务,并支持通过Gemini API生成多视角3D视图。
一个结合3D卡通图像生成与文件系统管理的专业服务器,提供基于Gemini AI的高质量3D卡通生成和安全的文件操作功能。