高德于6月8日发布全球首个3D原生城市世界模型ABot-Earth0.5,实现空间智能技术在城市级三维重建的重大突破。该模型覆盖190多个国家和地区,建成全球最广3D地图。作为自动化“数字工厂”,它大幅提升三维数据生产效率,用户输入卫星图像或文字描述后,系统10分钟内即可生成相应模型。
3D生成AI领域迎来重大突破,Hyper3D发布Rodin Gen-2.5模型,号称全球最强。该模型实现4秒生成百万面模型,并首次达到千万面级3D生成,细节可呈现毛孔和皮肤微结构。其核心创新是引入自适应思考努力机制,根据任务复杂度动态调整计算资源,标志着AI3D从“能看”迈向“能用”阶段。
Adobe发布Photoshop和Lightroom重大更新,将生成式AI扩展至3D空间处理。核心亮点是“旋转对象”工具,允许用户在3D空间中实时旋转、倾斜或翻转2D素材,自动调整透视角度和环境视觉逻辑,显著提升合成创作效率与效果。
蚂蚁灵光App上线“体验世界模型”功能,成为业界首个移动端AGI产品。用户上传一张图片,即可在手机上最长60秒探索3D世界,支持手游式视角操控,从触发到探索仅需秒级。这是业内首次在端侧实现世界模型,具备分钟级长时一致性与实时交互能力。
快速生成 2D 平面图和 3D 模型的 AI 工具。
Vismint的AI 3D模型生成器,可将图像转换为多种格式3D模型
Pixal3D是像素对齐AI 3D生成器,支持图转3D和文本生成动画
一款集成在Blender中的AI插件,可通过文本描述直接生成高质量、拓扑结构清晰的3D模型。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
HIT-TMG
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全开源全模态模型,采用全模态 3D RoPE 和动态容量专家混合架构,显著提升了以语言为中心的多模态理解、推理和生成能力。该版本集成了全模态理解以及音频和图像生成能力。
GatorBarbarian
TRELLIS Text XL是一个大型3D生成模型,是TRELLIS的文本条件版本,模型大小为XL。该模型基于论文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能够根据文本描述生成高质量的3D内容。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的关键组件,是一个基于语义图像条件化的ControlNet模型。它能够根据文本描述生成2D图像,同时严格遵循输入语义图像的布局约束,主要用于3D室内场景合成。
lhjiang
AnySplat是一种先进的3D高斯散点渲染模型,能够从不同视角的图像高效生成高质量的3D场景。该模型具有快速推理能力和良好的泛化性能,为3D重建和渲染提供了创新的解决方案。
tencent
混元3D-2是一款支持图像到3D、文本到3D转换的工具,为3D内容生成提供了强大的解决方案。
shakamone
TRELLIS是一个基于图像条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D生成。
davidleiva4999
TRELLIS的文本条件版本,采用XL大模型规模,是一款强大的3D生成模型。
ImrozeAslamMalik
LGM是一个整合了多视角扩散模型的图像转3D工作流,能够从单张图像生成高质量3D内容。
ImrozeAslam
混元3D 2.0是一个先进的大规模3D合成系统,用于生成高分辨率带纹理的3D资产。
Surn
TRELLIS图像条件版本是一个大型3D生成模型,能够从图像生成3D内容。
larsquaedvlieg
TRELLIS是一个基于文本条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS是一个大型3D生成模型,通过结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS文本XL模型是一个大型3D生成模型,能够根据文本描述生成3D内容。
multimodalart
FLUX.1-dev是一个基于通量模型的文本生成图像模型,支持LoRA技术和扩散模型架构,专注于生成等距视角的3D图标。
MonsterMMORPG
TRELLIS图像条件版本是一个大型3D生成模型,能够根据输入的2D图像生成对应的3D模型。
jetx
TRELLIS的条件图像版本,一个大型3D生成模型,能够从2D图像生成3D内容。
gordon-0115
一个实验性的自然语言到3D模型生成流程,基于改进的预训练多视角扩散模型
Borcherding
基于FLUX.1-dev模型的LoRA适配器,专为生成标志、图标和表情符号设计,支持微软FluentUI风格等多种3D渲染效果。
kvuong2711
AerialMegaDepth是一个专注于空地重建与视角合成的深度学习模型,能够从航拍图像中重建3D场景并生成新视角。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口项目,支持通过自然语言生成3D资产并导入Blender。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口工具,支持通过自然语言生成3D资产并导入Blender。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
一个利用AI生成游戏资源的工具,支持2D和3D资源创建,集成Hugging Face和MCP协议。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的工具,支持多视角重建和远程处理。
Unity AI ProBuilder是一个基于MCP协议的AI驱动3D建模工具,通过自然语言命令在Unity编辑器中创建和编辑可编辑网格,支持快速原型设计和程序化几何生成。
GH_mcp_server是一个通过LLMs直接与Rhino和Grasshopper交互的工具,支持分析3dm文件、3D建模及自动生成GHPython代码。
VGGT-MPS是基于苹果芯片优化的3D视觉重建工具,使用Metal Performance Shaders加速,能够从单张或多张图像生成深度图、相机姿态和3D点云,支持稀疏注意力实现城市级重建。
一个基于OpenSCAD的MCP服务器,通过AI生成多视角图像并重建为参数化3D模型,支持远程CUDA加速处理。
GH_mcp_server是一个通过LLM直接与Rhino和Grasshopper交互的工具,支持分析3DM文件、3D建模及自动生成Grasshopper的GHPython代码。
游戏资产生成器利用AI模型和MCP协议,通过文本提示快速生成2D和3D游戏资源。
Trellis MCP是一个连接AI助手与Trellis 3D生成模型的接口服务,支持通过自然语言快速生成3D资产并导入Blender。该项目基于开源模型,需自行部署API后端,具有快速、免费的特点,但存在稳定性风险。
SMMS项目构建了一个基于语义地图的MCP服务器,提供3D实例对象管理功能,包括数据库操作、RAG检索和认知拓扑图生成。
该项目是一个连接Claude桌面应用与Unreal Engine 5.3的Python服务器,通过文本指令实现3D场景的创建与编辑,支持基础物体生成、蓝图调用和场景操作等功能。
一个基于Model Context Protocol的交互式数据可视化服务器,提供关系图、散点图、3D可视化等多种图表生成功能,支持自动保存和实时显示。
MCP STL 3D浮雕生成器是一个将2D图像转换为3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反转等功能,适合3D打印和渲染。
TRELLIS Blender插件将先进的文本/图像生成3D模型功能集成到Blender中,支持通过文本或图像生成带纹理的3D网格,并提供细节调整功能。插件还集成了MCP服务,可与Cursor/Windsurf等工具通信。
Poly.Pizza MCP服务器是一个将免费低多边形3D模型直接导入Unity项目的工具,支持模型搜索、批量导入、自动生成预制体和记录版权信息。
Meshy AI MCP服务器是一个用于与Meshy AI API交互的模型上下文协议服务器,提供从文本和图像生成3D模型、应用纹理、重新网格化模型等功能。
一个结合3D卡通图像生成与文件系统管理的专业服务器,提供基于Gemini AI的高质量3D卡通生成和安全的文件操作功能。