Meta AI推出SAM3D模型,包含通用物体和人体专用两套权重。仅需单张2D照片即可生成带纹理、材质和几何一致性的3D资产,效果优于现有主流方案。该模型通过联合编码空间位置与语义信息,预测像素的3D坐标和表面法向,具备物理正确性,可直接应用于AR/VR、机器人和影视制作等领域。
李飞飞World Labs推出Marble 3D世界模型公测版,支持文本、图像、视频等多模态输入,快速生成可交互虚拟宇宙,助力开发者探索AI技术应用。
知名AI专家李飞飞的World Labs推出Marble3D世界模型公测版,支持文本、图像、视频或3D布局直接生成完整可导航的3D虚拟世界。用户可实时交互编辑,并导出高斯溅射、三角网格或视频格式。此次公测标志着该产品从实验室概念转向实用工具。
人工智能专家李飞飞联合创办的World Labs推出首款商业化世界模型Marble,支持文本、图片、视频及3D布局生成可编辑3D环境。产品提供免费增值和付费订阅,适用于游戏、影视、VR等领域。距公司完成2.3亿美元融资仅一年多,展现快速发展势头。
Meta的单图像3D重建模型,融合SAM 3分割与几何纹理布局预测生成3D资产
通过 AI 设计代理快速生成专业图像、视频和 3D 模型。
腾讯混元3D驱动的图片转3D与STL转换器,快速生成高精度3D模型
Hitem3D是由AI驱动的下一代3D模型生成器,速度快且精度高。
tencent
$18
输入tokens/百万
输出tokens/百万
32k
上下文长度
GatorBarbarian
TRELLIS Text XL是一个大型3D生成模型,是TRELLIS的文本条件版本,模型大小为XL。该模型基于论文《Structured 3D Latents for Scalable and Versatile 3D Generation》提出,能够根据文本描述生成高质量的3D内容。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
manycore-research
FLUX.1-Layout-ControlNet是SpatialGen框架的关键组件,是一个基于语义图像条件化的ControlNet模型。它能够根据文本描述生成2D图像,同时严格遵循输入语义图像的布局约束,主要用于3D室内场景合成。
lhjiang
AnySplat是一种先进的3D高斯散点渲染模型,能够从不同视角的图像高效生成高质量的3D场景。该模型具有快速推理能力和良好的泛化性能,为3D重建和渲染提供了创新的解决方案。
shakamone
TRELLIS是一个基于图像条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D生成。
davidleiva4999
TRELLIS的文本条件版本,采用XL大模型规模,是一款强大的3D生成模型。
ImrozeAslamMalik
LGM是一个整合了多视角扩散模型的图像转3D工作流,能够从单张图像生成高质量3D内容。
Surn
TRELLIS图像条件版本是一个大型3D生成模型,能够从图像生成3D内容。
larsquaedvlieg
TRELLIS是一个基于文本条件的大型3D生成模型,采用结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS是一个大型3D生成模型,通过结构化3D潜变量实现可扩展与多功能的3D内容生成。
TRELLIS文本XL模型是一个大型3D生成模型,能够根据文本描述生成3D内容。
multimodalart
FLUX.1-dev是一个基于通量模型的文本生成图像模型,支持LoRA技术和扩散模型架构,专注于生成等距视角的3D图标。
MonsterMMORPG
TRELLIS图像条件版本是一个大型3D生成模型,能够根据输入的2D图像生成对应的3D模型。
jetx
TRELLIS的条件图像版本,一个大型3D生成模型,能够从2D图像生成3D内容。
gordon-0115
一个实验性的自然语言到3D模型生成流程,基于改进的预训练多视角扩散模型
Borcherding
基于FLUX.1-dev模型的LoRA适配器,专为生成标志、图标和表情符号设计,支持微软FluentUI风格等多种3D渲染效果。
kvuong2711
AerialMegaDepth是一个专注于空地重建与视角合成的深度学习模型,能够从航拍图像中重建3D场景并生成新视角。
VAST-AI
TripoSG-scribble 是一个基于涂鸦图像和文本提示快速生成3D模型的AI工具,是TripoSG的变体,适用于创意设计和快速原型构建。
cavargas10
基于文本条件的大型3D生成模型,采用XL规模架构,能够根据文本描述生成3D内容
Yntec
C3是一个基于Stable Diffusion 1.5的文本生成图像模型,专注于生成高质量的角色、风景和3D图像。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的工具,支持多视角重建和远程处理。
一个基于OpenSCAD的MCP服务器,通过AI生成多视角图像并重建为参数化3D模型,支持远程CUDA加速处理。
Trellis MCP是一个连接AI助手与Trellis 3D生成模型的接口服务,支持通过自然语言快速生成3D资产并导入Blender。该项目基于开源模型,需自行部署API后端,具有快速、免费的特点,但存在稳定性风险。
游戏资产生成器利用AI模型和MCP协议,通过文本提示快速生成2D和3D游戏资源。
MCP STL 3D浮雕生成器是一个将2D图像转换为3D浮雕模型的工具,支持控制模型尺寸、添加基座和深度反转等功能,适合3D打印和渲染。
TRELLIS Blender插件将先进的文本/图像生成3D模型功能集成到Blender中,支持通过文本或图像生成带纹理的3D网格,并提供细节调整功能。插件还集成了MCP服务,可与Cursor/Windsurf等工具通信。
Meshy AI MCP服务器是一个用于与Meshy AI API交互的模型上下文协议服务器,提供从文本和图像生成3D模型、应用纹理、重新网格化模型等功能。