Mugen3D模型利用3D高斯溅射技术,仅凭单张图片即可生成高保真3D模型,大幅降低3D内容创作门槛。其核心突破在于对物体纹理、光影和材质的精准还原,为AI与图形学领域带来新的发展范式。
Meta AI推出SAM3D模型,包含通用物体和人体专用两套权重。仅需单张2D照片即可生成带纹理、材质和几何一致性的3D资产,效果优于现有主流方案。该模型通过联合编码空间位置与语义信息,预测像素的3D坐标和表面法向,具备物理正确性,可直接应用于AR/VR、机器人和影视制作等领域。
李飞飞团队推出RTFM模型,实现3D世界实时生成与交互,在单个H100 GPU上保持持久性和3D一致性,确保几何、物体位置及外观稳定,支持反射、阴影等效果,推动技术从概念走向实用。
腾讯发布全球首个开源3D世界生成模型"混元3D 1.0",支持360°高精度场景生成和可交互漫游功能。该模型通过AI技术大幅降低3D创作门槛,单张图片或文字即可快速生成沉浸式场景,每日提供20次免费体验。其开源特性赋能全球开发者,适用于游戏、VR、影视等多领域,GitHub星标超1.2万。该技术将3D生成从"物体级"推向"世界级",重构内容生产流程,未来有望推动游戏、数字孪生等领域的创新发展。
3D场景重建与动态物体追踪技术
基于预训练的文本到图像模型生成高质量、多视角一致的3D物体图像。
Champ:一种用于生成 3D 物体形状的生成模型
提供创新的3D家具可视化软件,提升客户的购物体验。
Tencent
-
输入tokens/百万
输出tokens/百万
24
上下文长度
$0.8
$2
32
Chatglm
finetrainers
基于THUDM/CogVideoX-5b模型在3dgs-dissolve数据集上微调的文本生成视频模型,专注于3D物体溶解与火花特效生成
strangerzonehf
基于LoRA微调的文本生成图像扩散模型,专注于生成等轴测3D风格的场景和物体
该项目是一个连接Claude桌面应用与Unreal Engine 5.3的Python服务器,通过文本指令实现3D场景的创建与编辑,支持基础物体生成、蓝图调用和场景操作等功能。