英伟达发布Lyra2.0系统,通过单张照片即可生成延伸90米的大规模、高连贯性3D虚拟环境,解决了长距离相机路径下的图像失真问题。该技术突破标志着AI在3D空间理解与实时环境模拟领域取得重要进展,尤其满足了具身智能训练对高质量虚拟场景的迫切需求。
阿里巴巴正将AI技术融入本地生活服务,计划推出基于AI的3D图像生成功能。该服务由高德地图与阿里本地服务事业群联合推出,旨在帮助餐饮商家通过上传少量照片或视频,自动生成高保真的3D店铺展示,从而降低线上营销成本,提升竞争力。此举被视为阿里在本地生活领域挑战美团的关键策略之一。
南洋理工大学与上海人工智能实验室联合推出开源框架PhysX-Anything,仅需单张RGB图像即可生成包含几何、关节和物理参数的完整3D资产,可直接用于机器人训练。技术亮点包括:由粗到细的流程,先预测整体物理属性再细化部件;新型压缩3D表示方法,避免视觉优先导致的物理失真。
李飞飞World Labs推出Marble 3D世界模型公测版,支持文本、图像、视频等多模态输入,快速生成可交互虚拟宇宙,助力开发者探索AI技术应用。
Spell 是一个 AI 模型,可从图像生成 3D 世界,支持多种渲染技术。
3D高斯生成技术,实现任意未摆姿势图像的3D重建
从单张图片生成高质量3D视图和新颖视角的3D生成技术
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
multimodalart
FLUX.1-dev是一个基于通量模型的文本生成图像模型,支持LoRA技术和扩散模型架构,专注于生成等距视角的3D图标。
strangerzonehf
基于LoRA技术的文本生成图像扩散模型,专门用于生成3D风格的卡通人偶图像
Kai422kx
DAS3R是一种用于静态场景重建的3D模型,采用动态感知高斯泼溅技术,能够从图像生成高质量的3D重建效果。
基于LoRA技术的文本生成图像扩散模型,专注于高精度3D风格人物肖像生成
基于3DXL技术的LoRA模型,专注于生成高质量的3D渲染风格角色图像
renderartist
基于AI生成图像训练的3D玩具设计模型,融合了SECourses的3D LoRA与填色书Flux LoRA技术
prithivMLmods
这是一个基于稳定扩散技术的LoRA模型,专注于生成皮克斯风格的3D卡通图像。
second-state
一个基于稳定扩散技术的3D动画风格文本生成图像模型,支持生成迪士尼、动漫风格的3D图像。
digiplay
RealCartoon3D 是一个基于稳定扩散技术的文本到图像生成模型,专注于生成具有3D卡通风格的图像。