NVIDIA开源Lyra2.0框架,可从单张图像生成持久一致的大型3D场景,支持实时渲染与机器人仿真,为游戏开发和虚拟环境构建提供新工具。
英伟达发布Lyra2.0系统,通过单张照片即可生成延伸90米的大规模、高连贯性3D虚拟环境,解决了长距离相机路径下的图像失真问题。该技术突破标志着AI在3D空间理解与实时环境模拟领域取得重要进展,尤其满足了具身智能训练对高质量虚拟场景的迫切需求。
谷歌升级企业视频应用Vids,集成Veo3.1模型,实现AI虚拟形象动态交互。用户通过文字指令即可控制形象与场景互动,并保持角色一致性。更新强化了多模态整合,提升视频创作效率。
美图设计室接入视频创作大模型Seedance2.0,通过深度融合AI技术优化电商视频生产。此次升级将高精度生成能力应用于电商场景,为商家提供从产品展示、虚拟上身到种草转化的全链路视频内容解决方案,推动AI商业化落地。
AI Character Generator可从照片创建逼真虚拟角色,用于多场景内容创作。
RoomX AI利用AI 30秒虚拟布置房产,专业设计,多场景适用,价格低效果好。
全栈式虚拟人多场景应用服务
一种用于虚拟试穿任务的扩散模型,特别在真实世界场景中提高图像保真度和细节保存。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
$7.7
$30.8
200
-
Anthropic
$105
$525
Google
$0.7
$2.8
1k
$7
$35
Alibaba
$1
$10
256
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$15.8
$12.7
$0.8
martintomov
基于FLUX框架的LoRA扩散模型,专为Ray-Ban Meta智能眼镜的虚拟试戴和时尚电商场景设计
CreitinGameplays
ConvAI-9b是一个拥有90亿参数的对话式AI模型,基于Zephyr-7b-beta和Mistral-7B-v0.2融合构建,适用于聊天机器人、虚拟助手等交互场景。
PersonaLive是一个基于AI的实时肖像动画系统,支持通过摄像头实时驱动或离线视频处理生成生动的虚拟形象,适用于直播等场景。