李飞飞World Labs推出Marble 3D世界模型公测版,支持文本、图像、视频等多模态输入,快速生成可交互虚拟宇宙,助力开发者探索AI技术应用。
智元机器人开源全球首个基于ViLLA架构的具身智能模型GO-1,旨在降低技术门槛,推动开发者参与应用。该模型结合视觉、语言与潜在动作,提升机器人环境理解能力。此前已发布AgiBot World百万真机数据集,共同促进具身智能发展。
腾讯AI团队Hunyuan最新开源3D世界模型HunyuanWorld-Voyager登顶WorldScore榜单,凭借卓越的相机控制、内容对齐和3D一致性表现超越竞品。该模型具备原生3D重建能力,支持单张图像生成点云,为3D重建、深度估计等应用带来突破性进展。
南洋理工大学等机构联合开源"WORLDMEM"长记忆世界模型,突破传统方法限制,通过创新记忆机制存储场景信息,实现虚拟环境中长期一致性。模型采用条件扩散变换器架构,支持动态更新记忆库,确保场景连贯性,并能响应动作指令。该技术显著提升虚拟现实体验,为未来应用提供支持。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
-
Anthropic
$7
$35
200
Google
$2.1
$17.5
$21
$105
Alibaba
$3.9
$15.2
64
Bytedance
Baidu
32
Tencent
$0.63
$3.15
131
$15
24
Iflytek
$2
$2.4
$12
8
$0.8
一个基于FastAPI的Hello World应用,包含基础API接口和OpenAI集成功能,支持本地和Docker部署。