Soul AI Lab 开源了首个14亿参数的实时数字人生成模型SoulXFlashTalk,具备亚秒级延迟和每秒32帧高帧率,提供完整实时交互解决方案。开源内容包括项目页面、技术报告、源代码和模型权重,全面开放,降低行业研发门槛。
LPM1.0模型发布,能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理,可同步整合文本、音频与图像,生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI,将传统语音对话升级为具备视觉反馈的实时交互。
蚂蚁阿福App升级推出“长辈模式”,界面字体图标更大,默认语音交互,支持直接电话咨询健康问题。同时保留多方言提问功能,并新增三种数字人形象自定义选项,未来将提供更多选择。
钉钉与小冰公司联合发布AI前台Hi1,通过“AI硬件+数字员工”模式,以“会看、会听、答得准”的交互能力,解决传统前台重复工作多、非工作时间无人值守、服务标准不一及数据缺失等问题,重新定义企业接待服务标准,释放人力价值。
NVIDIA ACE是一套用于创建数字人类、AI非玩家角色和交互式头像的生成式AI技术套件。
赛灵力虚拟数字人工厂提供 AI 虚拟人视频创作服务,让数字人拥有真人般交互能力。
Anthropic
$105
Input tokens/M
$525
Output tokens/M
200
Context Length
Google
$2.1
$17.5
1k
$0.7
$2.8
Alibaba
$2
$20
-
$3.9
$15.2
64
Bytedance
$0.8
128
$0.15
$1.5
256
Baidu
$1.6
$4
$0.75
Openai
$0.35
400
Tencent
24
$16
$3.5
$12
$2.4
8
32
Xai
$21
Iflytek
$3
$9