广汽本田P7推送智导互联4.2.2系统OTA升级,核心亮点是全面集成AI大模型,新增“声音复刻”功能。AI大模型提升了座舱交互能力,例如可自动生成旅行攻略,标志着本田在华纯电车型进入大模型驱动新阶段。
阿里通义实验室推出Fun-CosyVoice3.5和Fun-AudioGen-VD两款语音生成模型,支持“FreeStyle”指令,用户通过自然语言描述即可控制声音风格或构建音频场景。Fun-CosyVoice3.5专注于多语种复刻与精细化控制,是CosyVoice的升级版。
快手Kling 2.6版本推出语音与动作控制两大功能,实现原生音频生成并提升复杂动作处理精度。语音控制可生成匹配视频的音效、人声和音乐,支持个性化声音定制。
ElevenLabs推出“标志性声音市场”,企业可授权AI生成的名人声音,涵盖在世明星迈克尔·凯恩、丽莎·明内利及历史人物约翰·韦恩、朱迪·加兰等,通过档案录音重建声音。
全球技术领先的AI数字人创作平台,快速复刻形象和声音,高效创作视频。
高效化的轻量级音色定制方案
Baidu
-
Input tokens/M
Output tokens/M
Context Length