字节豆包语音模型和视觉模型再升级 综合能力提升20.3%
在2024年8月21日的火山引擎AI创新巡展上海站上,火山引擎展示了豆包大模型的全面升级,包括豆包·文生图模型对长文本有更精准的图文匹配能力,豆包·语音识别模型在多个公开测试集中的错误率最高降低40%,以及豆包·语音合成模型升级了流式语音合成能力,能够实时响应、精准断句。火山引擎还发布了对话式AI实时交互解决方案,整合豆包大模型和实时音视频技术,提供端到端的大模型实时对话方案,让AI交互体验更强。此外,火山引擎与多点DMALL联合成立零售大模型生态联盟,与汽车大模型生态联盟增加新成员,旨在推动零售和汽车行业的智能化升级。