腾讯混元自主研发ASR语音识别大模型接入ima平台
7月22日,腾讯混元宣布其自主研发的ASR(语音识别)大模型正式应用于ima平台,首次在手机App端实现了语音输入功能,为用户带来了“出口成章”的便捷体验。用户现在可以通过语音直接输入问题或记录灵感,无需手动敲击键盘,极大地提升了输入效率。
腾讯混元ASR大模型以其敏锐的听觉和智能的理解能力脱颖而出,在复杂环境下依然能够准确识别语音,每分钟可识别300字,速度比手动输入快4倍,且识别结果更加精准自然。该模型采用业界首个基于双编码器的流式ASR架构,相比传统ASR技术,在语义理解能力上有了显著提升,尤其在中英文混杂等场景中表现更为出色。