OpenAI正加速研发音频AI模型,为语音优先智能硬件做准备。近期整合多个团队,集中提升语音交互技术,以改善对话表现和响应能力。目前语音模型在准确性和速度上仍落后于文本模型,因此正加速架构升级,开发新一代音频模型。
OpenAI正整合团队,加速研发音频AI技术,以提升语音模型的对话表现和响应速度,为即将推出的语音优先智能设备做准备。
OpenAI正整合团队重构音频AI系统,计划2026年推出音频优先设备,押注语音交互成为后屏幕时代核心。
微信输入法iOS版升级至3.0.0,核心转向语音优先交互。新版重构语音输入,底层大模型全面升级,提升识别速度与准确度,并加强实用性、语言覆盖和隐私保护。最大亮点是新增对15种中国方言的深度支持,如粤语等。
Whisp是语音优先的应用构建器,几秒内将语音想法转化为应用
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Alibaba
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
-
Bytedance
$0.8
$2
128
Tencent
32
$2.4
$12
8
$3
$9
$1.6
$10
$1.5
$21
$105
Openai
$10.5
16
Chatglm
Baidu