ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
谷歌翻译应用测试版新增实时语音翻译功能,用户佩戴任意耳机即可听到保留原说话者语气、重音与语调的精准翻译,将普通耳机变为单向同声传译设备。该功能旨在满足国外听讲座、与当地人交流等真实场景下的深层语言需求。
理想汽车发布AI眼镜Livis,搭载自研AI助手“理想同学”,支持语音交互、实时翻译等功能,售价1999元起。
通义千问发布Qwen3-LiveTranslate-Flash多语言实时音视频翻译系统,支持18种主流语言及多种方言的离线和实时翻译。其核心创新是视觉上下文增强技术,不仅能听懂语音,还能结合视觉信息提升翻译准确性,为跨语言交流带来突破性进展。
Pinch 是一款支持 30 多种语言的实时 AI 语音翻译工具,专为视频通话和网络研讨会设计。
DuRT 是一款 macOS 上的实时语音识别和翻译软件,致力于提供高效、准确的语音处理服务。
Hibiki 是一款用于流式语音翻译(即同声传译)的模型,能够实时逐块生成正确翻译。
全球领先的实时语音翻译耳机,助力跨语言沟通
Anthropic
$7
Input tokens/M
$35
Output tokens/M
200
Context Length
Google
$2.1
$17.5
1k
$0.7
$2.8
Alibaba
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$15.8
$12.7
-
$0.8
$2
128
$1.95
16
$1.8
$5.4
Tencent
32
$2.4
$12
8
$1.6
$10
$1
$3
Xai
$21
$105