ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
Meta收购AI可穿戴设备公司Limitless,其智能吊坠支持语音交互、实时录音转录和语音搜索,旨在提升用户专注力和记忆力。Limitless团队将加入Meta开发下一代AI硬件,此前Meta已进行战略调整。
阿里巴巴推出首款自研AI眼镜S1,内置5颗高性能麦克风和1颗骨传导麦克风,能精准识别轻声指令,在嘈杂环境中也能轻松唤醒AI助理。
豆包输入法今日上线小米商店,但暂因维护无法下载。其核心亮点是搭载与豆包App同源的语音技术,支持方言、纯英文及中英混合输入,并优化轻声说话功能,适应多种交互环境。
Step-Audio是一个开源智能语音交互框架,支持多语言对话、情感语调和语音克隆等功能。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。
实时语音交互的人工智能对话系统。
让应用通过语音与文本的转换实现智能交互。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$105
$525
200
$7
$35
Google
$2.1
$17.5
$0.7
Alibaba
$2
$20
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
128
$0.15
$1.5
256
Xai
$1.4
$10.5
$1.75
$14
400
Tencent
24
32
$2.4
$12
8
AllVoiceLab官方MCP服务器,支持文本转语音、视频翻译等强大API交互,为多款客户端提供语音生成、视频翻译及智能变声服务。
Hume MCP服务器是一个AI协作工具,允许用户通过MCP客户端应用(如Claude Desktop、Cursor等)使用Octave文本转语音技术,实现智能语音合成与交互。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。