夸克AI眼镜于12月31日完成首次OTA升级,新增录音纪要、图文备忘录、多意图理解与执行、蓝环支付及社区服务五大功能,并对翻译、行程查询等既有功能进行优化。通过自研语音增强模型与硬件配置,其录音功能现支持十米范围清晰收音与有效降噪。
ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
理想汽车发布AI眼镜Livis,搭载自研AI助手“理想同学”,支持语音交互、实时翻译等功能,售价1999元起。
Meta公司宣布为Facebook和Instagram全球用户推出AI语音翻译功能,支持视频内容多语言翻译,帮助创作者扩大受众范围,促进跨文化交流。该功能已在所有Meta AI服务市场同步上线,标志着其在多语言内容创作领域的技术突破。
Pinch 是一款支持 30 多种语言的实时 AI 语音翻译工具,专为视频通话和网络研讨会设计。
全能AI助手,提供语音识别、字幕翻译、文档速读等功能
提供视频翻译、换 脸、语音克隆等 AI 技术,快速制作本地化营销视频
AI语音转录、翻译和TTS的Gradio Web-UI
Google
$2.1
Input tokens/M
$17.5
Output tokens/M
1k
Context Length
$0.7
$2.8
Alibaba
-
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$15.8
$12.7
$0.8
$2
128
FreedomIntelligence
Soundwave是一款突破语音与文本界限的语音转文本模型,仅通过1万小时数据训练就在语音翻译和AIR-Bench语音任务中展现出卓越性能。