腾讯搜狗输入法发布20.0版本,宣布全面AI化,从工具升级为智能助手。新版本基于大模型重塑交互逻辑,在语音、打字、翻译三大高频场景实现底层技术升级,核心提升在于更准、更快、更聪明。
腾讯搜狗输入法发布20.0.0纪念版,全面AI化升级。依托腾讯混元大模型,重点提升AI语音、翻译和打字功能。AI语音识别延时降低40%,准确率达98%,方言识别准确率提升30%。
夸克AI眼镜于12月31日完成首次OTA升级,新增录音纪要、图文备忘录、多意图理解与执行、蓝环支付及社区服务五大功能,并对翻译、行程查询等既有功能进行优化。通过自研语音增强模型与硬件配置,其录音功能现支持十米范围清晰收音与有效降噪。
ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
专为 Mac 用户设计的 AI 语音助手,通过语音指令实现润色、翻译及自动化办公。
Pinch 是一款支持 30 多种语言的实时 AI 语音翻译工具,专为视频通话和网络研讨会设计。
全能AI助手,提供语音识别、字幕翻译、文档速读等功能
提供视频翻译、换 脸、语音克隆等 AI 技术,快速制作本地化营销视频
Google
$2.1
Input tokens/M
$17.5
Output tokens/M
1k
Context Length
$0.7
$2.8
Alibaba
-
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
$15.8
$12.7
$0.8
$2
128
FreedomIntelligence
Soundwave是一款突破语音与文本界限的语音转文本模型,仅通过1万小时数据训练就在语音翻译和AIR-Bench语音任务中展现出卓越性能。