ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
谷歌Gemini2.5Flash Native Audio更新显著提升语音助手功能,能更准确处理复杂指令,使对话更自然流畅。开发者指令遵循率从84%提升至90%,多步骤对话质量也明显改善。
豆包手机助手与中兴合作推出nubia M153工程机,具备跨应用语音操作功能,引发抢购热潮。官方称首批备货已无法满足需求。
中兴通讯与字节跳动豆包团队合作推出“豆包手机助手”,通过nubia M153工程样机侧边独立AI键,实现无需解锁、无需App即可语音唤醒豆包大模型,支持跨平台比价、日程创建等功能。该合作推动中兴通讯股价创三年新高。
GeminiGen AI是一款先进的AI内容生成平台,提供AI生成的图像、视频和语音。
语音AI助手,清理收件箱,规划日程,轻松完成任务。
AI语音助手,提供网站上的实时对话支持和线索转化。
管理Gmail的最佳AI助手,通过语音命令无需触摸即可管理收件箱。
Anthropic
$7
输入tokens/百万
$35
输出tokens/百万
200
上下文长度
Alibaba
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
$2
128
Iflytek
$2.4
$12
8
Tencent
32
$0.3
$3
$9
$1.6
$10
$21
$105
$1.5
Xai
Openai
$3.5
$10.5
16
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
WillHeld
DiVA Llama 3是一个端到端的语音助手模型,能够处理语音和文本输入,采用蒸馏损失进行训练。
SystemPrompt Coding Agent 是一个开源项目,将本地工作站转变为可通过MCP协议远程控制的AI编程助手,支持语音命令和移动端操作,实现异地编程管理。
这是一个基于Node.js的MCP服务器项目,通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成,提供文本转语音功能。
一个通过逆向工程实现Alexa语音助手MCP服务器的项目,利用拦截Android应用流量发现的非官方API端点。
Jarvis MCP是一个基于浏览器的语音对话工具,让用户能通过麦克风与AI助手进行自然语音对话,支持30多种语言识别和远程访问,无需额外安装软件或API密钥。
Voice Mode是一个为AI助手提供自然语音对话功能的工具,支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。
Vapi MCP服务器是一个通过函数调用集成Vapi API的工具,支持通过Claude Desktop进行语音助手调用和预约管理。
一个为AivisSpeech文本转语音引擎设计的MCP服务器,支持日语语音合成、多角色声音选择和参数配置,实现与AI助手的无缝集成。
该项目实现了一个Vapi语音AI与Cursor编辑器集成的MCP服务器,提供语音呼叫、助手管理等功能。
一个基于MCP协议的语音通话服务器,集成Twilio和OpenAI技术,实现AI助手发起和管理实时语音通话。
一个基于MCP协议的AI语音呼叫系统,通过VoIP技术让Claude等AI助手能够自动拨打电话并进行智能对话,支持多种SIP协议和音频编解码器。
Vapi MCP服务器项目通过Model Context Protocol协议提供与Vapi API的集成功能,支持语音助手管理、电话呼叫调度等功能,并兼容Claude Desktop客户端和远程SSE连接。
一个为macOS提供全面音频播放功能的MCP服务器,支持系统声音、文本转语音和自定义音频文件播放,适用于AI助手等MCP客户端。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。
MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器,提供高级音频转录、格式转换、批量处理和文本转语音等功能,通过Model Context Protocol标准实现与AI助手的无缝交互。
一个基于MCP协议的语音通话服务器,整合Twilio和OpenAI技术,实现AI助手发起和管理实时语音通话,支持多语言切换和预设场景模板。
一个基于FastAPI的后端项目,集成ElevenLabs MCP协议,创建能够通过语音电话提供友好、无术语技术新闻更新的AI助手。
AivisSpeech的MCP协议服务器实现,提供与AivisSpeech Engine的接口,支持AI助手的语音合成功能。
基于Twilio和OpenAI的语音通话MCP服务器,实现AI助手发起和管理实时语音通话
Vavicky MCP服务器是一个完整的语音AI代理平台实现,提供用户管理、API密钥配置、助手管理、Twilio集成和通信功能,支持通过Claude桌面客户端进行交互。
一个提供统一接口控制Spotify播放的媒体控制协议服务器,支持REST API、AI助手和语音控制