AI语音自动化公司Vida完成400万美元A轮融资,由Trammell Venture Partners领投。其AI语音助手已处理超1亿次客户互动,成为全球企业智能语音代理核心平台。融资将用于加速产品创新、拓展行业应用,巩固全球领先地位。
百度世界大会上,小度科技发布升级版多模态AI助手“超能小度”,整合语音、视觉和空间信息,提升感知能力。该助手支持听、说及环境识别,数千万小度设备可免费升级,推动人机交互进步,让用户体验更智能生活。
谷歌宣布在Google TV上推出Gemini语音助手取代Google Assistant,这是其将Gemini整合到所有平台战略的关键一步。升级后,用户可通过更先进的AI能力以自然对话方式访问内容和功能,例如处理复杂跨情境查询,如推荐适合不同喜好的电影。
谷歌地图将整合生成式AI助手Gemini,用户可通过语音指令快速搜索目的地,提升导航便捷性。该功能未来几周将逐步覆盖支持Gemini的安卓和iOS设备。
GeminiGen AI是一款先进的AI内容生成平台,提供AI生成的图像、视频和语音。
语音AI助手,清理收件箱,规划日程,轻松完成任务。
AI语音助手,提供网站上的实时对话支持和线索转化。
管理Gmail的最佳AI助手,通过语音命令无需触摸即可管理收件箱。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
SystemPrompt Coding Agent 是一个开源项目,将本地工作站转变为可通过MCP协议远程控制的AI编程助手,支持语音命令和移动端操作,实现异地编程管理。
这是一个基于Node.js的MCP服务器项目,通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成,提供文本转语音功能。
Voice Mode是一个为AI助手提供自然语音对话功能的工具,支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。
一个为AivisSpeech文本转语音引擎设计的MCP服务器,支持日语语音合成、多角色声音选择和参数配置,实现与AI助手的无缝集成。
该项目实现了一个Vapi语音AI与Cursor编辑器集成的MCP服务器,提供语音呼叫、助手管理等功能。
一个基于MCP协议的语音通话服务器,集成Twilio和OpenAI技术,实现AI助手发起和管理实时语音通话。
一个基于MCP协议的AI语音呼叫系统,通过VoIP技术让Claude等AI助手能够自动拨打电话并进行智能对话,支持多种SIP协议和音频编解码器。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。
一个为macOS提供全面音频播放功能的MCP服务器,支持系统声音、文本转语音和自定义音频文件播放,适用于AI助手等MCP客户端。
MCP Server Whisper是一个基于OpenAI Whisper和GPT-4o模型的音频处理服务器,提供高级音频转录、格式转换、批量处理和文本转语音等功能,通过Model Context Protocol标准实现与AI助手的无缝交互。
一个基于MCP协议的语音通话服务器,整合Twilio和OpenAI技术,实现AI助手发起和管理实时语音通话,支持多语言切换和预设场景模板。
一个基于FastAPI的后端项目,集成ElevenLabs MCP协议,创建能够通过语音电话提供友好、无术语技术新闻更新的AI助手。
Vavicky MCP服务器是一个完整的语音AI代理平台实现,提供用户管理、API密钥配置、助手管理、Twilio集成和通信功能,支持通过Claude桌面客户端进行交互。
AivisSpeech的MCP协议服务器实现,提供与AivisSpeech Engine的接口,支持AI助手的语音合成功能。
基于Twilio和OpenAI的语音通话MCP服务器,实现AI助手发起和管理实时语音通话
一个提供统一接口控制Spotify播放的媒体控制协议服务器,支持REST API、AI助手和语音控制
这是一个基于Node.js的MCP服务器项目,通过Model Context Protocol实现AI助手与棒読みちゃん语音合成软件的集成,提供文本转语音功能,支持音色、音量、语速等参数调整。