Artificial Analysis发布语音转文字基准测试2.0版,ElevenLabs与谷歌表现突出。其中ElevenLabs的Scribe v2以2.3%的词错率领先,谷歌Gemini3Pro以2.9%紧随其后,且谷歌未对转录任务进行专门训练。
ElevenLabs完成5亿美元D轮融资,估值达110亿美元,成为全球最高估值AI语音服务商。本轮由红杉资本领投,a16z、ICONIQ Capital等跟投,显示资本市场对语音AI及该公司企业级业务增长的高度认可。
ElevenLabs完成5亿美元融资,由红杉资本领投,估值飙升至110亿美元,较年初增长超三倍。红杉合伙人将加入董事会,现有股东跟投。这反映了资本市场对语音AI领域的高度认可。
音频公司ElevenLabs与多位知名音乐人合作推出新专辑,探索AI技术在音乐创作中的应用与版权边界。
由ElevenLabs对话式AI驱动,可与圣诞老人实时对话的互动体验。
Scribe 是全球最准确的语音转文字模型,支持99种语言。
一个用于将书籍转为有声读物、剧本转为播客的音频生成平台。
快速生成类人语音的TTS模型
ElevenLabs官方MCP服务器,提供文本转语音和音频处理API交互能力
该项目提供了一套开发工具集,包含AI辅助模板和实用脚本,用于提升开发效率和项目管理规范性。
ElevenLabs文本转语音MCP服务
一个基于FastAPI的后端项目,集成ElevenLabs MCP协议,创建能够通过语音电话提供友好、无术语技术新闻更新的AI助手。
一个基于ElevenLabs Scribe语音转文字API的MCP服务器实现,提供实时转录、文件转录、上下文管理和双向流式通信功能。
一个结合Claude和ElevenLabs的WhatsApp语音消息生成与发送服务
该项目使用Google ADK和ElevenLabs MCP服务器构建了一个文本转语音(TTS)的智能体,通过uvx连接实现语音合成功能。
一个集成ElevenLabs文本转语音API的MCP服务,包含服务器组件和示例客户端,支持多语音生成、脚本管理和历史存储功能。
一个连接Claude AI与ElevenLabs的语音对话服务器