DuckDuckGo推出AI聊天机器人Duck.ai的实时语音功能,强调隐私优先。该功能通过加密通道与用户对话,确保语音数据不被监听或滥用。采用“中间人”模式平衡智能体验与数据安全。
Salesforce推出基于Claude模型的Slack AI助手,深度集成于平台,打破信息壁垒。它能实时搜索Slack对话与文件,并连接Salesforce、Google Drive等多平台数据,利用上下文信息辅助会议准备和内容创建。
ElevenLabs的AI语音智能体深度集成WhatsApp,支持文字与语音双模交互。用户可通过文字聊天或直接拨打WhatsApp语音电话,与拥有逼真人声的AI助理实时对话。企业可便捷部署具备多语言、情感识别、实时翻译等能力的AI语音助手,重构客服体验。
谷歌升级Gemini2.5Flash音频模型,实现AI拟人化实时交流。新模型能直接处理声音中的语调、情感和停顿,无需先转文字,使对话更自然流畅。
Kael是支持文件上传和实时流式响应的AI对话助手,助力研究工作。
由ElevenLabs对话式AI驱动,可与圣诞老人实时对话的互动体验。
实时AI会议助手,助你理解对话、学习知识,适用于个人和组织。
AI语音助手,提供网站上的实时对话支持和线索转化。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
$8
$240
52
Bytedance
$1.2
$3.6
4
nineninesix
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,采用两阶段管道结合大型语言模型和高效音频编解码器,实现卓越的速度和音频质量。该模型支持西班牙语,具有4亿参数,采样率为22kHz。
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
LiquidAI
LFM2-Audio-1.5B是Liquid AI推出的首个端到端音频基础模型,专为低延迟和实时对话设计。该模型仅15亿参数,能够实现无缝的对话交互,其能力可与参数规模大得多的模型相媲美。
MCP是一个基于客户端-服务器架构的AI聊天系统,支持通过多种专用服务器(文件系统、Slack、Brave搜索)扩展Claude AI的功能,使其能智能访问本地文件、Slack对话和实时网络信息。
一个轻量级的桥梁服务,使Claude AI能够实时搜索网络。该项目基于Flask服务器,集成了Claude的高级能力和DuckDuckGo搜索,允许AI在对话中获取实时信息。
TestingBot官方MCP服务器,使AI助手能够通过对话界面管理TestingBot的测试基础设施,包括实时测试、浏览器设备管理、测试管理、存储管理、截图测试、构建管理、用户团队管理、CDP会话和隧道管理等功能。
一个现代化的MCP服务器实现,支持多AI提供商、实时响应、对话管理和监控功能,采用微服务架构。
MCP是一个智能对话平台服务器,提供基于角色的AI顾问服务,支持多LLM供应商、语义记忆管理和实时流式响应,适用于商业咨询和技术支持等场景。