谷歌搜索升级,AI概览支持追问,实现对话式搜索。用户可在AI生成的摘要中直接提问,系统无缝切换至AI模式,保持上下文,让搜索更自然、互动。
苹果计划在2026年推出iOS 27,将Siri升级为具备自然对话能力的AI聊天机器人,代号“Campos”。新版Siri将打破只能响应简单命令的限制,支持流畅的自然语言语音交流,向ChatGPT看齐。
英伟达发布PersonaPlex-7B-v1语音对话模型,突破传统AI语音助手“一问一答”模式,实现更自然的真人对话体验。该模型采用单一Transformer架构,直接完成语音理解与生成,无需传统ASR、LLM、TTS串联处理。
阿里通义千问App全面接入淘宝、支付宝等平台,推出全球首个可执行真实购物任务的AI助手。用户通过自然对话即可完成商品筛选、比价、下单与支付,全程无需跳转应用,标志着AI商业化应用迈出关键一步。
Callum是一款AI日历助手,可通过自然对话管理日程、查找时间、创建活动。
AI First是一款通过自然对话帮用户轻松完成现实任务的AI助手。
BitterBot是开源AI助理,通过自然对话轻松完成现实任务。
智能AI语音代理,自然对话,多语言支持,用于业务通话自动化。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
Guilherme34
Qwen3-32B是Qwen系列最新一代的大语言模型,具备强大的推理、指令遵循、智能体交互和多语言处理能力。它支持100多种语言和方言,能在思维模式和非思维模式间无缝切换,为用户提供自然流畅的对话体验。
nari-labs
Dia2是由Nari Labs开发的流式对话文本转语音(TTS)模型,支持实时语音生成,无需完整文本即可开始生成音频,能够根据对话上下文进行调整,实现自然流畅的对话体验。
Dia2是由Nari Labs开发的流式对话文本转语音(TTS)模型,支持实时语音生成,无需完整文本即可开始生成音频,专为自然对话场景设计。
OpenMOSS-Team
MOSS-TTSD是一个开源的双语口语对话合成模型,支持中文和英文,能够将两人对话脚本转化为自然、富有表现力的对话语音,支持语音克隆且单轮语音生成时长最长可达1700秒。
UtkarshRishi
ArcMind是由ArcDevs开发的下一代对话模型,专注于自然交互、自适应智能和上下文精准度,旨在为用户提供无缝、类人的对话体验。
nineninesix
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
tensorblock
Nile-Chat-4B 是 MBZUAI-Paris 开发的一个 40 亿参数的多语言对话模型,基于先进的 Transformer 架构构建,专门针对对话场景进行了优化。该模型支持多种语言,能够进行流畅的自然语言对话,并提供高质量的响应生成能力。
lmstudio-community
Qwen3-30B-A3B-Instruct-2507是阿里巴巴通义千问团队推出的300亿参数大语言模型,专门针对指令跟随任务进行了优化。该模型支持文本生成、对话交互等多种自然语言处理任务,并通过LM Studio社区模型计划向开发者开放使用。
dangvansam
TEN Turn Detection是一款先进的智能话轮检测模型,专门用于实现人与AI智能体之间的自然、动态交流。该模型能够检测自然的话轮转换线索,支持基于上下文的打断功能,通过深度语义理解对话上下文和语言模式,使AI对话更加自然流畅。
NoemaResearch
Nous-V1 8B是由Apexion AI开发的80亿参数语言模型,基于Qwen3-8B架构构建。该模型专为处理各种自然语言处理任务而设计,在对话式AI、知识推理、代码生成和内容创作等方面表现出色,在模型能力和实际部署效率之间取得了良好平衡。
fnlp
MOSS-TTSD 是一个开源的双语口语对话合成模型,支持中文和英文,能够将对话脚本转化为自然、富有表现力的对话语音。
syvai
Hviske v3 是丹麦领先的最先进转录模型,专门针对自然对话场景进行微调,在会议、访谈、播客等场景中具有极高的准确性,超越了包括OpenAI Whisper在内的其他模型。
Mungert
TEN Turn Detection是一款先进的智能对话轮次检测模型,专为实现人类与AI之间自然、动态的交流而设计。
Heralax
datagen-sft-1是基于Mistral架构的7B参数大语言模型,在多个高质量数据集上进行监督微调得到的专用模型。该模型在自然语言处理任务上表现出色,特别是在文本生成和对话任务方面有显著提升。
aixonlab
欧律狄刻24b v3是基于Mistral 3.1构建的多角色对话伴侣模型,擅长创意表达、自然对话和故事叙述。
基于microsoft/Phi-4-reasoning-plus模型转换的MLX 4bit量化版本,专为Apple Silicon优化,在自然语言处理、数学推理、代码生成和对话等多个领域具有高效性能
JunHowie
Qwen3-8B 是 Qwen3 系列中的一款大语言模型,具备因果语言模型的特性,在推理、多语言支持、智能体能力等方面表现出色,能为用户带来自然、流畅的对话体验。
RaghuCourage9605
Anubis-559M是一款专为创意文本生成而设计的因果语言模型,基于更大的基础模型进行微调,擅长生成自然的对话和引人入胜的散文,特别适合角色扮演场景和创意写作。
基于1000+小时丹麦语数据训练的文本转语音模型,支持自然对话场景的语音合成
AquaLabs
EchoLLaMA是一个多模态AI系统,能够将3D视觉数据转化为自然语音描述,同时支持通过语音输入进行交互对话。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
Terraform Cloud MCP服务器是一个通过自然语言对话管理基础设施的AI助手集成服务,支持多种MCP兼容平台。
PaperPal是一个MCP扩展工具,旨在帮助用户搜索和撰写文献综述,通过与LLMs(如Claude)的自然对话来讨论论文、寻找新论文和组织文献思路。
Halo MCP Server 是一个基于 Python 的 MCP 服务器,为 AI 助手提供完整的 Halo 博客管理能力,支持通过自然语言对话完成文章创建、编辑、发布等所有博客管理操作。
Linode MCP Server是一个连接AI助手与Linode云基础设施的协议服务器,支持通过自然语言对话管理云资源,包括实例、数据库、网络等多种服务。
该项目展示了如何将AWS Bedrock的对话式AI能力通过MCP服务器架构与关系型数据库集成,实现自然语言查询数据库的功能。
Umbraco MCP是一个基于模型上下文协议(MCP)的服务器,为Umbraco CMS提供AI驱动的后台内容管理功能。它通过Umbraco管理API实现安全、权限控制的自动化操作,使AI助手能够通过自然对话执行复杂的后台任务,无需人工操作界面。
Jarvis MCP是一个基于浏览器的语音对话工具,让用户能通过麦克风与AI助手进行自然语音对话,支持30多种语言识别和远程访问,无需额外安装软件或API密钥。
将SAP OData服务转换为MCP工具,实现自然语言与ERP系统的智能对话交互
Voice Mode是一个为AI助手提供自然语音对话功能的工具,支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。
一个基于MCP协议的代码分析服务器,通过自然语言对话帮助AI模型理解和分析代码库,提供轻量级的代码探索与理解功能。
Temporal-MCP是一个连接AI助手与Temporal工作流的服务器,通过自然语言对话即可触发和管理复杂的工作流程,无需编写额外代码。
Google Ads MCP是一个连接Google Ads与Claude AI的工具,通过自然语言对话分析广告数据,提供账户管理、活动分析、关键词优化和预算管理功能。
SmartMemory是一个为LLM提供结构化记忆的MCP服务器,通过自然对话将对话内容转化为知识图谱,使AI助手能够学习和应用业务规则。
RevitMCP项目为Revit引入自然语言交互能力,通过MCP协议实现BIM建模自动化,采用分层架构设计,支持多轮对话与参数补全,显著提升建模效率。
一个连接Google Search Console与Claude AI的工具,通过自然语言对话分析SEO数据,提供站点管理、搜索分析、URL检查和站点地图管理功能。
Google Search Console与Claude AI的集成工具,通过自然语言对话分析SEO数据
MCP iCal Server是一个基于自然语言的macOS日历管理工具,通过Model Context Protocol实现对话式日历操作,支持事件创建、查询、修改和多日历管理。
这是一个让用户通过自然语言对话控制GIMP图像编辑软件的MCP项目,将复杂的图像处理操作转化为简单的对话指令,支持从基础调整到高级特效的各种图像编辑功能。
mcp-recon是一个基于MCP协议的对话式网络侦查工具,整合httpx和asnmap实现HTTP基础设施分析,支持通过自然语言指令执行快速/完整侦查及ASN查询。