谷歌将AI助手升级为智能协作者,通过NotebookLM与Gemini的深度集成,用户可在对话中直接调用个人笔记、文档等资料作为上下文。这使得Gemini能基于用户整理的项目资料、会议纪要等内容提供更精准的回应,不再仅依赖训练数据或当前对话。
谷歌推出AI实验项目“Disco”,其功能GenTabs可将多个浏览器标签页实时生成定制化Web应用。该功能基于Gemini 3模型,通过读取标签页内容并结合用户历史对话,以自然语言交互方式即时创建可交互页面。例如,学生写论文时,它可将多篇文献自动整合成带图表的知识库。目前仅面向macOS用户开放体验申请。
Google推出Gemini 2.5 Flash与Pro文本转语音预览模型,全面升级5月旧版。新模型支持24种语言的多角色对话,具备“情绪级”表达和自适应节奏功能,用户可一键切换“欢快乐观”或“阴郁严肃”等音色。开发者现可在Google AI Studio与Playground免费测试,预计2025年第一季度投入生产,适用于有声书、游戏NPC及本地化课程等场景。
埃隆・马斯克旗下xAI公司推出AI工具“Halftime”,可将产品广告实时植入影视内容。该工具能调整角色对话,使其主动展示品牌产品,不同于传统插播广告。演示视频显示《律政英雄》角色哈维・斯佩克特在剧中突然推广产品。
将企业文档转化为AI业务助理,知识管理系统提供24/7对话式知识访问
结合传统命理与AI智能,提供精准运势参考及命理对话建议。
BitterBot是开源AI助理,通过自然对话轻松完成现实任务。
WhatsApp多账户预热管理工具,支持自动对话、AI智能交互等功能。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
mlx-community
本模型是 Mistral AI 发布的 Ministral-3-3B-Instruct-2512 指令微调模型的 MLX 格式转换版本。它是一个参数规模为 3B 的大型语言模型,专门针对遵循指令和对话任务进行了优化,并支持多种语言。MLX 格式使其能够在 Apple Silicon 设备上高效运行。
ubergarm
这是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多种量化选项,从高精度的Q8_0到极度压缩的smol-IQ1_KT,满足不同硬件条件下的部署需求。该模型支持32K上下文长度,采用MLA架构,专为对话场景优化。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
nineninesix
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,采用两阶段管道结合大型语言模型和高效音频编解码器,实现卓越的速度和音频质量。该模型支持西班牙语,具有4亿参数,采样率为22kHz。
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
LiquidAI
LFM2-Audio-1.5B是Liquid AI推出的首个端到端音频基础模型,专为低延迟和实时对话设计。该模型仅15亿参数,能够实现无缝的对话交互,其能力可与参数规模大得多的模型相媲美。
mradermacher
这是基于mookiezii/Discord-Hermes-3-8B模型进行量化处理后的版本,提供了多种量化格式的GGUF模型文件,适用于不同硬件环境和性能需求的对话AI应用场景。
ducklingcodehouse
这是一个专注于芬兰语牙科医学的对话式AI助手,经过LoRA微调的大语言模型,能够针对牙科咨询问题生成结构化的临床回复,分为背景、评估和建议三个部分。
dangvansam
TEN Turn Detection是一款先进的智能话轮检测模型,专门用于实现人与AI智能体之间的自然、动态交流。该模型能够检测自然的话轮转换线索,支持基于上下文的打断功能,通过深度语义理解对话上下文和语言模式,使AI对话更加自然流畅。
NoemaResearch
Nous-V1 8B是由Apexion AI开发的80亿参数语言模型,基于Qwen3-8B架构构建。该模型专为处理各种自然语言处理任务而设计,在对话式AI、知识推理、代码生成和内容创作等方面表现出色,在模型能力和实际部署效率之间取得了良好平衡。
Mungert
TEN Turn Detection是一款先进的智能对话轮次检测模型,专为实现人类与AI之间自然、动态的交流而设计。
LumiOpen
Poro 2 8B Instruct 是一个基于 Llama 3.1 8B 架构的指令遵循聊天机器人模型,专为芬兰语和英语的对话式 AI 应用设计。
Salesforce
xLAM-2是Salesforce研发的大型动作模型系列,专注于多轮对话和函数调用能力,可作为AI代理的核心组件。
AquaLabs
EchoLLaMA是一个多模态AI系统,能够将3D视觉数据转化为自然语音描述,同时支持通过语音输入进行交互对话。
DataPilot
专为AI虚拟主播(AI VTuber)对话优化的日语语言模型,基于Google的gemma-3-4b-it开发
一个以成为AI虚拟主播灵魂为目标的混合专家模型,结合了代码生成、指令跟随和多轮对话能力
xLAM-2是Salesforce推出的新一代大型动作模型,专注于多轮对话和函数调用能力,能够将用户意图转化为可执行动作,作为AI代理的核心组件。
xLAM-2系列是基于APIGen-MT框架训练的大型动作模型,专注于多轮对话和函数调用能力,适用于AI代理开发。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本RPG和互动叙事,帮助AI维护跨对话的结构化记忆。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本角色扮演游戏和互动叙事。它通过动态模式定义和自动生成工具,帮助AI在对话中维护一致且结构化的记忆,实现更丰富、更动态的交互体验。
结合DeepSeek推理与Claude生成的两阶段AI对话服务
Nowledge Mem Claude桌面扩展,为Claude AI提供记忆存储和搜索功能,支持用户保存和检索对话记忆
一个基于Go语言实现的知识图谱记忆服务器,为AI助手提供跨对话的持久化记忆管理能力
一个结合Claude Code和Google Gemini AI的MCP服务器,通过多模型协作实现深度代码分析,Claude擅长本地上下文操作和CLI工作流,Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。
该项目是一个MCP服务器,用于管理记忆文本文件,帮助Claude等AI模型在对话间保持上下文。提供添加、搜索、删除和列出记忆的功能,支持基于子字符串的精确匹配操作。设计上采用简单的文本文件存储记忆,类似于ChatGPT的记忆机制,并通过提示和训练来触发记忆存储。
MemoDB MCP是一个基于TypeScript的AI对话与知识管理服务器,提供用户管理、对话数据存储和知识库操作功能。
一个让Claude Desktop直接调用ChatGPT API的MCP服务器,支持自定义参数和网络搜索功能。
Halo MCP Server 是一个基于 Python 的 MCP 服务器,为 AI 助手提供完整的 Halo 博客管理能力,支持通过自然语言对话完成文章创建、编辑、发布等所有博客管理操作。
Terraform Cloud MCP服务器是一个通过自然语言对话管理基础设施的AI助手集成服务,支持多种MCP兼容平台。
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
AutoGen MCP服务器是一个集成微软AutoGen框架的多代理对话服务,提供标准化的AI代理管理与协作接口。
一个集成了LangChain、自定义MCP服务器和谷歌Gemini AI模型的聊天平台,提供增强的对话功能。
该项目展示了如何将AWS Bedrock的对话式AI能力通过MCP服务器架构与关系型数据库集成,实现自然语言查询数据库的功能。
Linode MCP Server是一个连接AI助手与Linode云基础设施的协议服务器,支持通过自然语言对话管理云资源,包括实例、数据库、网络等多种服务。
Voice Mode是一个为AI助手提供自然语音对话功能的工具,支持与Claude、ChatGPT等LLM通过MCP协议进行人机语音交互。
SAGE-MCP是一个智能AI助手MCP服务器,提供多种工作模式选择、对话连续性管理和智能文件处理功能,能够根据任务复杂度自动选择最佳AI模型