月之暗面推出专为AI编程优化的万亿参数大模型Kimi K2.6-code-preview,已在Kimi Code上线,标志着国产编程AI进入万亿参数时代。该模型在K2.5基础上深度优化,重点提升推理深度、代码生成可靠性和多轮对话能力,思维链表现更强,代码生成更稳定,支持复杂编程任务。
阿里千问上线“表格 Agent”功能,用户可通过自然语言对话直接生成、查询和编辑Excel文件,实现从文本答案到直接成果的演进。该功能覆盖零门槛信息转表格、智能检索与深度编辑三大维度,简化传统表格处理流程。
LPM1.0模型发布,能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理,可同步整合文本、音频与图像,生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI,将传统语音对话升级为具备视觉反馈的实时交互。
即梦AI推出首个协作型叙事创作工具“小章鱼”Octo,引入VibeCreate(氛围创作)模式,旨在改变AI内容生成方式,从单向指令转向同屏共创的合伙人模式。目前该工具仅开放Web端内测,支持对话与多模态交互,标志着AI创作交互范式的重要演进。
集成多AI模型,可通过对话生成图像、视频和声音,优化创意流程。
最新视频生成模型,更真实、可控,支持同步对话与音效。
创造令人惊叹的AI视频,使用VO3 AI,这是一款先进的视频生成器,无缝结合音效、对话和环境音效,提供沉浸式观看体验。
DeckSpeed是一款革命性的AI演示工具,通过对话生成专业个性化幻灯片,摆脱模板束缚,展现真正的创造力。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
ss-lab
本项目提供了一个基于微软Phi-3.5-mini-instruct模型进行微调的文本生成模型,已转换为GGUF格式,适用于llama.cpp推理框架。模型在philschmid/guanaco-sharegpt-style数据集上进行了微调,优化了指令遵循和对话能力,适用于资源受限环境下的高效文本生成任务。
bartowski
这是squ11z1的Hypnos-i1-8B模型的量化版本,使用llama.cpp工具和特定数据集进行量化处理。该模型基于Llama-3架构,提供多种量化类型选择,支持文本生成任务,适用于推理、对话等多种应用场景。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40亿参数视觉语言模型,基于Qwen3架构开发,支持多模态理解和对话任务。该模型具备强大的图像理解和文本生成能力,能够处理复杂的视觉语言交互场景。
mradermacher
这是wexyyyyyy/Ru-Gemma3-1B模型的静态量化版本,支持俄语和英语,专为对话和文本生成任务设计。该模型提供了多种量化版本,适用于不同的硬件配置和性能需求。
DreadPoor
Strawberry_Smoothie-TEST 是一个使用 mergekit 工具合并三个12B参数模型得到的混合模型,结合了Unity-12B、Chaos-Unknown-12b和Smoothie-12B-Model_Stock的优势,旨在提供更好的文本生成和对话能力
nari-labs
Dia2是由Nari Labs开发的流式对话文本转语音(TTS)模型,支持实时语音生成,无需完整文本即可开始生成音频,能够根据对话上下文进行调整,实现自然流畅的对话体验。
Dia2是由Nari Labs开发的流式对话文本转语音(TTS)模型,支持实时语音生成,无需完整文本即可开始生成音频,专为自然对话场景设计。
anikifoss
本项目是对MiniMax-M2模型进行的高质量HQ4_K量化,专门针对文本生成任务优化,特别适用于对话场景。该量化版本未使用imatrix,保持了模型的性能表现。
OpenMOSS-Team
MOSS-TTSD是一个开源的双语口语对话合成模型,支持中文和英文,能够将两人对话脚本转化为自然、富有表现力的对话语音,支持语音克隆且单轮语音生成时长最长可达1700秒。
Hebrew_Nemo是一款专注于希伯来语处理的大语言模型,经过指令微调,支持文本生成和对话交互。本版本是原模型的GGUF量化版本,提供多种量化级别选择。
这是基于SicariusSicariiStuff/Hebrew_Nemo模型的量化版本,专门针对希伯来语优化的Mistral架构大语言模型,支持希伯来语和英语的文本生成和对话任务。
nightmedia
这是Qwen3-Next-80B-A3B-Instruct模型的MLX格式转换版本,专为在Apple Silicon设备上高效运行而优化。该模型是一个800亿参数的大型语言模型,支持文本生成任务,具有强大的对话和推理能力。
Guilherme34
Qwen2.5-14B-Instruct是基于Qwen2.5架构的多语言大语言模型,拥有140亿参数,支持13种语言,具备优秀的指令跟随和对话能力。该模型在多种语言任务上表现优异,适用于多语言场景的文本生成和理解。
nineninesix
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
openchs
这是一个基于Helsinki-NLP的opus-mt-mul-en模型进行微调的斯瓦希里语-英语翻译模型。该模型专门针对儿童热线服务场景进行了优化训练,采用合成的热线对话数据进行训练,具备防止生成幻觉的机制,并通过早停策略监控BLEU分数来保证翻译质量。
这是基于 mookiezi/Discord-Micae-Hermes-3-8B 的静态量化版本,专门针对 Discord 对话数据进行微调的大语言模型,支持英语文本生成和对话任务。
MEGHT
基于Qwen3 0.6B模型微调的搜索查询生成模型,能够根据用户输入和对话上下文生成相关的搜索查询,适用于搜索引擎建议系统和聊天机器人等应用场景。
基于Qwen/Qwen3-Next-80B-A3B-Instruct转换的MLX格式文本生成模型,支持高效的文本生成任务,特别适用于指令跟随和对话场景
OmniDimen
OmniDimen-4B-Emotion是基于Qwen3-4B-Instruct-2507微调的情感识别和情感感知文本生成模型,专门用于情感交互和具备情感感知能力的对话生成
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本角色扮演游戏和互动叙事。它通过动态模式定义和自动生成工具,帮助AI在对话中维护一致且结构化的记忆,实现更丰富、更动态的交互体验。
结合DeepSeek推理与Claude生成的两阶段AI对话服务
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
这是一个基于Google Gemini API的MCP服务器,提供文本对话、图像生成和视频生成功能,可作为Codex MCP的替代方案。
Speech MCP是为Goose设计的语音交互扩展,提供实时语音识别、高质量文本转语音、多语言支持和现代化音频可视化界面,支持多角色对话生成和音频转录功能。
一个基于MCP平台的本地代理服务器和客户端实现,集成天气查询、谷歌搜索、摄像头控制、图片生成和智能对话等多种AI工具功能,支持模块化扩展和高性能并发处理。
一个允许Claude与OpenAI对话并使用gpt-image-1生成图像资产的工具,适用于游戏或网页开发中需要生成单个资产的场景。
Image Gen MCP Server是一个通用AI图像生成服务,通过Model Context Protocol(MCP)标准协议为各类LLM聊天机器人提供跨平台、多模型的图像生成能力,支持OpenAI和Google的多种图像模型,实现文本对话到可视化内容的无缝转换。
MCP Apple Notes是一个基于Model Context Protocol的服务,能够对Apple Notes进行语义搜索和检索增强生成(RAG),使AI助手如Claude能在对话中引用用户的笔记。
一个通过Claude Code无缝集成OpenAI GPT-5 API的MCP服务器,提供文本生成和结构化对话处理功能,优化开发体验。
一个基于Model Context Protocol的服务器,通过包装官方Grok CLI工具,为MCP客户端提供访问Grok AI模型的能力,支持查询、对话和代码生成三种工具。
Kash MCP Server 是一个符合 MCP 协议的服务器,可将 ChatGPT、Claude 等 AI 助手连接到收银系统,实现通过对话管理销售、订单、产品和生成报告。
DBChat是一个通过AI技术让用户能用自然语言与数据库对话的工具,无需编写SQL即可查询数据并生成可视化图表,支持多种数据库类型。
一个基于MCP平台的本地代理服务器和客户端实现,集成天气查询、谷歌搜索、摄像头控制、AI图片生成和智能对话等多种AI工具调用能力,支持跨平台运行和模块化扩展。
Tavus MCP服务器是一个基于Model Context Protocol的AI视频生成服务接口,提供完整的Tavus API v2功能,包括AI数字人创建、视频生成、对话式AI、唇形同步和语音合成等25个工具。
一个包含4个智能代理的Claude对话日志分析系统,提供语义分析、模式发现、自动文档生成和智能协调功能,通过MCP与Claude Code原生集成。
PestProCRM MCP服务器是一个连接Claude AI与PestPro CRM平台的集成工具,允许用户通过自然语言对话管理客户、安排预约、发送短信、跟踪付款和生成报告。
一个提供《王者天下》中王骑将军经典台词的MCP服务器项目