大模型竞赛进入“落地攻坚”阶段,火山引擎提出AI演进新范式:智能Agent成为AI落地核心载体,多模态能力与高效开发体系是关键。大模型正从问答交互转向深入汽车、制造等复杂场景,实现从“聊天”到“干活”的跨越。
阿里旗下通义千问App全面接入高德地图,融合AI处理能力与地理位置数据,打造“问答即服务”出行模式。用户可直接查询周边餐厅、娱乐等生活服务,实现智能导航与生活服务一体化。
蚂蚁集团旗下AI健康应用“蚂蚁阿福”品牌升级后下载量激增,冲上苹果应用总榜第三。该应用月活用户超1500万,日处理健康问答超500万次,已跻身国内AI应用前五。新版升级了健康陪伴、问答及服务功能。
蚂蚁集团旗下AI健康应用“AQ”更名为“蚂蚁阿福”,并推出新版App。升级聚焦健康陪伴、问答与服务三大功能,月活用户超1500万,成为国内领先的健康管理AI应用。新版定位从工具转向“AI健康朋友”,旨在通过智能化服务提升用户体验。
专为PDF而生的AI,可免费生成摘要、回答问题,支持翻译与多文件聊天。
AI问答助手,用截图获取智能答案
基于DeepSeek R1和V3模型的浏览器侧边栏AI工具,提供问答、创作、翻译等功能
Reddit的新问答功能,通过AI技术获取社区信息和讨论。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基于Allen Institute for AI开发的Olmo-3-7B-Instruct模型的GGUF量化版本。这是一个70亿参数的自回归语言模型,通过监督微调和直接偏好优化在Tulu 2和UltraFeedback等数据集上训练,在问答和指令遵循方面表现出色。
kurakurai
Luth-LFM2-350M 是与 Liquid AI 合作开发的法语优化语言模型,基于 LFM2-350M 在 Luth-SFT 数据集上进行法语微调。该模型在保持英语能力的同时,显著提升了法语指令遵循、数学推理和常识问答能力。
Intelligent-Internet
II-Medical-8B是智能互联网研发的新一代医疗大语言模型,专为增强AI医疗推理能力而设计,在医疗问答能力上实现重大突破。
yukiarimo
Yuna Ai V4是一款基于LLaMA 3.1 8B架构的多语言文本生成模型,专注于提供智能对话和知识问答体验。经过3B+令牌训练,具备量子思维等先进特性,在对话能力和创造力方面表现突出。
kodetr
这是一个专门针对印度尼西亚法律咨询领域的问答AI模型,基于Llama-3.2-1B架构微调训练而成,能够为印尼法律相关问题提供专业的解答服务。
jondurbin
基于Meta的Llama-3构建的实验性模型,使用airoboros生成的合成数据进行调优,并结合多种DPO数据集进行额外调优,擅长上下文问答、摘要生成、长文本生成等多种任务。
ruslanmv
专为医学问答微调的Llama3模型,基于AI医疗聊天机器人数据集训练,提供专业医学解答。
microsoft
UDOP是一个基于T5的编码器-解码器Transformer架构,用于处理文档AI任务,如图像分类、文档解析和视觉问答。
Kaludi
EurekaQA是一款基于先进机器学习算法的AI问答模型,能够通过分析文本数据自动提取信息回答问题。
该项目通过搭建Claude Code与Google Gemini AI的桥梁,实现在Claude Code环境中直接调用Gemini进行问答、代码审查和创意头脑风暴,提供便捷的AI协作工具。
一个基于Gemini API和Google搜索的MCP服务器,通过与AI助手(如Cline)结合使用,提供最新信息的智能回答功能。
该项目是一个基于Google Cloud Vertex AI Gemini模型的MCP服务器,提供丰富的工具集用于代码辅助和通用问答,支持网络搜索增强回答、文档解释生成、文件系统操作等功能。
一个防止AI幻觉的MCP服务,当AI不确定时可以向人类提问而非盲目自信,通过简单的问答机制提升开发效率。
一个基于Model Context Protocol (MCP)的服务端项目,提供检索增强生成(RAG)能力,可作为Cursor IDE和Claude Desktop等客户端与Contextual AI代理的桥梁,实现基于知识库的智能问答和上下文感知响应。
Moondream MCP Server是一个基于Moondream视觉模型的图像分析服务,提供图像描述生成、物体检测和视觉问答功能,可轻松集成到Claude和Cline等AI助手中。
该项目提供了在Android Studio中集成AI聊天功能的指南,使开发者能够通过自然语言与代码和项目交互,包括代码问答、修改、解释和调试等功能。
File Context MCP是一个基于TypeScript的应用程序,提供API通过本地文件内容查询大型语言模型(LLMs),支持多种LLM提供商(Ollama和Together.ai),可处理多种文件类型生成上下文感知的响应。
Flexible GraphRAG是一个支持多数据源文档处理、知识图谱自动构建、混合搜索(全文、向量、图)和AI问答的灵活平台,包含FastAPI后端、MCP服务器和多种前端界面。
TiDB AI的MCP服务端,为Cursor提供问答接口
该项目实现了一个基于FAISS向量数据库的MCP服务器,支持检索增强生成(RAG)功能,包含GitHub文件下载、文档索引、本地查询和LLM集成等完整工作流。
一个基于MCP协议的Vercel AI SDK文档查询代理服务,提供AI驱动的文档搜索和问答功能,支持与Claude Desktop等MCP客户端集成。
基于Google Gemini Vision API的YouTube视频分析MCP服务,提供视频描述、摘要、问答和关键片段提取功能。
Biel.ai MCP服务器将IDE连接到产品文档,通过RAG技术让AI工具能够访问和搜索公司知识库,提供智能代码补全和技术问答。
rag-mcp是一个过度设计的检索增强生成系统,通过Python服务器提供多种文本搜索模式(语义搜索、问答搜索、风格搜索),使用PostgreSQL和pgvector存储文本嵌入向量,支持与AI代理交互,架构复杂但可扩展。
一个基于Bun运行时的MCP服务器模板,专门用于构建AI问答工具,提供多类别、多难度的交互式测验功能。
一个关于欧盟AI法案的问答聊天机器人项目,采用混合检索方法(向量搜索+知识图谱),提供本地运行和AWS Lambda部署方案。
一个基于RAG技术的宝可梦问答助手,整合PokeAPI数据库与AI能力,提供准确信息交互
基于AI的食物营养分析助手,通过图像识别食物并计算卡路里和蛋白质含量,支持营养知识问答和对话记忆功能
这是一个用于集成Get笔记API的MCP服务器,提供从知识库中智能搜索和召回信息的功能,支持多知识库管理,由小x宝公益社区贡献。