小红书PC端近日低调上线AI搜索助手“点点”,将平台核心AI能力拓展至大屏生态。该工具基于海量真实笔记,将传统被动搜索升级为主动对话式交互,能提炼总结并提供可靠答案,同时右侧关联展示相关笔记的原文、点赞、收藏及评论等真实数据。
2026年谷歌I/O大会宣布搜索引擎全面“AI化”改造后,因未提供“一键关闭”AI功能选项,引发用户不满。隐私搜索平台DuckDuckGo监测到显著流量迁移,成为用户首选替代方案。数据显示,5月20日至25日期间,其安装量激增,反映出用户“用脚投票”的趋势。
谷歌计划用AI智能体取代传统“蓝色链接列表”改造搜索引擎,但此举引发用户强烈反弹。竞争对手DuckDuckGo数据显示,谷歌宣布改版后,其在美国市场的应用安装量爆发式增长,尤其是iOS平台表现突出,反映用户用行动抗议谷歌的AI化变革。
腾讯混元联合UCLA、港中文等机构,针对多模态大语言模型(MLLMs)从“被动理解”向“主动推理”进化的需求,开源了多模态搜索智能体。此前,高质量数据、自动化轨迹合成路径及训练配方的缺失,导致顶尖智能体难以复现。此次开源旨在打破僵局,推动社区发展。
通过API获取谷歌等搜索引擎实时SERP数据,支持地理定位,按需付费。
数小时完成文献综述,搜索数百万篇科研论文,含图表数据,材料研发可提前试用。
用自然语言连接ATS搜索候选数据库,上下文感知、直观且快速。
优化AI搜索,追踪数据、分析品牌,提供内容推荐,驱动业务增长。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$105
$525
200
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
Tencent
$1
$54
$163
$8.75
$70
400
$1.75
$14
$0.35
24
Bytedance
$0.8
Xai
mudasir13cs
这是一个基于Google Gemma-3-4B-IT模型微调的文本生成模型,专门用于根据演示模板元数据生成多样化且相关的搜索查询。该模型使用LoRA适配器进行高效微调,是结构化文档字段自适应密集检索框架的关键组成部分。
aditeyabaral-redis
基于Transformer架构的CrossEncoder模型,在Quora问题对数据集上微调,用于计算文本对得分,适用于语义相似度和语义搜索任务。
这是一个基于Cross Encoder架构的模型,专门用于文本对分类任务,在Quora问题对数据集上微调而来,适用于语义相似性判断和语义搜索场景。
slupart
基于SPLADE++模型适配的对话式搜索版本,通过QReCC数据集微调查询编码器,优化多轮对话式搜索性能。
zai-org
GLM-4-32B-Base-0414是GLM家族的新成员,拥有320亿参数,在15T高质量数据上进行预训练,性能可与GPT-4o和DeepSeek-V3等先进模型相媲美。该模型支持便捷的本地部署,在代码生成、函数调用、搜索式问答等方面表现优异。
GLM-4-32B-0414是GLM家族的新成员,拥有320亿参数的高性能大语言模型。该模型在15T高质量数据上进行预训练,包含大量推理型合成数据,在代码生成、函数调用、搜索问答等多个任务场景中表现出色,性能可与GPT-4o和DeepSeek-V3等更大规模模型相媲美。
skfrost19
基于sentence-transformers库在msmarco数据集上训练的交叉编码器模型,用于文本重排序和语义搜索
dejanseo
这是一个基于DeBERTa v3 Large架构的序列分类模型,专门用于预测用户提示是否需要通过外部资源(如网络搜索、数据库或RAG管道)进行接地处理。该模型在LLM管道中充当路由层,帮助优化检索决策、延迟和成本。
Zwounds
将自然语言查询转换为适用于学术数据库的标准布尔搜索表达式,帮助研究人员和图书馆员创建格式正确的布尔搜索查询。
Lauther
这是一个在测量领域数据集上微调的句子转换器模型,用于生成语义嵌入向量,支持语义文本相似性、语义搜索等任务。
Kwaipilot
OASIS是由Kwaipilot开发的最先进的代码嵌入模型,融合了仓库级程序分析、OASIS-instruct数据合成算法及专用融合损失函数,在代码搜索效率和准确性方面设定了新基准。
dragonkue
这是一个从Snowflake/snowflake-arctic-embed-l-v2.0微调而来的句子转换器模型,训练数据为聚类数据集。它将句子和段落映射到一个1024维的密集向量空间,可用于语义文本相似度和语义搜索。
freelawproject
这是一个基于sentence-transformers库从nomic-ai/modernbert-embed-base微调而来的句子嵌入模型,专门针对三元组数据进行了优化训练,能够将文本映射到768维向量空间,适用于语义相似度计算和搜索任务。
HuanjinYao
桑葚模型是一个基于逐步推理的模型,通过集体知识搜索生成的Mulberry - 260K SFT数据集上进行训练。
avemio-digital
这是一个基于sentence-transformers框架,在JSON数据集上对ModernBERT-base模型进行微调得到的文本嵌入模型。它可以将句子和段落映射到768维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
joe32140
这是一个基于 answerdotai/ModernBERT-large 的句子转换器模型,在 msmarco-co-condenser-margin-mse-sym-mnrl-mean-v1 数据集上进行了微调。该模型能够将句子和段落映射到1024维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
estrogen
这是一个基于estrogen/ModernBERT-base-sbert-initialized的句子转换器模型,在all-nli数据集上进行了微调。该模型能够将句子和段落映射到768维的密集向量空间,适用于语义文本相似度计算、语义搜索等多种自然语言处理任务。
Geraldine
基于DistilBERT的文本嵌入模型,专为处理XML/EAD元素优化,适用于档案数据语义搜索和信息检索。
baconnier
这是一个基于BAAI/bge-small-en-v1.5在金融数据集上微调的句子嵌入模型,用于语义文本相似度、语义搜索等任务。
nemanjaPetrovic
这是一个基于句子BERT(SBERT)的法律数据语义搜索概念验证模型,通过三元组损失进行微调,专门针对法律文档提供高效准确的语义搜索能力。
Airweave是一个开源的人工智能代理和RAG系统的上下文检索层,它连接并同步各种应用程序、工具和数据库的数据,通过统一的搜索接口为AI代理提供相关、实时、多源的上下文信息。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Apify MCP服务器是一个基于模型上下文协议(MCP)的工具,允许AI助手通过数千个现成的爬虫、抓取器和自动化工具(Apify Actor)从社交媒体、搜索引擎、电商等网站提取数据。它支持OAuth和Skyfire代理支付,可通过HTTPS端点或本地stdio方式集成到Claude、VS Code等MCP客户端中。
这是一个持续更新的MCP服务器精选列表,涵盖了浏览器控制、艺术与文化、云平台、命令行、通信、客户数据平台、数据库、开发者工具、数据科学工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索和实用工具等多个类别。每个项目都附带了GitHub链接和星标数量,方便用户快速了解和使用。
Redis MCP Server是一个为Redis设计的自然语言接口服务,支持AI代理通过自然语言查询和管理Redis数据,集成MCP协议,提供多种数据结构和搜索功能。
Coco AI是一个统一搜索平台,集成了企业应用和数据(如Google Workspace、Dropbox、GitHub等),提供跨平台搜索和AI驱动的团队聊天功能,旨在提升工作效率和协作体验。
一个为Claude桌面端提供本地Apple Notes数据库访问的服务器,支持读取和搜索笔记内容。
Apify MCP服务器是一个实现Model Context Protocol(MCP)的服务,允许AI助手通过SSE或Stdio与Apify平台上的各种Actor交互,执行数据抓取、网页搜索等任务。
一个基于Qdrant向量数据库的文档语义搜索服务,支持URL和本地文件导入,提供自然语言查询功能。
MCPBench是一个用于评估MCP服务器性能的框架,支持Web搜索和数据库查询两种任务的评估,兼容本地和远程服务器,主要评估准确性、延迟和令牌消耗。
一个基于FastMCP的英国议会数据服务项目,提供议会成员、选区、选举结果、政府职位、议会问答和辩论记录等数据的查询和语义搜索功能,支持通过Claude等MCP客户端访问。
BCRP-MCP是一个基于模型上下文协议(MCP)的服务器,提供对秘鲁中央储备银行(BCRP)经济和金融时间序列数据的标准化访问接口,支持通过关键词搜索、数据分析和问答功能探索秘鲁经济指标。
DataForSEO API的MCP服务器实现,支持多种搜索引擎数据查询
Maccy剪贴板MCP服务器是一个将Maccy剪贴板历史暴露给Claude等AI助手的服务工具,支持搜索、查看、管理剪贴板内容,包含图像支持与数据统计功能,但需注意敏感数据泄露风险。
Context Lens 是一个本地化语义搜索工具,可将任何内容转换为可搜索的知识库,让AI助手理解含义而非仅匹配关键词。它使用内置的LanceDB向量数据库,支持本地文件、GitHub仓库和URL内容,无需API密钥或云服务,完全在本地处理数据。
EOSC数据共享MCP服务器,提供HTTP接口通过搜索API和大型语言模型帮助用户查找所需数据集和工具。
一个用于AI辅助编程的MCP服务器,通过整合开发历史数据(Git提交、测试结果、Copilot会话)到可搜索的SQLite数据库,让AI助手能够访问和分析开发历史。
ClinicalTrials.gov MCP服务器是一个基于Model Context Protocol的接口服务,提供对ClinicalTrials.gov官方数据库的访问能力,支持AI代理和LLM程序化搜索、检索和分析临床研究数据。
一个用于访问新加坡data.gov.sg政府数据集的MCP服务器,提供数据集浏览、搜索和下载功能,内置API速率限制。
一个基于Qdrant向量数据库的MCP记忆服务器,提供知识图谱和语义搜索功能。