DeepSeek于2月11日灰度更新网页端和APP端,14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文,知识库更新至2025年5月。但API服务仍为V3.2版本,仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试,引发对V4的广泛期待。更新后,DeepSeek的交互风格也发生明显变化。
阶跃星辰推出Step-DeepResearch模型,拥有32B参数,专注深度研究场景。该模型将网页搜索升级为专业研究流程,支持长程推理、工具调用和结构化报告撰写,区别于侧重短问题检索的Web Agent,能识别搜索意图并处理不确定信息。
微软推出VS Code版Copilot Studio扩展,将AI智能体开发从低代码网页端引入专业IDE。该工具公测下载量超1.3万次,核心价值在于将AI助手构建融入标准软件工程流程,提供结构化定义、语法高亮和智能代码补全功能,让开发者能像处理传统代码一样高效开发AI应用。
Mistral AI聊天机器人Le Chat迎来重大更新,新增五项核心功能:1)深度研究模式可智能拆解复杂问题并生成结构化报告;2)语音输入功能基于Voxtral模型实现自然对话;3)"思考模式"采用Magistral模型处理复杂推理;4)与黑森林实验室合作推出文本修改图像功能;5)新增项目管理工具可整理对话和文件。这些功能已在网页端和移动端同步上线,显著提升AI交互体验。
一个通过 AI 自动化网页任务、将网页转化为结构化数据并集成工具的产品。
将视频或音频内容快速转换成结构化网页摘要的多功能工具。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Bytedance
-
Baidu
32
Xai
$1.4
$10.5
256
$1.75
$14
400
Chatglm
$8
$16
128
Alibaba
$0.3
Tencent
$3
$9
16
$1
4
Huawei
Anthropic
$105
$525
$56
1k
Google
$4
$12
28
$2
$6
$18
inference-net
Schematron-3B是由Inference.net推出的长上下文提取模型,专注于将嘈杂的HTML转换为符合自定义模式的干净、类型化的JSON。该模型针对网页抓取、数据摄取以及将任意页面转换为结构化记录进行了专门训练,为数据处理和分析提供了高效的解决方案。
prithivMLmods
基于Qwen 2.5 14B架构设计的网页开发与结构化编码逻辑模型,擅长HTML/CSS/Tailwind开发及复杂指令执行。
Playwright MCP是一个基于Playwright的浏览器自动化服务器,通过结构化数据而非像素输入实现LLM与网页的交互。
Notte是一个开源的全栈网络AI代理框架,提供浏览器会话、自动化LLM驱动的代理、网页观察与操作、凭证管理等功能,旨在将互联网转化为代理友好的环境,并通过自然语言描述网站结构,降低LLM的认知负担。
Hyperbrowser的MCP服务器提供网页抓取、结构化数据提取和浏览器代理工具。
一个基于多搜索引擎的无API密钥网页搜索MCP服务,支持结构化结果返回和文章内容抓取
Claude深度研究是一个基于MCP协议的研究服务器,为Claude等AI助手提供综合研究能力,整合了网页和学术搜索功能,支持多源信息获取、内容提取和结构化分析。
一个用于从网页提取结构化内容的强大工具,支持自定义选择器和爬取选项
一个通用的资源管理系统,支持多种资源类型(论文、网页、书籍等)的管理,并与知识图谱集成,提供结构化笔记和状态跟踪功能。
CTX是一款连接代码库与大型语言模型(LLM)的工具,通过自动化生成结构化上下文文件,解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息,并可通过MCP服务器直接为AI助手提供项目上下文。
Playwright MCP是一个基于Playwright的浏览器自动化服务,通过结构化可访问性快照而非像素输入,为LLM提供网页交互能力。支持无头/有头模式、标签管理、导航操作等多种功能,适用于网页导航、数据提取、自动化测试等场景。
Oxylabs MCP服务器为AI助手提供网页数据抓取服务,支持动态渲染、结构化提取和反封锁功能。
AgentQL MCP Server是一个集成AgentQL数据提取能力的模型上下文协议服务器,支持从网页中提取结构化数据。
Crawl4AI MCP服务器是一个高性能的模型上下文协议服务器,为AI助手提供网页抓取、爬取和深度研究功能,通过CloudFlare Workers部署,支持OAuth认证和结构化数据提取。
博查是一个专为AI设计的搜索引擎,提供全网近百亿网页和生态内容的高质量搜索服务,支持天气、新闻、百科等多种垂直领域结构化数据,适用于各类AI应用。
Firecrawl MCP Server是一个基于Firecrawl API的网络爬虫和数据提取服务,提供网页抓取、内容搜索、站点爬取和结构化数据提取功能。
一个灵活的资源管理系统,支持管理多种类型资源(论文、网页、书籍等)并与知识图谱集成,提供统一标识、结构化笔记和状态跟踪功能。
一个基于计算机视觉的MCP服务器,通过分析网页截图自动识别图像资产位置并提取布局结构,支持径向、网格等多种布局模式检测,帮助AI助手精确重建网页布局。
一个无需API密钥的谷歌搜索MCP服务,提供结构化网页搜索结果
Playwright MCP是一个基于Playwright的浏览器自动化服务器,通过结构化可访问性快照与网页交互,无需依赖视觉模型或截图,提供轻量级、高效的网页操作能力。
一个用于分析网页SEO问题和验证结构化数据的MCP服务器工具
为AI应用提供网页浏览能力的服务器,支持智能内容提取和结构化数据捕获