谷歌推出开源扩展Conductor,解决AI编程上下文丢失问题。它作为Gemini CLI的延伸,将代码生成转化为结构化工作流,持久化保存产品知识、技术约束与计划,避免传统会话模式下的信息丢失。
阶跃星辰推出Step-DeepResearch模型,拥有32B参数,专注深度研究场景。该模型将网页搜索升级为专业研究流程,支持长程推理、工具调用和结构化报告撰写,区别于侧重短问题检索的Web Agent,能识别搜索意图并处理不确定信息。
谷歌推出Gemini API新功能"地图接地",开发者可将AI应用直接接入谷歌地图超2.5亿地点数据。该功能支持自动识别地理位置查询,提取地址、营业时间等实时结构化信息,显著提升位置感知型AI应用的开发效率。
SSShooter团队推出AI智能电子书解析工具“电子书转思维导图”,可将EPUB和PDF格式电子书转换为结构化思维导图和文字总结,帮助读者轻松掌握书籍精华,解决电子书格式限制和信息结构不清晰的问题。
从文档中提取结构化信息
云端第二大脑,轻松存储和检索非结构化信息
销售AI工具,自动将邮件等沟通转化为结构化信息并直接更新CRM
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Bytedance
-
Baidu
32
Xai
$1.4
$10.5
256
Alibaba
$1.75
$14
400
Chatglm
$8
$16
128
$0.3
Tencent
$3
$9
16
Google
$8.75
$70
1k
$1
4
Huawei
$0.5
$56
$0.7
$2.8
$4
$12
28
$2
prithivMLmods
Chandra是一款高精度的OCR模型,能够将图像和PDF转换为结构化输出,如Markdown、HTML和JSON,同时保留详细的布局信息。支持40多种语言,擅长处理复杂的文档元素。
Smith-3
这是一个专为圣西蒙大学科学与技术学院学生设计的微调AI模型,集成在TecnoTime应用程序中,帮助学生保持学习组织性、提高学术连续性,通过结构化通知和激励信息强化学习习惯。
numind
NuExtract 2.0是由NuMind开发的专门用于结构化信息提取的多模态模型,支持文本和图像输入,具备多语言处理能力,能够根据JSON模板从输入内容中提取结构化信息。
NuExtract 2.0是NuMind公司专门为结构化信息提取任务训练的一系列多模态模型。该4B版本基于Qwen2.5-VL-3B-Instruct构建,支持文本和图像输入,具备多语言处理能力,能够从非结构化数据中提取结构化信息。
sabaridsnfuji
日本收据视觉语言模型lfm2-450M是一款专门用于理解和处理日本收据的视觉语言模型。它基于LiquidAI的LFM2-VL-450M基础模型构建,能够分析收据图像,提取结构化信息,回答关于收据内容的问题,并以日语和英语提供详细描述。
yashpwr
一款先进的命名实体识别模型,专门用于从简历中提取结构化信息。该模型在22,542份简历样本上训练,F1分数达到90.87%,可识别25种实体类型,包括个人信息、联系方式、工作经历、教育背景和技能等。
mideind
IceBERT-PoS是一个专门用于冰岛语词性标注的预训练模型,基于IceBERT架构构建。该模型能够对冰岛语句子中的每个单词进行词性标注,并输出详细的语法属性信息,支持多种输出格式,包括可读性强的结构化元组格式和与MIM-GOLD评估标准兼容的IFD格式。
NuExtract 2.0是专为结构化信息提取任务训练的多模态多语言模型系列,基于QwenVL系列预训练模型开发。
NuExtract 2.0是专为结构化信息提取任务训练的多模态模型系列,支持文本和图像输入,具备多语言处理能力。
suayptalha
基于Qwen3-0.6B微调的医疗诊断专家模型,擅长解析临床信息并生成结构化诊断结论。
lakshyakh93
一款专为识别和分类非结构化文本数据中的个人身份信息(PII)而优化的微调模型。
zackriya
一个专注于从图像中提取结构化数据(JSON)的视觉语言模型,特别擅长识别图表中的节点、边及其子属性,将视觉信息表示为知识图谱。
AJNG
一款视觉语言模型,专门用于从支票图像中提取结构化的金融信息,生成包含支票号码、收款人、金额和签发日期等关键信息的JSON格式输出。
sam749
基于naver-clova-ix/donut-base在SROIE数据集上微调的文档信息提取模型,专门用于从收据和商业文档中提取结构化信息
Helios9
基于DeBERTaV3的生物医学命名实体识别模型,专门用于从临床文本中提取疾病、药物等结构化信息
h2oai
Yazawa
基于Yazawa/donut-base-sroie微调的文档理解模型,适用于结构化文档信息提取任务
adityaeucloid
基于YOLOv8的目标检测模型,专门用于从文档中提取结构化信息,如发票、收据等。
Xenova
Donut是一个基于Swin Transformer的视觉文档理解模型,专门针对CORD数据集进行了微调,能够从图像中提取结构化文本信息。
该项目通过Unstructured API构建了一个MCP服务器,用于处理研究论文数据,提取关键信息并转换为结构化JSON格式,帮助研究人员快速获取文献信息,减少文献综述时间。
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
基于Google LangExtract库的Web界面、API和MCP服务,支持使用LLM从文本中提取结构化信息,提供可视化界面和多种模型集成。
Uniswap Pools MCP是一个用于查询Uniswap流动性池/交易对的MCP服务器,支持通过代币地址获取V2、V3和V4版本的池子信息,并以结构化格式返回结果便于集成和分析。
LangExtract MCP Server是一个基于FastMCP的服务器,通过Google Gemini模型从非结构化文本中提取结构化信息,为Claude Code等AI助手提供文本信息提取能力,支持智能缓存和持久连接。
Claude深度研究是一个基于MCP协议的研究服务器,为Claude等AI助手提供综合研究能力,整合了网页和学术搜索功能,支持多源信息获取、内容提取和结构化分析。
CTX是一款连接代码库与大型语言模型(LLM)的工具,通过自动化生成结构化上下文文件,解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息,并可通过MCP服务器直接为AI助手提供项目上下文。
mem0 MCP服务器是一个用于项目管理的中间件,提供结构化项目记忆存储、语义搜索和项目信息管理功能,支持通过标准输入输出协议与MCP主机应用交互。
一个基于Spring Boot的MCP服务器,提供对Spring I/O 2025会议数据的AI访问接口,包含演讲、研讨会、讲者信息等结构化数据。
一个基于Gradle Tooling API的MCP服务,支持通过结构化方式查询Gradle项目信息、执行任务和运行测试。
该项目是一个基于Python的MCP服务器,提供程序化查询Azure资源定价的功能,通过结构化工作流从Azure零售价格API获取实时定价信息,支持计算月度成本。
一个基于Markdown文件的结构化记忆管理MCP服务器,专为特定领域项目设计,通过AI辅助持续积累和组织上下文信息,适用于旅行规划、研究项目等场景。
OParl MCP服务器是一个基于Model Context Protocol的议会数据访问服务,通过标准化API提供德国各地议会的会议、文件、组织和人员等信息,支持AI模型和应用程序的自然语言查询和结构化数据访问。
一个基于Python和FastAPI的Steam游戏统计信息MCP服务器,作为MCP客户端与Steam Web API之间的中介,提供结构化的游戏统计和用户信息访问。
MCPKG是一个基于Go语言实现的知识图谱系统,通过模型上下文协议(MCP)提供结构化信息的存储、管理和查询功能,支持语义三元组操作和持久化存储。
repo-to-txt-mcp是一个基于MCP协议的服务器,用于将GitHub仓库或本地文件夹转换为结构化文本文件,便于为大型语言模型提供上下文信息。支持文件过滤、令牌管理,并可与Cursor编辑器集成。
该项目展示了一个基于MCP协议的磁盘使用情况查询服务,允许Claude AI通过本地服务器实时获取Mac系统的磁盘信息,并以结构化和用户友好的方式呈现。
一个基于MCP协议的自动化欢迎文本生成服务器,用于从自由文本中提取结构化员工信息,并根据模块化模板系统生成专业的新员工欢迎文本。
MotaWord MCP是一个私有接口协议,提供对翻译项目数据的结构化实时访问,支持外部系统(如LLM、自动化工具等)获取翻译工作流的上下文感知信息,实现项目状态监控与集成。
这是一个基于Node.js和TypeScript的MCP服务器,从Longman词典网页提取单词信息并返回结构化JSON数据,供AI代理使用。