金山办公在上海峰会上宣布,其基于WPS365平台的AI协同办公解决方案“企业大脑”已在华东地区落地。该方案通过集中上云和结构化解析文档,帮助企业构建知识管理与业务协同体系,实现核心业务处理效率提升80%。
Anthropic开源Claude技能库,推动AI从对话转向协作执行。该库包含9大类50多项技能,覆盖文档处理、安全等全场景,使Claude成为标准化、可定制工作流的专业执行器,标志着技术生态的重要升级。
Mistral AI发布新一代文档识别技术Mistral OCR3,在表格、扫描文档、复杂表格及手写识别方面表现突出,整体性能较上一代提升74%。该技术旨在高效准确提取各类文档中的文本和嵌入式图像,支持多格式处理,显著提升文档处理效率与精度。
Adobe因AI版权问题被起诉,指控其SlimLM模型使用盗版书籍数据集进行训练。该模型用于移动设备文档处理,但原告称其依赖的开源数据包含非法内容。
aOCR:AI文档解析与数据提取软件,99.2%准确率,实时处理,多语言支持
智能文档处理AI平台,利用AI、机器学习和OCR技术自动化数据提取、分类和组织各种文档类型。
Heron的AI技术可自动化处理文档密集型工作,提升工作效率。
AI引擎将复杂文档转化为可用数据,助力运营和工程团队秒级处理PDF工作流。
Google
$0.49
Input tokens/M
$2.1
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
Openai
$7.7
$30.8
200
Anthropic
$7
$35
$21
$105
Alibaba
-
$2
256
$3.9
$15.2
64
Bytedance
$0.8
128
Baidu
32
betterdataai
专注于个人身份信息(PII)检测的AI模型,支持7种语言,覆盖29个PII类别,为数据隐私保护提供强大助力。基于Qwen2-0.5B构建,能够处理长文档并保持低延迟。
SeanD103
基于Allen AI的Longformer模型微调,专门用于金融文本情感分析,支持处理长达4096个标记的长文档。
microsoft
UDOP是一个统一处理视觉、文本和布局的通用文档处理模型,基于T5架构,适用于文档AI任务。
UDOP是一个基于T5的编码器-解码器Transformer架构,用于处理文档AI任务,如图像分类、文档解析和视觉问答。
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
HWP-MCP是一个让AI模型控制HWP文档的协议服务,支持文档创建、编辑和自动化处理。
一个专注于高效爬取和清理依赖文档的工具包,适用于人类阅读和AI处理。
Upstage MCP Server是一个连接AI助手与Upstage AI文档处理API的服务器,支持从PDF、图片和Office文件中提取结构化内容,并集成Claude Desktop等MCP客户端。
Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统,提供数十种强大工具能力,包括智能任务委派、文档处理、浏览器自动化、Excel操作等,通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。
Content Core是一个AI驱动的多功能内容提取与处理平台,支持从网页、文档、音视频等各类来源提取内容,并提供智能清理、摘要生成等功能,支持命令行、Python库、MCP服务等多种集成方式。
该项目是一个基于Model Context Protocol (MCP)标准的文档处理服务器,通过构建向量数据库和MCP接口,使AI助手能够访问外部文档资源,突破大语言模型的知识限制。项目包含文档处理流水线和MCP服务端两大组件,支持多种嵌入模型和文件格式,可应用于最新技术文档查询、私有代码库理解等场景。
Vulcan File Ops是一个基于Model Context Protocol(MCP)的高性能文件操作服务器,可将桌面AI助手(如Claude Desktop、ChatGPT Desktop等)转变为强大的开发伙伴。它提供安全的文件读写、批量操作、文档处理、图像分析和Shell命令执行功能,具有企业级安全控制、动态目录注册和智能工具过滤特性,让用户完全控制本地文件系统访问。
Dart MCP Server是一个基于Dart的模型上下文协议(MCP)服务器实现,提供任务管理、文档处理和空间组织功能,支持与AI助手集成。
LegalContext是一个开源MCP服务器,安全连接Clio文档管理系统与Claude AI助手,实现本地化法律文档处理与检索。
ParseFlow是一个AI驱动的全能文档解析库,支持PDF、Word、Excel、PPT和图片OCR,提供语义搜索和批量处理功能,并包含MCP服务器供AI助手使用。
一个基于MCP协议的AI Word文档处理服务器,提供文档创建、编辑和管理功能
一个MCP服务器,通过语义搜索为AI代理提供相关的以太坊改进提案(EIP)内容,支持Markdown文档处理和向量化检索。
Zed的PDF语义搜索扩展,集成AI助手增强文档处理能力
Flexible GraphRAG是一个支持多数据源文档处理、知识图谱自动构建、混合搜索(全文、向量、图)和AI问答的灵活平台,包含FastAPI后端、MCP服务器和多种前端界面。
基于FastMCP的Word文档AI处理服务
一组实现MCP协议的Python工具服务器,为AI助手提供YouTube数据处理、Word文档处理、图表渲染等功能扩展。
Feishu/Lark官方OpenAPI MCP工具,封装平台API接口,支持AI助手直接调用实现文档处理、会话管理等自动化场景
一个基于向量搜索的文档检索与处理MCP服务器,为AI助手提供文档增强功能
Archive Agent 是一个智能文件索引工具,支持通过自然语言搜索和提问文件内容。它结合了AI搜索(RAG引擎)、自动OCR和MCP接口,能够处理多种文件类型,包括文本、文档、PDF和图像。