微软计划在年度Build大会上推出自研AI编程大模型,以降低第三方采购成本。此前,CEO纳德拉已要求员工6月停用Anthropic的Claude,预示战略调整。此举反映AI编程工具普及下,大模型市场竞争与成本结构正发生质变。
商汤科技发布新一代轻量化多模智能体模型SenseNova6.7-Lite,专为满足真实世界流需求设计。该模型采用生多模架构,能直接理解复杂布局、文档结构和财务图表,实现“看、想、做”一体化,提升数据分析、深度调研和PPT生成等任务成功率。技术上,它取消视觉转中间层,以更小参数量实现智能体能力跨越式提升。
初创团队Genesis AI发布首个机器人基础模型GENE-26.5,标志着通用机器人在高难度非结构化任务上取得突破。演示中,机器人展现惊人灵活性与自主性,能完成单手打蛋、解魔方等精细任务,提升了对力度、逻辑、空间感知及节奏精准度的控制能力。
SAP近日宣布收购成立仅18个月的德国初创公司Prior Labs,并计划未来四年投入约10亿欧元,打造专注于结构化数据的企业AI实验室。此举旨在弥补大语言模型在处理表格数据等企业核心业务流程中的短板,将AI应用从文本转向企业数据命脉。
一款集成在Blender中的AI插件,可通过文本描述直接生成高质量、拓扑结构清晰的3D模型。
将视频文件转换为结构化数据,为您的LLM提供支持。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
非结构化数据处理平台,助力企业快速构建行业数据集并集成到LLM RAG知识库
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
hitonet
Hito 1.7B 是一个专为 llama.cpp、Ollama、LM Studio 等工具优化的 GGUF 量化版本模型,具备 17 亿参数,采用嵌套认知推理(NCR)方法,能够实现结构化、自我纠错的思维模式,提升推理准确性与透明度。
NewBie-AI
NewBie image Exp0.1 是一个基于 Next-DiT 架构开发的高效图像生成基础模型,专门用于生成高质量的动漫风格图像。它融合了先进的文本编码器和视觉组件,支持自然语言和结构化标签输入,是多角色动漫图像生成的强大工具。
vanta-research
Atom-Olmo3-7B是基于Olmo-3-7B-Instruct微调的语言模型,专门为协作式问题解决和创造性探索而设计。该模型在处理复杂问题时能提供深思熟虑且结构化的分析,同时保持引人入胜的对话风格,具有Apache 2.0开源许可证。
Dogacel
这是一个基于原始DeepSeek-OCR模型的优化版本,专门支持在苹果金属性能着色器(MPS)和CPU上进行推理的OCR模型。它能够从图像中提取文本并转换为结构化格式,支持多语言文档识别。
dogeater1612
这是一个基于Google Gemma 2 9B模型微调的荷兰语患者模拟模型,专门为医疗教育场景设计。模型始终以固定的JSON结构响应,模拟一位刚做完手术正在康复的患者'玛丽亚',支持护理专业学生在安全环境中锻炼沟通和临床推理能力。
nvidia
NVIDIA Nemotron Parse v1.1 TC 是一款先进的文档语义理解模型,能够从图像中提取具有空间定位的文本和表格元素,生成结构化注释,包括格式化文本、边界框和语义类别。相比前一版本,速度提升20%,并保留无序元素的页面顺序。
NVIDIA Nemotron Parse v1.1 是一款先进的文档解析模型,专门用于理解文档语义并提取具有空间定位的文本和表格元素。它能够将非结构化文档转换为机器可读的结构化表示,克服了传统OCR在处理复杂文档布局时的局限性。
mudasir13cs
这是一个基于Google Gemma-3-4B-IT模型微调的文本生成模型,专门用于根据演示模板元数据生成多样化且相关的搜索查询。该模型使用LoRA适配器进行高效微调,是结构化文档字段自适应密集检索框架的关键组成部分。
prithivMLmods
Chandra是一款高精度的OCR模型,能够将图像和PDF转换为结构化输出,如Markdown、HTML和JSON,同时保留详细的布局信息。支持40多种语言,擅长处理复杂的文档元素。
Prior-Labs
TabPFN-2.5是基于Transformer架构的表格基础模型,利用上下文学习技术,能够在一次前向传播中解决表格预测问题,为结构化表格数据提供高效的回归和分类解决方案。
yanolja
YanoljaNEXT-Rosetta-27B-2511是基于Gemma3架构微调的270亿参数解码器语言模型,专门为结构化数据翻译设计,能在保留数据结构的同时实现多语言间的高效准确翻译。
Smith-3
这是一个专为圣西蒙大学科学与技术学院学生设计的微调AI模型,集成在TecnoTime应用程序中,帮助学生保持学习组织性、提高学术连续性,通过结构化通知和激励信息强化学习习惯。
Mungert
Nanonets-OCR2-1.5B-exp GGUF 是一款强大的图像到markdown的OCR模型,能够将文档转换为结构化的markdown格式,并进行智能内容识别和语义标记,支持多语言文档处理。
Nanonets-OCR2-3B GGUF模型是专为文档处理设计的强大工具,能够将各类文档智能转换为结构化的Markdown格式,具备OCR、图像转文本、PDF转Markdown以及视觉问答等多种先进识别和处理能力。
NexaAI
Qwen3-VL-8B-Thinking是阿里云Qwen团队开发的80亿参数多模态大语言模型,专为深度多模态推理设计,支持视觉理解、长上下文处理和结构化思维链生成,在复杂推理任务中表现出色。
EpistemeAI
这是第一代强大的vibe-code大语言模型,经过优化可直接根据结构松散的'氛围编码'提示生成自然语言和代码补全。相比早期模型,它具有更低的提示工程开销、更平滑的潜在空间插值,更容易引导生成可用代码。
briaai
FIBO是首个专为长结构化描述训练的开源文本到图像模型,为可控性、可预测性和特征解耦设定了新标准。该模型拥有80亿参数,仅使用有许可的数据进行训练,支持专业工作流程需求。
John6666
专注于文本到图像生成的动漫风格模型,能够生成具有可爱女孩形象的2D插画、人物肖像和角色设定,图像具有动态姿势、清晰结构和强烈光照等特点。
onnx-community
Granite Docling 258M是一个基于ONNX格式的图像文本转文本模型,专门用于文档理解和处理。该模型能够将图像中的文档内容转换为结构化的文本格式,支持多模态输入处理。
unsloth
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备结构化的聊天格式,在指令遵循和工具调用能力方面表现优异。
为Nuxt/Vite应用提供MCP服务器支持,帮助模型更好地理解应用结构。
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本RPG和互动叙事,帮助AI维护跨对话的结构化记忆。
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本角色扮演游戏和互动叙事。它通过动态模式定义和自动生成工具,帮助AI在对话中维护一致且结构化的记忆,实现更丰富、更动态的交互体验。
DB MCP Server是一个支持多数据库的服务器,实现了模型上下文协议(MCP),为AI助手提供结构化访问数据库的能力。它支持MySQL和PostgreSQL,可同时连接多个数据库,自动生成专用工具,并遵循清晰架构设计。
DB MCP Server是一个实现模型上下文协议(MCP)的多数据库服务器,为AI助手提供结构化访问多种数据库的能力。
FileScopeMCP是一个基于TypeScript的代码分析工具,通过计算文件重要性评分、追踪依赖关系、生成可视化图表和添加文件摘要,帮助开发者快速理解代码库结构。支持多语言项目分析,提供Mermaid图表生成和持久化存储功能,可与Cursor的模型上下文协议集成。
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
该项目实现了模型上下文协议(MCP)作为个人智能框架(PIF)的实践方案,通过结构化工具和渐进式交互模式,为人类与AI之间构建有意义的理解发展空间。
基于Google LangExtract库的Web界面、API和MCP服务,支持使用LLM从文本中提取结构化信息,提供可视化界面和多种模型集成。
MCP逻辑求解器是一个结合大型语言模型与形式化定理证明能力的强大推理系统,支持自然语言和一阶逻辑输入,通过Prover9/Mace4进行自动验证,并提供结构化推理和解释。
GitHub仓库MCP服务器,为AI模型提供访问GitHub仓库内容作为上下文的工具,支持获取文件内容、仓库结构和过滤功能。
LangExtract MCP Server是一个基于FastMCP的服务器,通过Google Gemini模型从非结构化文本中提取结构化信息,为Claude Code等AI助手提供文本信息提取能力,支持智能缓存和持久连接。
OLS MCP服务器是一个为大型语言模型提供本体查询服务的工具,通过连接EBI本体查询服务API,帮助AI助手准确获取生物医学领域的本体术语、概念和层次结构。
TOON-MCP是一个模型上下文协议服务器,通过将冗长的JSON结构自动转换为令牌优化对象表示法(TOON),在AI辅助开发工作流中可减少高达60%的令牌消耗。
Spring MCP Bridge是一个自动化工具,可将Spring Boot应用的REST端点转换为MCP服务器,使AI助手能直接与API交互。支持自动扫描端点、保留模型结构、提取文档注释,无需修改现有代码。
一个基于MCP协议的代码审查服务器,利用Repomix和大型语言模型对代码进行结构化分析并提供审查建议。
DeepResearch MCP是一个基于模型上下文协议(MCP)的智能研究助手,通过自动网络搜索、内容分析和结构化报告生成,提供全面的研究支持。
FEGIS是一个基于Anthropic模型上下文协议的结构化认知框架,支持通过模式定义认知工具并持久化存储认知产物。
OpenAlex MCP Server是一个开源项目,实现了模型配置协议(MCP),为AI助手提供全球学术文献的结构化访问服务。