中国大模型在AI算力竞争中实现“弯道超车”。最新数据显示,3月初中国大模型周调用量达4.19万亿Token,环比增长34.9%,连续两周超越美国(同期美国调用量3.63万亿Token,环比下降8.5%)。这一升一降的对比,凸显中国在AI应用领域的快速崛起。
美国AI行业出现罕见跨公司联合行动,OpenAI和Google DeepMind等30多名员工支持Anthropic起诉美国国防部,抗议其被列为供应链风险名单,认为此举武断且威胁行业发展。
2026年AI竞赛中,“小而美”模型成为企业落地关键。亚马逊宣布英伟达Nemotron 3 Nano模型登陆其Bedrock平台,深化双方AI基础设施合作。该模型以极致性价比为核心优势,为开发者提供高效生产力工具。
超过30名OpenAI与Google DeepMind员工联合支持Anthropic起诉美国国防部,反对将其列为“供应链风险”,认为此举滥用权力,损害AI产业发展。
基于腾讯开源模型,可将文本描述即时转化为高保真3D角色动画。
Kling Motion Control 3.0可创建15s内1080p角色视频及4K图像系列输出。
首个AI同事,可自动化任务、写代码、连接3000工具,实干而非仅答疑
专为3D艺术家打造,加速3D工作流程,让创作更高效。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Openai
$7.7
$30.8
200
Anthropic
$105
$525
$21
Alibaba
$4
$16
1k
$1
$10
256
$6
$24
$2
$20
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
128
Tencent
32
Deepseek
$12
mlx-community
本模型是 Mistral AI 发布的 Ministral-3-3B-Instruct-2512 指令微调模型的 MLX 格式转换版本。它是一个参数规模为 3B 的大型语言模型,专门针对遵循指令和对话任务进行了优化,并支持多种语言。MLX 格式使其能够在 Apple Silicon 设备上高效运行。
ss-lab
这是一个基于Meta LLaMA 3 8B模型,使用Unsloth框架进行高效微调,并转换为GGUF格式的轻量级文本生成模型。模型针对Alpaca数据集进行了优化,适用于本地部署和推理,特别适合在资源受限的环境中使用。
squ11z1
Hypnos-i2-32B是世界首个采用多物理熵(超导体、真空、核衰变)训练的320亿参数语言模型。它通过输入级量子正则化技术,从三个独立的量子熵源中学习真正的量子随机性,使其注意力机制对对抗性扰动具有鲁棒性,并能有效抵抗模式崩溃。
TeichAI
本模型是基于Qwen3-4B-Thinking-2507基础模型,使用高推理难度的Gemini 3 Pro预览数据集进行蒸馏训练得到的模型。它专注于提升在编码和科学领域的复杂推理能力,通过特定数据集的训练,旨在将大型模型(如Gemini 3 Pro)的推理能力高效地迁移到较小规模的模型中。
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
MuXodious
Gemma 3n E4B IT 是谷歌推出的轻量级多模态开放模型,基于与Gemini模型相同的研究构建。该模型支持文本、音频和视觉输入,适用于多种任务,采用MatFormer架构实现高效参数利用。
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
black-forest-labs
FLUX.2 [dev] 是一个拥有320亿参数的校正流变压器模型,专门用于图像生成、编辑和组合任务。该模型在文本到图像生成、单参考编辑和多参考编辑方面处于领先水平,无需微调即可实现角色、对象和风格参考,支持个人、科学和商业用途。
Hypnos i1-8B 是基于 Nous Hermes 3(Llama 3.1 8B)的专业推理模型,专注于复杂逻辑、思维链推理和数学问题求解。该模型在混合量子-经典机器学习领域进行了独特探索,通过引入量子噪声注入提升了模型的创造力和推理能力。
prithivMLmods
Olmo-3-Think是艾伦人工智能研究所推出的完全开源的语言模型系列,包含7B和32B两种规模。该模型经过专门训练,能够展现明确的推理链,支持透明的逐步推理和可检查的中间思维痕迹,在推理、数学和代码任务中表现出色。
ubergarm
这是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多种量化选项,从高精度的Q8_0到极度压缩的smol-IQ1_KT,满足不同硬件条件下的部署需求。该模型支持32K上下文长度,采用MLA架构,专为对话场景优化。
Justin331
SAM 3 是 Meta 推出的第三代可提示分割基础模型,统一支持图像和视频分割任务。相比前代 SAM 2,它引入了开放词汇概念分割能力,能够处理大量文本提示,在 SA-CO 基准测试中达到人类表现的 75-80%。
RiosWesley
巴西范围路由模型是一个基于Gemma 3 270M的微调微型大语言模型,专为巴西外卖服务系统设计,可作为极快速且轻量级的意图分类器(路由)。该模型使用Unsloth进行训练并转换为GGUF格式。
Nanbeige
楠米色4-3B-思维-2511是楠米色系列的最新增强版本,通过先进的蒸馏技术和强化学习优化,在紧凑的3B参数规模下实现了强大的推理能力。该模型在Arena-Hard-V2和BFCL-V4等基准测试中,在参数小于32B的模型中取得了最先进(SOTA)成果。
allenai
Olmo 3是由Allen Institute for AI开发的新一代语言模型家族,包含7B和32B的指令和思维变体。该模型在长链式思维方面表现出色,能显著提升数学和编码等推理任务的性能。所有代码、检查点和训练细节都将公开,推动语言模型科学发展。
Olmo 3是由Allen Institute for AI开发的新一代语言模型系列,包含7B和32B两种规模,有指令和思考两种变体。该模型基于Dolma 3数据集进行预训练,在Dolci数据集上进行后训练,具备长链式思维能力,在数学和编码等推理任务上表现优异。
Olmo 3是由Allen Institute for AI开发的一系列语言模型,包含7B和32B两种规模,具有指令式和思考式两种变体。该模型在长链式思维方面表现出色,能有效提升数学和编码等推理任务的性能。采用多阶段训练方式,包括有监督微调、直接偏好优化和可验证奖励的强化学习。
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
Olmo 3是由Allen Institute for AI开发的开源语言模型系列,包含7B和32B两种规格,分为指令(Instruct)和思考(Think)两种变体。该模型具有出色的长链思维能力,能够显著提升数学和编码等推理任务的表现。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
微软官方MCP服务器集合,提供Azure、GitHub、Microsoft 365、Fabric等多种服务的AI助手集成工具,支持本地和远程部署,帮助开发者通过标准化协议连接AI模型与各类数据源和工具。
BlenderMCP通过MCP协议将Blender与Claude AI连接,实现AI辅助3D建模与场景控制
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口项目,支持通过自然语言生成3D资产并导入Blender。
Blender MCP VXAI 是一个强大的集成工具,允许用户通过自然语言控制 Blender,实现 3D 建模、动画和场景的创建与修改。它简化了复杂操作,并支持实时导出到项目中。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
一个支持多链交互的EVM兼容区块链服务MCP服务器,提供统一的区块链操作接口,支持30+网络和ENS解析。
Lokka是一个基于模型-上下文-协议(MCP)的服务器,用于通过自然语言操作Microsoft Graph和Azure RM API,实现对Azure和Microsoft 365租户的查询与管理。
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
RhinoMCP是一个连接Rhino 3D建模软件与AI代理的工具,通过Model Context Protocol实现双向交互,支持3D对象操作、文档检查和脚本执行。
Tripo MCP Server是一个连接AI助手与Tripo AI的接口工具,支持通过自然语言生成3D资产并导入Blender。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
一个提供只读访问Outlook/微软365日历的MCP服务器,支持通过API或命令行工具查询日历事件。
OpenManus是一个无需邀请码即可实现各种想法的开源项目,由MetaGPT团队成员在3小时内构建完成。它提供了一个简单的实现,允许用户创建自己的智能代理,并支持多种语言和配置。项目欢迎建议、贡献和反馈,未来计划包括更好的规划、实时演示、回放功能、RL微调模型和全面的基准测试。
这是一个用于Microsoft Dynamics 365 Finance & Operations的Python客户端库和MCP服务器,提供完整的OData操作、元数据管理、标签缓存和AI助手集成功能。
一个用于通过APIC REST API配置和管理Cisco ACI(应用中心基础设施)织物的MCP服务器,提供超过35个工具,涵盖租户、应用配置文件、端点组、网桥域、VRF、合约和健康监控等完整织物管理功能。
Payload CMS 3.0 MCP服务器是一个专为Payload CMS开发设计的模型上下文协议服务器,提供代码验证、模板生成和项目脚手架功能,帮助开发者遵循最佳实践构建应用。
这是一个开源的MCP服务器项目,提供对瑞典议会和政府公开数据的实时查询与检索功能,包含32个专用工具,支持本地部署或远程使用。
FastMCP-Scala是一个基于Scala 3的高层次、开发者友好的库,用于构建模型上下文协议(MCP)服务器。它提供了ZIO效果处理、注解驱动的API、自动JSON模式生成以及与Java MCP SDK的无缝集成。
Azure OpenAI DALL-E 3集成服务器,通过MCP协议提供图像生成与下载功能