OpenAI发布两款开源安全推理模型gpt-oss-safeguard-120b与20b,标志着其在AI安全领域迈出重要步伐。面对日益严峻的AI安全挑战,此举旨在提升人工智能技术的可靠性与安全性,为行业发展提供关键保障。
MiniMax发布新一代开源推理模型M2,专攻智能Agent应用。采用混合专家架构,总参数量2300亿,每次推理仅激活100亿参数,实现每秒100个token的高输出速度,在实时交互场景中优势显著。
谷歌为Earth平台集成Gemini大模型,用户可通过自然语言对话实现地理推理,如识别风暴威胁、分析干旱风险。该功能基于地理空间推理模型,整合天气预报、卫星图像和人口数据等AI能力,提升交互效率。
蚂蚁百灵开源高效推理模型Ring-mini-sparse-2.0-exp,基于Ling2.0架构优化长序列解码。创新结合高稀疏比MoE结构与稀疏注意力机制,显著提升复杂长序列推理性能。通过架构与推理框架深度协同优化,有效应对长序列处理挑战。
一个通用框架,用于在测试时调节大型推理模型的思维进度。
全球最强的编程和推理模型,提升开发效率。
昆仑万维开源的高性能数学代码推理模型,性能卓越
全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
openai
$144
输入tokens/百万
$576
输出tokens/百万
200k
上下文长度
$14.4
$57.6
anthropic
$108
$540
minimax
-
1M
deepseek
$3.96
$15.77
128k
$4.03
$15.98
$21.6
google
baidu
$4
$16
$0.86
$1.3
$0.72
$2.88
$2
$8
32k
2M
perplexity
nous-research
4.1k
Mungert
gpt-oss-safeguard-20b是基于GPT-OSS-20b微调的安全推理模型,专门用于大语言模型输入输出过滤、在线内容标注以及信任与安全用例的离线标注。该模型采用Apache 2.0许可证,支持自定义策略和透明决策过程。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基于 gpt-oss 构建的安全推理模型,拥有 1170 亿参数(其中 51 亿为活跃参数)。该模型专门针对安全用例设计,能够根据提供的安全策略对文本内容进行分类和执行基础安全任务。
GPT-OSS-Safeguard-20B是基于GPT-OSS构建的210亿参数安全推理模型,专门针对安全相关的文本内容分类和过滤任务进行优化。该模型支持自定义安全策略,提供透明的推理过程,适用于大语言模型输入输出过滤、在线内容标注等安全用例。
dleemiller
FineCat-NLI Large是基于tasksource/ModernBERT-large-nli模型微调的自然语言推理模型,在高质量的FineCat-NLI数据集上训练,结合了多个优秀模型的优势,在NLI任务中表现出色,同时保持了ModernBERT架构的高效特性。
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大语言模型家族中的30亿参数推理模型,通过提升数据质量和训练方法实现了先进的推理能力。该模型在数学、科学、创意写作、工具使用等多个领域表现出色,支持多阶段课程学习和强化学习训练。
Thrillcrazyer
Qwen-1.5B_THIP是基于DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k数学数据集上使用TRL框架进行GRPO方法微调的数学推理模型。该模型专门针对数学问题解决进行了优化,具备较强的数学推理能力。
nightmedia
LFM2-8B-A1B-qx86-hi-mlx是基于MLX格式的高效推理模型,从LiquidAI/LFM2-8B-A1B转换而来。该模型采用混合专家架构,在推理任务中表现出卓越的效率,特别擅长复杂逻辑推理任务,同时支持多语言处理。
cpatonn
Apriel-1.5-15b-Thinker是ServiceNow开发的150亿参数多模态推理模型,具备文本和图像推理能力,性能可媲美比它大10倍的模型,在人工分析指数上获得52分,在企业领域基准测试中表现优异。
Apriel-1.5-15b-Thinker是ServiceNow Apriel SLM系列中的多模态推理模型,具有150亿参数,能够在文本和图像推理任务上与规模大10倍的模型竞争。该模型通过中期训练方案实现了卓越的推理能力,无需图像SFT训练或强化学习即可达到SOTA性能。
prithivMLmods
多拉多网络冲浪工具扩展版是基于通义千问3-4B微调的函数调用和智能推理模型,专为网络搜索编排、工具增强推理和动态问题解决而设计。它在智能决策、工具选择和结构化执行流程方面表现出色。
ServiceNow-AI
Apriel-1.5-15b-Thinker是ServiceNow开发的多模态推理模型,拥有150亿参数,在文本和图像推理任务上表现出色,性能可与比其大10倍的模型竞争。
gpt-oss-safeguard-20b是基于gpt-oss构建的安全推理模型,拥有210亿参数(其中36亿为活跃参数),专门针对安全用例设计。该模型可根据提供的安全策略对文本内容进行分类,并执行基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
gpt-oss-safeguard-120b是基于gpt-oss构建的安全推理模型,专门为安全用例设计。该模型能够根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
facebook
MobileLLM-R1是Meta发布的高效推理模型系列,包含140M、360M和950M三种规模。该模型专门针对数学、编程和科学问题进行优化,在参数规模较小的情况下实现了与大规模模型相当甚至更优的性能。
MobileLLM-R1是Facebook推出的高效推理模型系列,专注于数学、编程和科学问题解决。该模型在仅使用约2T高质量标记进行预训练的情况下,在多项基准测试中取得了优异性能。
MobileLLM-R1是专注于数学、编程和科学问题的高效推理模型系列,在较少训练数据下实现出色性能,提供完整的训练配方和数据源。
MobileLLM-R1是Meta推出的高效推理模型系列,专注于解决数学、编程和科学问题。该模型提供140M、360M和950M三个规模版本,具有出色的推理能力和可复现性。
MobileLLM-R1是MobileLLM系列中的高效推理模型,专门针对数学、编程和科学问题进行优化,在参数规模更小的情况下实现了更高的准确率,具有低训练成本和高效率的特点。
Hermes 4 14B是由Nous Research基于Qwen 3 14B开发的前沿混合模式推理模型,在数学、代码、STEM、逻辑、创造力和格式忠实输出等方面表现出色,具有显式思考过程和工具调用能力。
NousResearch
Hermes 4 14B是由Nous Research基于Qwen 3 14B开发的前沿混合模式推理模型,在数学、代码、STEM、逻辑推理、创造力和格式保真输出等方面有显著提升,同时保持了通用助手的质量和广泛的中立对齐。
本地化运行的智能代理系统,结合推理模型与工具调用模型
一个基于Model Context Protocol (MCP)的服务器,提供对DeepSeek-R1推理能力的访问,使非推理模型能够通过增强的思考生成更好的响应。
eShopLite是一个基于.NET的轻量级电子商务平台,提供语义搜索、云平台集成和智能推理模型等功能,帮助开发者快速构建和扩展在线商店。