OpenAI發佈兩款開源安全推理模型gpt-oss-safeguard-120b與20b,標誌着其在AI安全領域邁出重要步伐。面對日益嚴峻的AI安全挑戰,此舉旨在提升人工智能技術的可靠性與安全性,爲行業發展提供關鍵保障。
MiniMax發佈新一代開源推理模型M2,專攻智能Agent應用。採用混合專家架構,總參數量2300億,每次推理僅激活100億參數,實現每秒100個token的高輸出速度,在實時交互場景中優勢顯著。
谷歌爲Earth平臺集成Gemini大模型,用戶可通過自然語言對話實現地理推理,如識別風暴威脅、分析乾旱風險。該功能基於地理空間推理模型,整合天氣預報、衛星圖像和人口數據等AI能力,提升交互效率。
螞蟻百靈開源高效推理模型Ring-mini-sparse-2.0-exp,基於Ling2.0架構優化長序列解碼。創新結合高稀疏比MoE結構與稀疏注意力機制,顯著提升複雜長序列推理性能。通過架構與推理框架深度協同優化,有效應對長序列處理挑戰。
一個通用框架,用於在測試時調節大型推理模型的思維進度。
全球最強的編程和推理模型,提升開發效率。
崑崙萬維開源的高性能數學代碼推理模型,性能卓越
全新多模態推理模型,支持圖文輸入、文字輸出,具備高精度圖像感知與複雜推理能力。
openai
$144
輸入tokens/百萬
$576
輸出tokens/百萬
200k
上下文長度
$14.4
$57.6
anthropic
$108
$540
minimax
-
1M
deepseek
$3.96
$15.77
128k
$4.03
$15.98
$21.6
google
baidu
$4
$16
$0.86
$1.3
$0.72
$2.88
$2
$8
32k
2M
perplexity
nous-research
4.1k
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基於 gpt-oss 構建的安全推理模型,擁有 1170 億參數(其中 51 億為活躍參數)。該模型專門針對安全用例設計,能夠根據提供的安全策略對文本內容進行分類和執行基礎安全任務。
GPT-OSS-Safeguard-20B是基於GPT-OSS構建的210億參數安全推理模型,專門針對安全相關的文本內容分類和過濾任務進行優化。該模型支持自定義安全策略,提供透明的推理過程,適用於大語言模型輸入輸出過濾、在線內容標註等安全用例。
ServiceNow-AI
Apriel-H1-15b-Thinker 是一款擁有150億參數的混合推理模型,結合了Transformer注意力機制和Mamba狀態空間層,在推理、數學和編碼等方面表現出色,具備高效性和可擴展性。
dleemiller
FineCat-NLI Large是基於tasksource/ModernBERT-large-nli模型微調的自然語言推理模型,在高質量的FineCat-NLI數據集上訓練,結合了多個優秀模型的優勢,在NLI任務中表現出色,同時保持了ModernBERT架構的高效特性。
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大語言模型家族中的30億參數推理模型,通過提升數據質量和訓練方法實現了先進的推理能力。該模型在數學、科學、創意寫作、工具使用等多個領域表現出色,支持多階段課程學習和強化學習訓練。
Thrillcrazyer
Qwen-1.5B_THIP是基於DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k數學數據集上使用TRL框架進行GRPO方法微調的數學推理模型。該模型專門針對數學問題解決進行了優化,具備較強的數學推理能力。
nightmedia
LFM2-8B-A1B-qx86-hi-mlx是基於MLX格式的高效推理模型,從LiquidAI/LFM2-8B-A1B轉換而來。該模型採用混合專家架構,在推理任務中表現出卓越的效率,特別擅長複雜邏輯推理任務,同時支持多語言處理。
cpatonn
Apriel-1.5-15b-Thinker是ServiceNow開發的150億參數多模態推理模型,具備文本和圖像推理能力,性能可媲美比它大10倍的模型,在人工分析指數上獲得52分,在企業領域基準測試中表現優異。
Apriel-1.5-15b-Thinker是ServiceNow Apriel SLM系列中的多模態推理模型,具有150億參數,能夠在文本和圖像推理任務上與規模大10倍的模型競爭。該模型通過中期訓練方案實現了卓越的推理能力,無需圖像SFT訓練或強化學習即可達到SOTA性能。
prithivMLmods
多拉多網絡衝浪工具擴展版是基於通義千問3-4B微調的函數調用和智能推理模型,專為網絡搜索編排、工具增強推理和動態問題解決而設計。它在智能決策、工具選擇和結構化執行流程方面表現出色。
Apriel-1.5-15b-Thinker是ServiceNow開發的多模態推理模型,擁有150億參數,在文本和圖像推理任務上表現出色,性能可與比其大10倍的模型競爭。
gpt-oss-safeguard-20b是基於gpt-oss構建的安全推理模型,擁有210億參數(其中36億為活躍參數),專門針對安全用例設計。該模型可根據提供的安全策略對文本內容進行分類,並執行基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
gpt-oss-safeguard-120b是基於gpt-oss構建的安全推理模型,專門為安全用例設計。該模型能夠根據提供的安全策略對文本內容進行分類,並執行一系列基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
facebook
MobileLLM-R1是Meta發佈的高效推理模型系列,包含140M、360M和950M三種規模。該模型專門針對數學、編程和科學問題進行優化,在參數規模較小的情況下實現了與大規模模型相當甚至更優的性能。
MobileLLM-R1是Facebook推出的高效推理模型系列,專注於數學、編程和科學問題解決。該模型在僅使用約2T高質量標記進行預訓練的情況下,在多項基準測試中取得了優異性能。
MobileLLM-R1是專注於數學、編程和科學問題的高效推理模型系列,在較少訓練數據下實現出色性能,提供完整的訓練配方和數據源。
MobileLLM-R1是Meta推出的高效推理模型系列,專注於解決數學、編程和科學問題。該模型提供140M、360M和950M三個規模版本,具有出色的推理能力和可復現性。
MobileLLM-R1是MobileLLM系列中的高效推理模型,專門針對數學、編程和科學問題進行優化,在參數規模更小的情況下實現了更高的準確率,具有低訓練成本和高效率的特點。
Hermes 4 14B是由Nous Research基於Qwen 3 14B開發的前沿混合模式推理模型,在數學、代碼、STEM、邏輯、創造力和格式忠實輸出等方面表現出色,具有顯式思考過程和工具調用能力。
本地化運行的智能代理系統,結合推理模型與工具調用模型
eShopLite是一個基於.NET的輕量級電子商務平臺,提供語義搜索、雲平臺集成和智能推理模型等功能,幫助開發者快速構建和擴展在線商店。
一個基於Model Context Protocol (MCP)的服務器,提供對DeepSeek-R1推理能力的訪問,使非推理模型能夠通過增強的思考生成更好的響應。