AWS推出Amazon Bedrock Custom Model Import功能,支持用戶部署20億和120億參數的GPT-OSS開源模型。該功能允許企業將現有應用遷移至AWS平臺,同時保持API兼容性。用戶只需上傳模型文件至Amazon S3,通過控制檯啓動導入,AWS將自動處理GPU配置和推理服務器搭建,簡化部署流程。
OpenAI發佈開源安全模型gpt-oss-safeguard,提供靈活透明的AI安全分類方案。該套件含120位/20位雙版本,採用Apache2.0開源協議,支持自由修改集成。創新性實現"實時策略解讀"功能,可在安全規則變更時無需重新訓練即完成適配,顯著降低系統維護成本與響應延遲。
OpenAI發佈兩款開源安全推理模型gpt-oss-safeguard-120b與20b,標誌着其在AI安全領域邁出重要步伐。面對日益嚴峻的AI安全挑戰,此舉旨在提升人工智能技術的可靠性與安全性,爲行業發展提供關鍵保障。
OpenAI發佈兩款開源AI安全模型gpt-oss-safeguard-120b/20b,基於Apache2.0許可允許自由使用。新模型突破傳統安全框架,支持開發者根據自定義安全策略進行推理分類,實現靈活可控的AI安全部署。
開放AI的GPT-OSS-120B和GPT-OSS-20B提供強大的推理能力,開發人員友好的功能,並採用Apache 2.0許可證,實現人工智能的民主化訪問。
bartowski
這是kldzj/gpt-oss-120b-heretic模型的量化版本,使用llamacpp進行量化處理,提供了多種量化類型選擇,包括BF16、Q8_0和MXFP4_MOE等特殊格式,顯著提升了模型運行效率。
這是p-e-w/gpt-oss-20b-heretic模型的量化版本,使用llama.cpp的imatrix技術進行量化處理。該模型是一個200億參數的大語言模型,提供了多種量化選項,從高質量到低質量不等,文件大小從41.86GB到11.52GB,適用於不同硬件條件。
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基於 gpt-oss 構建的安全推理模型,擁有 1170 億參數(其中 51 億為活躍參數)。該模型專門針對安全用例設計,能夠根據提供的安全策略對文本內容進行分類和執行基礎安全任務。
GPT-OSS-Safeguard-20B是基於GPT-OSS構建的210億參數安全推理模型,專門針對安全相關的文本內容分類和過濾任務進行優化。該模型支持自定義安全策略,提供透明的推理過程,適用於大語言模型輸入輸出過濾、在線內容標註等安全用例。
noctrex
這是慧慧GPT-OSS-120B-BF16-abliterated-v2模型的MXFP4_MOE量化版本,專門針對文本生成任務進行優化,提供高效的文本生成能力。該模型通過量化技術降低了計算和存儲需求,同時保持了良好的性能。
SiddhJagani
這是OpenAI GPT-OSS-20B模型的MLX格式8位量化版本,使用mlx-lm 0.28.2轉換,專為Apple Silicon優化,提供高效的文本生成能力
textcleanlm
這是一個基於 unsloth/gpt-oss-20b-BF16 基礎模型的內容保真模型,專門用於將原始文本轉換為簡潔、清晰的Markdown格式。模型採用Apache 2.0許可證,主要支持英語文本處理。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基於OpenAI gpt-oss-120b模型的優化版本,採用混合專家(MoE)架構,具備1200億總參數和50億激活參數。該模型支持商業和非商業使用,適用於文本生成任務,特別適合AI Agent系統、聊天機器人等應用開發。
MikeKuykendall
這是基於WeOpenML的GPT-OSS 20B模型的GGUF格式版本,首次實現了創新的MoE CPU專家卸載技術。該技術在保持完整生成質量的同時,實現了99.9%的顯存縮減,僅需2MB顯存即可運行200億參數的混合專家模型。
Jackrong
本項目通過創新的兩階段訓練流程,將GPT的推理能力蒸餾到Llama-3.1-8B模型中。首先通過監督微調進行知識蒸餾和格式對齊,然後利用強化學習激勵模型自主探索和優化推理策略,專注於數學推理領域的能力突破。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一個專注於網頁生成的人工智能模型,能夠利用 HTML、CSS、JS 和 Tailwind 技術生成單頁式網頁。該項目基於自定義模板進行訓練,採用監督微調方法,使用 GPT-OSS-120B 生成的數據集進行訓練。
EpistemeAI
本模型基於GPT-OSS-20B,藉助Unsloth強化學習框架進行微調,旨在優化推理效率,同時減少在從人類反饋中進行強化學習(RLHF)式訓練期間出現的漏洞。微調過程著重於對齊的魯棒性和效率,確保模型在不產生過多計算開銷的情況下保持推理深度。
基於microsoft/phi-4(14B)基礎模型的三階段訓練GRPO推理測試模型,通過SFT→RLHF→SFT流程微調,具備優秀的多步推理能力
openai
gpt-oss-safeguard-20b是基於gpt-oss構建的安全推理模型,擁有210億參數(其中36億為活躍參數),專門針對安全用例設計。該模型可根據提供的安全策略對文本內容進行分類,並執行基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
gpt-oss-safeguard-120b是基於gpt-oss構建的安全推理模型,專門為安全用例設計。該模型能夠根據提供的安全策略對文本內容進行分類,並執行一系列基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
mradermacher
這是一個基於AmanPriyanshu/gpt-oss-6.0b-specialized-all-pruned-moe-only-7-experts的量化版本模型,採用混合專家架構和剪枝技術,提供多種量化類型以滿足不同場景需求。模型支持英語文本生成任務。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的開放權重模型,專為強大推理、智能體任務和多樣化開發者用例設計。該模型具有210億參數(其中36億為活躍參數),採用混合專家架構,支持低延遲本地部署和特定場景應用。
leeminwaan
這是一個基於GPT架構的42億參數專家混合模型,經過剪枝優化並僅保留4個專家。提供多種量化版本,專為消費級硬件設計,支持高效推理和便捷部署。
2imi9
GPT-OSS-20B-NVFP4 是 OpenAI GPT-OSS-20B 模型的量化版本,採用 NVIDIA 先進的 NVFP4 量化格式。該模型在保持顯著內存效率提升的同時,相比 MXFP4 量化能提供更出色的準確率保留率,專為高性能推理場景設計。