OpenAIは、オープンソースの重み言語モデルとして「gpt-oss-120b」と「gpt-oss-20b」を発表しました。これは2019年にGPT-2をリリースして以来、OpenAIが初めてオープンソース分野に戻ってきたものです。この動きは、OpenAIの戦略的な転換を示すものであり、世界中のAI開発者に強力な推論ツールを提供し、AI技術の普及とイノベーションを加速します。
重みを公開することで開発者にさらに自由を
OpenAIの公式発表によると、gpt-oss-120bとgpt-oss-20bはApache 2.0ライセンスで公開され、開発者は自由にダウンロード・修正・商用利用が可能です。これらのモデルはそれぞれ1170億パラメータと210億パラメータの混合エキスパート(MoE)アーキテクチャを持ち、それぞれ51億と36億のパラメータをアクティブ化しており、効率的な推論と低リソース消費を両立しています。
- gpt-oss-120b: 単一のNVIDIA H100 GPU(80GBメモリ)で動作可能で、データセンターまたは高級企業向けのシナリオに適しています。性能はOpenAIの独自モデルo4-miniに近いです。特にコンテストプログラミング(Codeforces)、一般的な問題解決(MMLU、HLE)、および健康関連の質問(HealthBench)でのパフォーマンスが突出しています。
- gpt-oss-20b: 16GBメモリでエッジデバイスで動作可能で、ローカル推論やデバイス側アプリケーションに適しています。o3-miniと同等の性能を持ち、特にコンテスト数学(AIME2024&2025)などの分野で優れた結果を出しています。
これらのモデルは最大128kトークンの文脈長をサポートし、交互に密集型と局所的な帯状疎性の注目機構を使用し、グループ多クエリ注目技術により推論効率を向上させています。OpenAIはまた、「o200k_harmony」トークナイザーをオープンソース化し、開発のハードルを下げています。
安全と責任を重視し、オープンソースの新たな基準を定義
OpenAIは、gpt-ossシリーズにおいて安全性を最も重要な原則としています。オープンソースモデルが悪意のある微調整によって悪用されるリスクに対して、OpenAIはgpt-oss-120bに対して敵対的微調整テストを行い、「準備フレームワーク(Preparedness Framework)」を通じて検証しました。その結果、生物、化学、サイバーセキュリティ分野においても、悪意ある最適化を行ったとしても高いリスク能力には到達していないことが確認されました。外部のセキュリティ専門家の審査によって、モデルのセキュリティ基準がさらに高められました。
さらに、OpenAIは開発者がモデルを使用する際、自身のニーズに基づいて追加のセキュリティ対策を実施することを呼びかけています。モデルカードや研究論文では、セキュリティテストの結果が詳細に公開されており、オープンソースコミュニティにとって透明性のある参考資料となっています。
戦略的な転向、オープンソース競争と企業のニーズに対応
OpenAIの今回の行動は、オープンソース分野における競争に対応するための戦略的な調整だとされています。近年、MetaやDeepSeekなどはモデルを開放して市場を獲得し、OpenAIが閉鎖的な戦略を見直すよう圧力をかけました。OpenAIのCEOであるSam AltmanはReddit AMAで、会社の過去のオープンソース路線が「間違った方向だった」と述べており、今回のリリースはオープンソースへの約束を果たす第一歩です。
一方で、gpt-ossシリーズは企業のローカル配置とデータプライバシーのニーズを満たしています。金融、医療、法務など規制が厳しい業界では、モデルをプライベートサーバーに配置し、データ漏洩のリスクを回避できます。OpenAIはスウェーデン国立AIセンターAI Swedenなどの機関と提携し、特定の言語や文化背景でのモデルのパフォーマンス向上を目指した地域ごとの微調整を探索しています。
開発者エコシステムを支援し、AIの新しい可能性を開く
gpt-ossシリーズは、Transformers、vLLM、Ollama、llama.cppなどのさまざまな開発フレームワークをサポートしており、開発者はHugging FaceやGitHubなどのプラットフォームからモデルの重みをダウンロードし、OpenAIが提供する参照コードを使って迅速に使い始めることができます。モデルはチェーン・オブ・シンス(Chain-of-Thought)、ツール呼び出し(Pythonコード実行、ウェブ検索など)、構造化出力(JSON、YAMLなど)を備えており、スマートエージェントワークフローの構築に特に適しています。
さらに、モデルは3つの推論レベル(低、中、高)をサポートしており、開発者はタスクのニーズに応じて速度と精度のバランスを調整できます。
gpt-ossのリリースは、開発者に高性能で低コストなAIツールを提供し、AI業界の構図に深く影響を与えます。MetaのLlamaやDeepSeekのR1に比べて、gpt-ossは推論能力やツールの使用において明確な優位性を持っていますが、テキスト単モードの制限があるため、マルチモード機能はAPI経由で補完する必要があります。
OpenAIは、今後コミュニティからのフィードバックに基づき、gpt-ossシリーズを継続的に改善していく予定ですが、具体的なアップデート計画については公表していません。業界の専門家は、この行動がより多くの企業がオープンソースモデルとクラウドサービスを組み合わせたハイブリッドAI戦略を採用するきっかけになるかもしれないと述べています。
公式ブログ:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/