DeepSeekは先日、最新の大規模言語モデルR1を正式に発表し、オープンソース化しました。このモデルは性能が非常に高く、OpenAIのo1正式版に匹敵すると評価されています。この発表は、中国のAI技術における大きな進歩を示すだけでなく、世界中のAI開発者にも新たな選択肢を提供します。

DeepSeek R1は、後学習段階で強化学習技術を大規模に適用しており、アノテーションデータが非常に少ない場合でも、モデルの推論能力を大幅に向上させています。数学、コード、自然言語推論などの重要なタスクにおいて、DeepSeek R1の性能はOpenAI o1正式版とほぼ同等であり、その強力な能力を示しています。

image.png

オープンソースコミュニティへの貢献として、DeepSeekはDeepSeek-R1とDeepSeek-R1-Zeroの2つのモデルをオープンソース化しました。どちらも660Bパラメーター規模です。さらに、DeepSeekはモデル蒸留技術を用いて、32Bと70Bパラメーターのモデルを含む6つの小型モデルもオープンソース化しました。これらの小型モデルは、OpenAIのo1-miniをいくつかの能力で上回り、オープンソースエコシステムをさらに豊かにします。

image.png

API価格設定においても、DeepSeekはオープンな姿勢を示しています。キャッシュヒットの場合、100万入力トークンあたりわずか1元、キャッシュミスは4元です。出力トークンは100万あたり16元で、全体的な価格設定は競争力があります。

image.png

さらに重要なのは、DeepSeek R1が標準的なMITライセンスを採用しており、ユーザーは無制限に商用利用できることです。同時に、DeepSeekはユーザーがR1の出力結果を利用して他のモデルを訓練することを奨励し、AI技術の普及と発展を促進しています。DeepSeek R1のオープンソース化は、世界中の開発者にとってより強力なツールを提供し、AI技術の革新と応用に新たな活力を注入し、AI技術の平等化時代の到来を加速させるでしょう。

論文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

APIドキュメント:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model