注目すべきポイント:

🌟 新しいバージョンの DeepSeek R1(0528)がオープンソースとしてリリースされ、OpenAI o3モデルと同等のパフォーマンスを発揮しています。

💻 テストでは、R1のプログラミング能力が優れた成果を示し、複雑なタスクを成功に完了しました。

🔍 今後のモデルカードのリリースを楽しみにし、新バージョンの機能についてさらに詳しく解説されるのを待ち望んでいます。

本日未明、有名なオープンソースの大規模言語モデルプラットフォームである DeepSeek は、最新バージョン R1(0528)をリリースし、広範な注目を集めました。今回のリリースでは詳細な説明は添付されていませんでしたが、DeepSeek は「静かに」モデルを公開し、後ほどモデルカードを発表して、その機能についてさらに詳しく紹介する予定です。

情報によると、R1-0528バージョンのパフォーマンスは、有名なコードテストプラットフォーム Live CodeBench でのテスト結果から、OpenAI の最新の o3モデルと同等の能力を持っていることが明らかになりました。多くのユーザーがこの情報を受けて期待を寄せ、新バージョンを試すために手を動かし始めました。結果として、R1のスタイルやパフォーマンスが OpenAI の o3モデルに非常に似ていることが判明しました。

具体的には、R1-0528は専門的なスタイルでのレスポンスにおいて、o3-2.5の特徴を示しました。矢印やアスタリスクの使い方、そして結末で述べられる「なぜそれが機能するのか?」という表現においても、R1は非常に説得力のある答えを提供しました。OpenAI がモデルのパフォーマンス向上に力を入れている一方で、DeepSeek の R1は依然として非常に優れたパフォーマンスを見せ、R2のさらなる進化が期待されています。

image.png

Hyperbolic Labs の共同創設者兼CEOは、R1が「9.9」と「9.11」どちらが大きいのか正確に答える能力を引き続き保っていることを指摘しました。この能力は、その高い知能水準を示す重要なポイントです。また、著名なAI評論家ハイダー氏も新バージョンR1を絶賛しました。彼は、一度のプログラミングチャレンジでR1が単語スコアリングシステムを構築し、整然としたコードと実行可能なテストケースを提供したことを挙げています。初回の実行でも完璧にパスしました。

ハイダー氏は、このようなタスクを達成できるのは以前はo3モデルだけだったが、現在ではDeepSeekのR1もそのレベルに達していると述べています。彼は、モデルの思考時間はやや長くなったものの、その知能水準は驚異的だと感じたと語りました。さらに、ユーザーが次回リリースのR2を待つにつれ、DeepSeekがR1を過度に期待させるために意図的に過渡期のバージョンとして公開したのではないかとの意見も浮上しています。

新しいDeepSeek R1は、o3と同様に思考チェーンの自己修正を行い、クラウドのような創造的な構築能力を備えており、これは以前のバージョンにはなかったものです。公式のモデルカードがリリースされれば、AIGCオープンコミュニティがさらに詳細な解析を行ってくれることでしょう。これからのさらなる驚きを期待しましょう。

オープンソースのURL: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main