Mistral社は、オープンソースのコード生成モデルCodestralの最新バージョンであるCodestral25.01を発表しました。今回のアップデートにより、同モデルのプログラミング分野における競争力が大幅に向上し、開発者により効率的なコード生成体験を提供することを目指しています。
Mistralのブログ記事によると、Codestral25.01のアーキテクチャは最適化されており、同等のモデルの中で「絶対的なリーダー」となることを約束しており、コード生成速度は以前のバージョンの2倍です。この新バージョンは、以前のモデルの長所を引き続き維持し、低遅延と高頻度操作に重点を置いており、コード修正、テスト生成、コード補完などのタスクをサポートしています。Mistralは、大量のデータを持つ企業やモデル常駐使用シナリオにとって特に重要であると述べています。
様々なベンチマークテストにおいて、Codestral25.01はPythonコーディングテストで優れたパフォーマンスを示し、HumanEvalテストで86.6%の高得点を達成し、以前のバージョンのCodestral、Codellama70B Instruct、DeepSeek Coder33B Instructを上回りました。
開発者は、MistralのIDEプラグインパートナーを通じてCodestral25.01を使用できます。さらに、ユーザーはMistralのプラットフォームとGoogle Vertex AIを通じてこのモデルのAPIにアクセスできます。現在、このモデルはAzure AI Foundryでプレビュー版が提供されており、Amazon Bedrockでも提供開始予定です。
2023年5月にCodestralが初めてリリースされて以来、Mistralは製品のアップグレードとイノベーションを継続的に推進してきました。以前リリースされたCodestral-MambaモデルはMambaアーキテクチャに基づいており、より長いコード文字列を生成し、より多くの入力を処理できます。注目すべきは、Mistralが発表後数時間でCodestral25.01がCopilot Arenaのランキングで急上昇し、この新しいモデルに対する市場の強い関心を示しています。
基礎モデルの初期機能の1つとしてコード記述がありますが、OpenAIのo3やAnthropicのClaudeなどの汎用モデルにも適用されていますが、過去1年間で、プログラミングに特化したモデルは目覚ましい進歩を遂げ、多くの場合、大型汎用モデルを凌駕しています。最近では、アリババ、DeepSeek Coder、マイクロソフトも新しいプログラミングモデルを発表しており、競争はますます激化しています。
多くの開発者の間では、汎用モデルとプログラミングに特化したモデルのどちらを選択すべきかについて議論があります。一部の開発者は、Claudeのような汎用モデルを使用することを好む一方で、プログラミングタスクのニーズは、専用のモデルの継続的な出現を促進しています。Codestralはコーディングデータに特化してトレーニングされているため、プログラミングタスクでのパフォーマンスは自然と優れています。
公式ブログ:https://mistral.ai/news/codestral-2501/
要点:
🌟 MistralがCodestral25.01を発表、コード生成速度は以前のバージョンの2倍に。
💻 Pythonコーディングテストで優れたパフォーマンスを発揮し、HumanEvalテストで86.6%のスコアを獲得。
📈 Codestral25.01はCopilot Arenaでトップに急上昇し、開発者から大きな注目を集めています。