フランスのユニコーン企業であるMistral AIは、12月2日にMistral3シリーズモデルをリリースしました。このシリーズには、3B、8B、14Bの3つの小規模な密接モデルと、これまでで最も強力なMistral Large3が含まれており、エッジデバイスからエンタープライズレベルの推論に至るまで、あらゆるシナリオに対応しています。新しいモデルはApache 2.0オープンソースライセンスを採用しており、重みはHugging FaceとGitHubに同期してアップロードされ、商業的に無料で使用可能です。

Mistral3シリーズは、前世代の低遅延の利点を維持しながら、コンテキスト長を128Kに拡張し、MMLU、HumanEval、MT-Benchなどの主要なベンチマークでLlama3.1と同等の性能を達成またはわずかに上回っています。会社は、「スライディングウィンドウアテンション+グループクエリアテンション」のハイブリッド設計により、14Bバージョンは1枚のA100で128Kの全コンテキストの推論が可能となり、バッチ処理ではスループットが42%向上したと述べています。これは、学術研究、ビジネス分析、教育コンテンツ生成などのアプリケーションにおいてより高いコストパフォーマンスを提供します。

メタバース サイエンスフィクション サイバーパンク 描画 (5)大規模モデル

図の出典コメント:画像はAIによって生成されており、画像のライセンス提供者はMidjourneyです。

Mistral AIの共同創設者兼首席科学者であるGuillaume Lample氏は、「私たちの使命は、高性能AIをサプライヤーのロックインから解放することです。開発者は大きな予算を必要とせずとも、非オープンソースのソリューションと同等の結果を得ることができます」と語っています。現在、Mistral Large3は会社の公式プラットフォームLe PlatformeでAPIが利用可能であり、価格は100万トークンあたり入力が0.8ドル、出力が2.4ドルで、GPT-4oの半額程度であり、微調整やプライベート配備もサポートされています。業界の分析によると、ヨーロッパのGDPR準拠の優位性とオープンウェイト戦略を活かすことで、Mistral3は中小企業および公的部門市場をさらに獲得し、AIインフラの「多極化」競争を推進する可能性があります。