DeepSeek-V3:LlamaやQwenを凌駕する超大型オープンソースAIモデル公開
2024年12月26日、中国の人工知能スタートアップ企業DeepSeekは、最新の超大型モデルDeepSeek-V3を発表しました。このモデルは、そのオープンソース技術と、大手AIプロバイダーに挑戦する革新的な性能で注目を集めています。DeepSeek-V3は6710億個のパラメータを備え、特定のパラメータを活性化させる専門家混合アーキテクチャ(mixture-of-experts architecture)を採用することで、与えられたタスクを正確かつ効率的に処理します。DeepSeekが提供するベンチマークによると…