オープンソースAIの新たな高みへ:DeepSeek V3がLlama3.1を凌駕、14.8兆トークンの訓練データ
中国の人工知能企業DeepSeekは先日、画期的なオープンソース大規模言語モデルDeepSeek V3を発表しました。6710億パラメーターを持つこのモデルは、MetaのLlama3.1を規模で上回り、複数のベンチマークテストにおいて、GPT-4を含む主要なクローズドソースモデルを上回る性能を示しました。DeepSeek V3は、その強力な性能と効率的な開発プロセスが大きな特徴です。このモデルは、プログラミングプラットフォームCodeforcesのコンテストで優れた成績を収め、テストにおいて…