阿里巴巴が最新数学モデルQwen2-Mathをオープンソース化、GPT-4oを凌駕する数学能力
阿里巴巴クラウドは、数学問題解決能力に特化した大規模言語モデル、Qwen2-Mathシリーズを発表しました。既存のオープンソースモデルを上回り、GPT-4、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405Bなどの著名なクローズドソースモデルに匹敵する性能を達成しています。このシリーズはQwen2モデルをベースに、数学専門のコーパスを用いて深層学習されています。コーパスには、数学関連のウェブテキスト、専門書、コード例、試験問題に加え、Qwen2自身によって生成されたデータも含まれています。