通義千問数学モデルQwen2 Math Demo公開、72B版がGPT-4を凌駕
アリババの「通義千問」チームが、Qwen2Math Demoという数学モデルを発表しました。このモデルは、テキスト入力による数学問題、画像やスクリーンショット内の数式を処理する際に優れた性能を発揮し、MATHデータセットにおいてGPT-4を上回り、9.6%のスコア向上を達成しました。3つのバージョンが公開されており、特に72Bバージョンは数学の難問においてGPT-4を上回り、GSM8K、MATHなどの古典的なテストセットでもLlama-3.1を凌駕しています。モデルは専門的な…