阿里云、新たな数理推論モデルQwen2.5-Math-PRMを発表。7BバージョンはGPT-4oを凌駕
本日、阿里云通義チームは、新たな数理推論プロセス報酬モデルQwen2.5-Math-PRMを発表しました。72Bと7Bの2つのサイズが提供され、同種のオープンソースプロセス報酬モデルを大幅に上回る性能を示し、特に推論エラーの識別において顕著な成果を上げています。特に7Bバージョンは、業界で広く利用されているGPT-4oを上回る驚異的な成果を達成し、阿里云の数理推論モデル開発における重要な一歩となりました。