通義千問數學模型Qwen2 Math Demo放出,72B版吊打GPT-4
阿里巴巴的“通義千問”團隊發佈了一款名爲Qwen2Math Demo的數學模型,該模型在處理文字輸入的數學問題、圖片和截圖中的公式方面表現出色,甚至在MATH數據集上的表現超越了GPT-4,提高了9.6%的分數。模型推出三個版本,其中72B版本尤其突出,不僅在數學難題上勝過GPT-4,還在GSM8K、MATH等經典測試集上超過了Llama-3.1。模型通過專門設計的數學語料庫進行訓練,包含高質量的數學文本、書籍、代碼和題目。Qwen2-Math在中文數據集CMATH和高考試題上同樣表現出色,各版本相對於同規模的基礎模型均有所提升。此模型爲數學問題提供了強大的解決方案,但使用時應注重自我學習和實踐。