Fin-R1:基於Qwen2.5-7B強化學習訓練的金融大模型,7B參數擊敗行業巨頭
金融科技領域迎來一位強勁新秀。上海財經大學統計與數據科學學院張立文教授團隊(SUFE-AIFLM-Lab)聯合財躍星辰共同研發的Fin-R1模型正式開源,以驚人的性能引發業界廣泛關注。這款基於Qwen2.5-7B的金融專用大模型通過強化學習訓練,在多項金融基準測試中達到了領先水平。令人驚歎的是,Fin-R1僅憑7B參數規模,就成功超越了大多數同等規模甚至數十倍規模的競爭對手。在金融表格推理(FinQA)和對話式金融QA(ConvFinQA)等關鍵任務中,Fin-R1更是摘得桂冠,展現出卓越的金融領域理解能力。這