Fin-R1:基于Qwen2.5-7B强化学习训练的金融大模型,7B参数击败行业巨头
金融科技领域迎来一位强劲新秀。上海财经大学统计与数据科学学院张立文教授团队(SUFE-AIFLM-Lab)联合财跃星辰共同研发的Fin-R1模型正式开源,以惊人的性能引发业界广泛关注。这款基于Qwen2.5-7B的金融专用大模型通过强化学习训练,在多项金融基准测试中达到了领先水平。令人惊叹的是,Fin-R1仅凭7B参数规模,就成功超越了大多数同等规模甚至数十倍规模的竞争对手。在金融表格推理(FinQA)和对话式金融QA(ConvFinQA)等关键任务中,Fin-R1更是摘得桂冠,展现出卓越的金融领域理解能力。这