AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

360智脑团队成功复现Deepseek强化学习效果,发布开源模型Light-R1-14B-DS

近日,360智脑团队宣布成功复现Deepseek的强化学习效果,并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和 DeepSeek-R1-Distill-Qwen-32B,成为业界首款在14B参数规模上实现强化学习效果的模型,显著提升了数学推理能力,成绩超过大多数32B级别模型。与 DeepSeek-R1-14B 相比,Light-R1-14B-DS*在数学竞赛任务中表现突出:在 AIME24测试中提升4.3分,在 AIME25中更是提高10分。此外,在数学推理任务 GPQA 上,该模型取得61.7分 的优异成绩。为实现这一突破,360智脑团队采用了两

19.2k 昨天
360智脑团队成功复现Deepseek强化学习效果,发布开源模型Light-R1-14B-DS

AI产品

查看更多
Light-R1-14B-DS

Light-R1-14B-DS

一款开源的14B参数量的数学模型,通过强化学习训练,性能卓越。

AI模型
12.9k

模型

查看更多

Light R1 14B DS GGUF

qihoo360

L

Light-R1-14B-DS 是一个14B参数规模的量化大语言模型,支持文本生成任务,适用于资源受限环境下的高效推理。

自然语言处理GgufGguf
qihoo360
2.8k
9

Light R1 14B DS

qihoo360

L

Light-R1-14B-DS是一个14B参数的数学SOTA模型,采用强化学习训练,在AIME24/25和GPQA基准测试中表现优异。

自然语言处理TransformersTransformers
qihoo360
2.9k
33
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图