AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

​微软联合清北推rStar-Math技术:小型模型逆袭数学问题,超越 OpenAI!

微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),显著提升它们在数学问题上的表现,甚至在某些情况下超越 OpenAI 的 o1-preview 模型。这一技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上,由微软、北京大学和清华大学的八位作者共同完成。在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中

15.2k 12 分钟前
​微软联合清北推rStar-Math技术:小型模型逆袭数学问题,超越 OpenAI!

模型

查看更多

Qwen 1.5B_THIP

Thrillcrazyer

Q

Qwen-1.5B_THIP是基于DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k数学数据集上使用TRL框架进行GRPO方法微调的数学推理模型。该模型专门针对数学问题解决进行了优化,具备较强的数学推理能力。

自然语言处理TransformersTransformers
Thrillcrazyer
492
2

Castula U2 QwenRe 1.5B

prithivMLmods

C

基于Qwen-1.5B微调的紧凑型多语言推理模型,擅长数学解题、逻辑推理、代码生成和通用任务

自然语言处理TransformersTransformers支持多种语言
prithivMLmods
35
2
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图