AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

​微軟聯合清北推rStar-Math技術:小型模型逆襲數學問題,超越 OpenAI!

微軟近日宣佈了其新的 rStar-Math 技術,這一創新的推理方法可以應用於小型語言模型(SLMs),顯著提升它們在數學問題上的表現,甚至在某些情況下超越 OpenAI 的 o1-preview 模型。這一技術目前仍處於研究階段,相關研究論文已發佈在 arXiv.org 上,由微軟、北京大學和清華大學的八位作者共同完成。在測試中,rStar-Math 技術被應用於多個小型開源模型,包括微軟的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15億參數模型)和 Qwen-7B(70億參數模型)。測試結果顯示,所有參與的模型性能都有所提升,其中

15.2k 12 分鐘前
​微軟聯合清北推rStar-Math技術:小型模型逆襲數學問題,超越 OpenAI!

模型

查看更多

Qwen 1.5B_THIP

Thrillcrazyer

Q

Qwen-1.5B_THIP是基於DeepSeek-R1-Distill-Qwen-1.5B在DeepMath-103k數學數據集上使用TRL框架進行GRPO方法微調的數學推理模型。該模型專門針對數學問題解決進行了優化,具備較強的數學推理能力。

自然語言處理TransformersTransformers
Thrillcrazyer
492
2

Castula U2 QwenRe 1.5B

prithivMLmods

C

基於Qwen-1.5B微調的緊湊型多語言推理模型,擅長數學解題、邏輯推理、代碼生成和通用任務

自然語言處理TransformersTransformers多語言
prithivMLmods
35
2
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖