微軟聯合清北推rStar-Math技術:小型模型逆襲數學問題,超越 OpenAI!
微軟近日宣佈了其新的 rStar-Math 技術,這一創新的推理方法可以應用於小型語言模型(SLMs),顯著提升它們在數學問題上的表現,甚至在某些情況下超越 OpenAI 的 o1-preview 模型。這一技術目前仍處於研究階段,相關研究論文已發佈在 arXiv.org 上,由微軟、北京大學和清華大學的八位作者共同完成。在測試中,rStar-Math 技術被應用於多個小型開源模型,包括微軟的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15億參數模型)和 Qwen-7B(70億參數模型)。測試結果顯示,所有參與的模型性能都有所提升,其中