前OpenAI首席技术官Mira Murati领导的团队推出“在线策略蒸馏”技术,仅用80亿参数的小模型即可达到32B大模型70%的性能,训练成本降低90%,效率提升50-100倍,让中小企业和个人开发者能以低成本获得高性能模型。
Thinking Machine团队推出在线策略蒸馏训练法,让小模型在特定任务上训练效率提升50-100倍。该方法融合强化学习与监督学习,解决传统AI训练中强化学习低效、监督学习不灵活的难题,打造"AI教练"新模式。成果获OpenAI前CTO转发,引发业界高度关注。
Stepfun
-
Input tokens/M
Output tokens/M
Context Length