小身材,大智慧!微軟Phi-4系列推理模型發佈,性能直逼GPT-4o
微軟正積極擴展其Phi系列緊湊型語言模型,最新發布了三款專爲高級推理任務設計的新變體:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。這些模型旨在通過結構化推理和內部反思處理複雜的問答,同時保持輕量級特性,使其能夠在包括移動設備在內的低端硬件上高效運行,延續了微軟Phi系列在資源受限設備上實現強大AI功能的願景。Phi-4-reasoning 擁有140億個參數,並借鑑OpenAI o3-mini的推理路徑,通過監督微調進行訓練。更高級的Phi-4-reasoning-plus在此基礎上增加了強化學習機制,處理的tok