通義新一代輕量化大語言模型DistilQwen2.5 發佈 提升性能與效率
在大語言模型逐漸普及的今天,如何在資源受限的環境中實現高效部署已成爲重要課題。爲了解決這一挑戰,基於 Qwen2.5的輕量化大模型系列 DistilQwen2.5正式發佈。該模型採用了創新的雙層蒸餾框架,通過優化數據和參數融合技術,不僅保留了模型的性能,同時顯著降低了計算資源的消耗。DistilQwen2.5的成功得益於其獨特的知識蒸餾技術。這一過程首先需要大量高質量的指令數據,這些數據來自多個開源數據集及私有合成數據集。爲確保數據的多樣性,研究團隊通過 Qwen-max 擴展了中英文數據