AI2推出開源 Tülu3模型,性能與GPT-4o mini相當
在人工智能領域,後訓練技術正逐漸成爲提升模型性能的重要手段。近日,艾倫人工智能研究所(AI2)發佈了 Tülu3系列模型,這是一套完全開源的先進語言模型,性能與 GPT-4o-mini 等閉源相媲美。Tülu3不僅包含了模型數據、代碼、訓練配方,還提供了評估框架,旨在推動開源模型後訓練技術的發展。傳統上,僅經過預訓練的模型往往無法有效滿足實際應用需求,可能會產生有毒或危險的信息,且難以遵循人類指令。因此,後訓練階段如指令微調和人類反饋學習顯得尤爲重要。然而,如何優