英偉達與香港大學聯合發佈Orchestrator模型,擁有8億參數,能協調多種工具和大型語言模型解決複雜問題。該模型在工具使用基準測試中,以更低成本實現更高準確性,並能根據用戶偏好智能選擇工具。其訓練採用名爲ToolOrchestra的新強化學習框架,旨在提升小型模型的協調能力。
NVIDIA推出ToolOrchestra方法,通過訓練小型語言模型Orchestrator-8B作爲“大腦”,提升AI系統選擇合適模型和工具的能力,避免依賴單一大型模型。該方法旨在解決傳統AI代理使用單一模型時可能出現的決策偏差問題,實現更高效的任務處理。