Nous Research推出優化器DisTrO,普通網絡條件也可以訓練AI模型了
Nous Research 團隊發佈了一種名爲 DisTrO 的新優化器,旨在降低分佈式互聯網訓練中的信息傳輸需求,顯著提升 AI 模型訓練效率。DisTrO 可以在普通網絡條件下進行訓練,允許全球個人和機構通過自家電腦參與 AI 開發,打破了大公司壟斷 AI 訓練的局面。相較於傳統算法 All-Reduce,DisTrO 效率提升高達 857 倍,每步訓練所需傳輸的信息量從 74.4GB 降低到 86.8MB。這項技術使 AI 訓練成本降低,讓更多人能夠參與,並減少了對高性能 GPU 的依賴,使得訓練在速度較慢的互聯網連接下也能進行。通過 DisTrO,研究人員和機構能夠更自由地進行創新和實驗,推動技術進步,惠及社會。該技術的開放性使得 AI 模型訓練變得更加靈活,支持全球分散的 GPU 協同工作,減少了對大型數據中心的需求,對環境影響更小。DisTrO 的應用不僅限於大型語言模型,還適用於其他類型的 AI 訓練,爲未來 AI 發展提供了新的可能性。