Sakana AI發佈“AI CUDA工程師”:自動化優化CUDA內核,速度提升高達100倍
日本人工智能初創公司Sakana AI宣佈推出“AI CUDA工程師”(AI CUDA Engineer),這一創新性的AI智能體系統旨在自動化生產高度優化的CUDA內核,顯著提升機器學習操作的運行效率。根據X平臺上的最新消息,該系統通過進化的大型語言模型(LLM)驅動代碼優化技術,將常見PyTorch操作的運行速度提高了10至100倍,標誌着AI技術在GPU性能優化領域的重大突破。Sakana AI表示,CUDA內核作爲GPU計算的核心,直接編寫和優化通常需要深厚的專業知識和高技術門檻,而現有框架如PyTorch雖然使用便捷,但在性能上往