小巧卻強大!IBM發佈新語言模型Granite 4.0 Tiny Preview:長上下文處理
IBM 發佈了 Granite4.0Tiny Preview,這是即將推出的 Granite4.0系列語言模型中最小的一款的預覽版本。該模型不僅具備高效的計算能力,還爲開源社區提供了一個值得關注的實驗平臺。高效的性能與極小的內存需求 Granite4.0Tiny 在 FP8精度下,能夠在消費級硬件上運行多個長上下文(128K)的併發任務,適用於市面上價格低於350美元的 GPU。儘管該模型目前僅經過部分訓練,處理過2.5萬億個訓練標記,但其性能已接近 IBM Granite3.32B Instruct,且內存需求降低約72%。隨着後續訓練的進行,預計 Granite4.0Tiny 的