超越Gemma2!IBM發佈Granite3.1模型:支持128K上下文長度
IBM 正式發佈了其新一代開源大語言模型 Granite3.1,力圖在企業級 AI 領域佔據領先地位。這一系列模型具備128K 的擴展上下文長度、嵌入模型、內置的幻覺檢測功能以及性能的顯著提升。IBM 聲稱,Granite8B Instruct 模型在相同規模的開源競爭對手中表現最佳,包括 Meta 的 Llama3.1、Qwen2.5和谷歌的 Gemma2。Granite3.1模型的發佈是在 IBM 快速迭代 Granite 系列的背景下進行的,早在10月份就推出了 Granite3.0。IBM 透露,其與生成 AI 相關的業務收入已達到20億美元。新版本的核心理念是將更多功能集成到更小的