書⽣·浦語2.5——InternLM2.5-7B模型宣佈開源 支持處理百萬字長文
上海人工智能實驗室與商湯科技,聯合香港中文與復旦大學,於七月三日共同發佈了名爲“書生·浦語2.5”的新型大語言模型。該模型的7B版本已開源,其它尺寸的版本也將相繼提供。上海 AI 實驗室向開發者提供免費商用許可,用以支持高質量開源模型的研發和創新。近期的模型更新顯著提高了推理能力,尤其在數學評測集 MATH 上超過了 Llama3-70B 模型,準確率達到了 60%,與 GPT-4Turbo1106 相當。模型還展現了對長文本的支持,可處理高達100萬漢字的信息,通過增加上下文長度和利用合成數據來優化內容理解和智能交互。此外,該模型還具搜索與整合網絡信息的能力,可通過MindSearch多智能體框架實現。