AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

DeepMind推新基準Michelangelo:揭示長上下文 LLM推理缺陷

最近,超長上下文窗口的大型語言模型(LLMs)成爲了人們討論的熱點。這些模型能夠在一個提示中處理數十萬甚至上百萬個標記,爲開發者開啓了許多新的可能性。不過,這些長上下文 LLM 到底能多好地理解和利用所接收到的大信息呢?爲了解決這個問題,谷歌 DeepMind 的研究人員推出了名爲 Michelangelo 的新基準,旨在評估長上下文推能力。研究結果表明,儘管當前的頂尖模型在從大量上下文數據中提取信息方面取得了一定進展,但在需要推理和理解數據結構的任務上仍然存在困難。隨着長上

12.4k 16 小時前
DeepMind推新基準Michelangelo:揭示長上下文 LLM推理缺陷
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖