立體幾何成大模型 “攔路虎”,SolidGeo 基準助力 AI 突破空間推理瓶頸!
在人工智能領域,多模態大模型(MLLM)一直在不斷進化,然而最近一個新發布的基準測試 ——SolidGeo,給這些模型帶來了前所未有的挑戰。由中國科學院自動化研究所的研究團隊推出的 SolidGeo,專注於立體幾何的推理能力,成爲了首個系統評估多模態模型在三維空間理解方面的基準。與傳統的平面幾何相比,立體幾何的複雜性在於它需要理解三維結構及其空間關係。這不僅要求模型具備高水平的空間推理能力,還要能夠整合視覺與文本信息。SolidGeo 的數據集包含3113個高質量的立體幾何問