李飛飛團隊發佈ESI-Bench,被譽爲具身智能界的“ImageNet”。該基準揭示當前大模型在物理空間交互中的致命短板。與傳統依賴最優視角圖片的被動感知評測不同,ESI-Bench聚焦於模型的空間認知能力,而非單純視覺識別,爲具身智能設立了新標杆。