谷歌再破界限:Gemini 2.5 Pro實現6小時視頻理解,AI視覺能力邁入新紀元
谷歌Gemini2.5Pro視頻理解能力再升級,這款旗艦AI模型不僅支持長達6小時的視頻分析,還擁有高達200萬Token的超大上下文窗口,同時首次實現通過API直接解析YouTube鏈接。官方數據顯示,該模型在VideoMME基準測試中達到84.7%的準確率,與行業頂尖水平的85.2%僅有一線之差,彰顯了其強勁實力。這項突破性技術現已通過Google AI Studio向開發者開放體驗。Gemini2.5Pro憑藉其龐大的上下文窗口,實現了一次性處理約6小時視頻內容的能力(以每秒1幀採樣,每幀66個Token計算)。開發者現在可通過簡單的API調用