谷歌再破界限:Gemini 2.5 Pro实现6小时视频理解,AI视觉能力迈入新纪元
谷歌Gemini2.5Pro视频理解能力再升级,这款旗舰AI模型不仅支持长达6小时的视频分析,还拥有高达200万Token的超大上下文窗口,同时首次实现通过API直接解析YouTube链接。官方数据显示,该模型在VideoMME基准测试中达到84.7%的准确率,与行业顶尖水平的85.2%仅有一线之差,彰显了其强劲实力。这项突破性技术现已通过Google AI Studio向开发者开放体验。Gemini2.5Pro凭借其庞大的上下文窗口,实现了一次性处理约6小时视频内容的能力(以每秒1帧采样,每帧66个Token计算)。开发者现在可通过简单的API调用