計算機視覺正從“看清世界”轉向“理解與交互”。隨着感知能力接近人類極限,單純追求準確率的邊際收益遞減。CVPR2026標誌着研究重點轉向:視覺成爲推理、決策與交互的中介,告別“盲目推理”,邁向自適應與隱式路徑,如多模態模型通過“思維鏈”展開邏輯。
騰訊混元團隊開源視頻生成加速方案DisCa,通過可學習特徵緩存技術,在已蒸餾的少步模型上進一步壓縮推理成本,提升生成速度。該方案代碼與模型權重已公開,並被CVPR2026收錄。