清華大學、騰訊聯合推全開源多模態架構Oryx 支持超長視頻輸入
在人工智能快速發展的今天,一個名爲ORYX的多模態大型語言模型正在悄然改變我們對AI理解視覺世界能力的認知。這個由清華大學、騰訊和南洋理工大學研究人員聯合開發的AI系統,堪稱視覺處理領域的"變形金剛"。ORYX,全稱Oryx Multi-Modal Large Language Models,是一個專門設計用於處理圖像、視頻和3D場景時空理解的AI模型。它的核心優勢在於能夠像人類一樣,不僅理解視覺內容,還能洞察內容之間的關聯和背後的故事。這個AI系統的一大亮點是其處理任意分辨率視覺輸入的能力。無論是模糊的老