最好的language models AI工具模型_精選language models資訊

AI資訊

淘天推出創新對齊方法，解決視覺大模型中的幻覺問題

近年來，視覺大模型（Large Vision Language Models， LVLMs）在圖像理解和跨模態任務中展現出非凡的能力，然而隨之而來的 “幻覺現象” 問題也日益突出。爲了應對這一挑戰，淘天集團的未來生活實驗室團隊提出了一種名爲 “令牌偏好優化”(Token Preference Optimization，簡稱 TPO)的新方法，並引入了一種自我校準的視覺錨定獎勵機制。TPO 的最大創新在於它實現了自動化的令牌級獎勵信號。這一方法能夠自動識別偏好數據中的視覺錨定令牌，避免了人工細粒度標註的繁瑣，同時在訓練過程中爲每個令

12.1k 9 小時前

清華大學、騰訊聯合推全開源多模態架構Oryx 支持超長視頻輸入

在人工智能快速發展的今天，一個名爲ORYX的多模態大型語言模型正在悄然改變我們對AI理解視覺世界能力的認知。這個由清華大學、騰訊和南洋理工大學研究人員聯合開發的AI系統，堪稱視覺處理領域的"變形金剛"。ORYX，全稱Oryx Multi-Modal Large Language Models，是一個專門設計用於處理圖像、視頻和3D場景時空理解的AI模型。它的核心優勢在於能夠像人類一樣，不僅理解視覺內容，還能洞察內容之間的關聯和背後的故事。這個AI系統的一大亮點是其處理任意分辨率視覺輸入的能力。無論是模糊的老

14.8k 7 小時前