最好的language models AI工具模型_精选language models资讯

AI资讯

淘天推出创新对齐方法，解决视觉大模型中的幻觉问题

近年来，视觉大模型（Large Vision Language Models， LVLMs）在图像理解和跨模态任务中展现出非凡的能力，然而随之而来的 “幻觉现象” 问题也日益突出。为了应对这一挑战，淘天集团的未来生活实验室团队提出了一种名为 “令牌偏好优化”(Token Preference Optimization，简称 TPO)的新方法，并引入了一种自我校准的视觉锚定奖励机制。TPO 的最大创新在于它实现了自动化的令牌级奖励信号。这一方法能够自动识别偏好数据中的视觉锚定令牌，避免了人工细粒度标注的繁琐，同时在训练过程中为每个令

12k 10 小时前

清华大学、腾讯联合推全开源多模态架构Oryx 支持超长视频输入

在人工智能快速发展的今天，一个名为ORYX的多模态大型语言模型正在悄然改变我们对AI理解视觉世界能力的认知。这个由清华大学、腾讯和南洋理工大学研究人员联合开发的AI系统，堪称视觉处理领域的"变形金刚"。ORYX，全称Oryx Multi-Modal Large Language Models，是一个专门设计用于处理图像、视频和3D场景时空理解的AI模型。它的核心优势在于能够像人类一样，不仅理解视觉内容，还能洞察内容之间的关联和背后的故事。这个AI系统的一大亮点是其处理任意分辨率视觉输入的能力。无论是模糊的老

13.7k 1 天前