阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升,复杂问题迎刃而解
阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。QVQ-72B在视觉推理、数学和科学问题上表现出了显著的提升,尤其是在多步推理任务中。这意味着该模型不仅能够理解文字信息,还能理解图像信息,并通过多步推理来解决复杂问题,这是传统AI模型难以企及的。该模型的一大亮点是其在物理问题中结合文字和视觉信息推导因果关系的能