浙江大学、微软研究院和哥伦比亚大学研究人员联合开发了新的多模态AI系统LLaVA-1.5,在11项基准测试中刷新记录,在多模态理解能力上超过GPT-4V,可与其形成竞争。LLaVA-1.5采用简单的系统架构和公开数据集取得进步,证明开源模型通过合理设计也可取得强大能力,为AI发展带来启发。LLaVA-1.5的开源填补了多模态AI的空白,被业界视为“硬刚GPT-4”的强力新秀。