LLaVA-1.5: Um novo competidor para o GPT-4V

Pesquisadores da Universidade de Zhejiang, Microsoft Research e Universidade de Columbia desenvolveram em conjunto o novo sistema de IA multimodal LLaVA-1.5. Este sistema quebrou recordes em 11 benchmarks, superando o GPT-4V em capacidade de compreensão multimodal e se posicionando como um forte competidor.

O LLaVA-1.5 alcançou esse progresso utilizando uma arquitetura de sistema simples e conjuntos de dados abertos, demonstrando que modelos de código aberto, com um design adequado, também podem alcançar capacidades impressionantes. Isso oferece inspiração para o desenvolvimento futuro da IA.

O código aberto do LLaVA-1.5 preenche uma lacuna importante na IA multimodal e é considerado pela indústria como um forte candidato a rivalizar com o GPT-4, um "forte competidor" do GPT-4.