LLaVA++は、Phi-3とLLaMA-3モデルを統合することでLLaVAモデルの視覚能力を拡張することを目的としたオープンソースプロジェクトです。Mohamed bin Zayed University of AI (MBZUAI)の研究者によって開発され、最新の巨大言語モデルを組み合わせることで、指示への遵守や学術的なタスク指向データセットにおけるモデルのパフォーマンスを強化しています。