MiniGPT-4 wurde zu MiniGPT-v2 weiterentwickelt und zeigt eine deutlich verbesserte Leistung bei multimodalen Aufgaben, mit einem um 21,3 % höheren VSR-Benchmark im Vergleich zu MiniGPT-4. Die neue Version beinhaltet Aufgabenidentifikations-Token, die mehr Flexibilität und Effizienz bei visuellen Aufgaben bieten, und wurde durch multimodales Instruktionslernen trainiert, um die Konversationsfähigkeit zu verbessern.