LLaVA-1.5: Ein neuer Meilenstein in der multimodalen KI

Forscher der Zhejiang Universität, des Microsoft Research und der Columbia Universität haben gemeinsam ein neues multimodales KI-System namens LLaVA-1.5 entwickelt. Dieses System bricht in 11 Benchmark-Tests Rekorde und übertrifft GPT-4V in Bezug auf multimodales Verständnis – es stellt eine ernstzunehmende Konkurrenz dar.

LLaVA-1.5 erreicht diese Fortschritte mit einer einfachen Systemarchitektur und öffentlich zugänglichen Datensätzen. Dies beweist, dass auch Open-Source-Modelle mit cleverem Design enorme Leistungsfähigkeit erzielen können und liefert wertvolle Impulse für die Weiterentwicklung der KI.

Die Open-Source-Veröffentlichung von LLaVA-1.5 schließt eine wichtige Lücke im Bereich der multimodalen KI und wird in der Branche als starker Herausforderer zu GPT-4 gehandelt – ein ernstzunehmender "Konkurrent".