Grok-1.5V es el primer modelo multimodal de X.AI. Además de su potente capacidad de procesamiento de texto, Grok también puede procesar diversas informaciones visuales, incluyendo documentos, gráficos, capturas de pantalla y fotografías. El modelo destaca en el razonamiento multidisciplinar, la comprensión de documentos, la comprensión de gráficos científicos, la interpretación de gráficos y la comprensión del mundo real. Próximamente se lanzará para usuarios de prueba temprana y usuarios existentes de Grok.