El nuevo modelo de generación de imágenes de Google, Instruct-Imagen, demuestra una capacidad de generación excepcional a través de instrucciones multimodales. Los experimentos demuestran que el modelo iguala o incluso supera a los métodos anteriores en evaluaciones de dominio y de cero-shot, mostrando una capacidad para manejar instrucciones complejas y una potente capacidad de generalización. Esta tecnología no solo mejora la calidad de la imagen, sino que también logra resultados significativos en la alineación de texto.