O novo modelo de geração de imagens da Google, Instruct-Imagen, demonstra capacidades excepcionais de geração por meio de instruções multimodais. Experimentos demonstram que o modelo se compara ou mesmo supera métodos anteriores em avaliações de domínio e zero-shot, apresentando a capacidade de lidar com instruções complexas e forte capacidade de generalização. Essa tecnologia não apenas melhora a qualidade da imagem, mas também alcança resultados significativos na alinhamento de texto.