O Qwen Image AI é um modelo multimodal de difusão MMDiT de 20B que revolucionou a geração de imagens a partir de texto, com uma excelente capacidade de renderização de texto. É o primeiro modelo que conseguiu lidar com layouts de texto multilinhas complexos e conteúdo de parágrafo, tanto em inglês quanto em chinês. Baseado em tecnologia avançada de difusão, o Qwen Image AI se destacou em vários benchmarks, especialmente na precisão da renderização de texto, algo que outros modelos têm dificuldade em superar.