Kolors é um modelo de geração de imagem a partir de texto em larga escala desenvolvido pela equipe Kolors do Kuaishou, baseado em modelos de difusão latente e treinado em bilhões de pares texto-imagem. Ele supera modelos de código aberto e fechado em termos de qualidade visual, precisão semântica complexa e renderização de texto em chinês e inglês. O Kolors suporta entrada em chinês e inglês, com desempenho particularmente destacado na compreensão e geração de conteúdo específico em chinês.