Kolors est un modèle de génération d'images à partir de texte à grande échelle développé par l'équipe Kolors de Kuaishou. Basé sur un modèle de diffusion latent, il a été entraîné sur des milliards de paires texte-image. Il surpasse les modèles open source et propriétaires en termes de qualité visuelle, de précision sémantique complexe et de rendu de texte en chinois et en anglais. Kolors prend en charge les entrées en chinois et en anglais, et se distingue particulièrement par sa capacité à comprendre et à générer du contenu spécifique à la langue chinoise.