PIXART-α est un modèle de génération d'image à partir de texte basé sur Transformer. Sa qualité de génération d'images est comparable aux générateurs d'images les plus avancés. Il prend en charge la synthèse d'images haute résolution, avec une vitesse d'entraînement nettement supérieure aux modèles T2I à grande échelle existants. Son coût de formation est faible, permettant des économies d'environ 300 000 dollars et une réduction de 90 % des émissions de CO2. PIXART-α excelle en termes de qualité d'image, d'aspect artistique et de contrôle sémantique. Il offre de nouvelles perspectives aux communautés AIGC et aux startups, accélérant la construction de modèles génératifs de haute qualité et à faible coût à partir de zéro.