CogView3 ist ein Text-zu-Bild-Generierungssystem, das auf kaskadierender Diffusion basiert und ein Relay-Diffusionsframework verwendet. Das System zerlegt den Prozess der Hoch-Auflösungs-Bildgenerierung in mehrere Phasen. Durch einen Relay-Superauflösungsprozess wird Gaußsches Rauschen zu den Ergebnissen der Niederauflösungsgenerierung hinzugefügt, um von diesen verrauschten Bildern aus den Diffusionsprozess zu starten. CogView3 übertrifft SDXL in der Bildgenerierung mit schnellerer Generierungsgeschwindigkeit und höherer Bildqualität.