DreamFusion est un modèle de diffusion texte-image 2D pré-entraîné permettant de générer des objets 3D haute fidélité et à éclairage réglable. Il génère des objets 3D en optimisant par descente de gradient un modèle 3D initialisé aléatoirement (Neural Radiance Field). Les objets générés peuvent être observés sous n'importe quel angle, rééclairés avec un éclairage arbitraire ou composés avec n'importe quel environnement 3D. DreamFusion ne nécessite aucune donnée d'entraînement 3D et ne demande aucune modification du modèle de diffusion d'images, démontrant ainsi l'efficacité des modèles de diffusion d'images pré-entraînés comme a priori.