LucidDreamer est une technique de génération de scènes 3D non-domaine, qui exploite pleinement les capacités des modèles de génération de diffusion à grande échelle existants pour générer des scènes 3D navigables à partir d'une seule invite textuelle ou d'une seule image. Cette méthode utilise deux étapes alternées, le rêve et l'alignement : elle génère d'abord des images multi-vues cohérentes à partir de l'entrée, puis intègre harmonieusement les nouvelles parties de la scène 3D ensemble. Les points de Gauss hautement détaillés générés par LucidDreamer ne sont pas limités à un domaine de scène cible, contrairement aux méthodes de génération de scènes 3D précédentes.