Text2Immersion est une méthode élégante pour générer des scènes 3D immersives de haute qualité à partir d'invites textuelles. Notre pipeline proposé utilise d'abord des modèles de diffusion 2D et d'estimation de profondeur pré-entraînés pour générer progressivement des nuages de Gauss. Ensuite, ces nuages de Gauss sont affinés, interpolés et raffinés pour améliorer les détails de la scène générée. Contrairement aux méthodes dominantes qui se concentrent uniquement sur des objets individuels ou des scènes intérieures, ou qui utilisent des trajectoires réduites, notre méthode permet de générer des scènes variées contenant divers objets, et même d'étendre la création à des scènes imaginaires. Par conséquent, Text2Immersion peut avoir un impact significatif sur diverses applications, telles que la réalité virtuelle, le développement de jeux et la création de contenu automatique. De nombreuses évaluations démontrent que notre système surpasse les autres méthodes en termes de qualité de rendu et de diversité, et continue de faire progresser la génération de scènes 3D à partir de texte.