Text2Immersion es un método elegante para generar escenas 3D inmersivas de alta calidad a partir de indicaciones de texto. Nuestro proceso propuesto utiliza primero modelos de difusión 2D y estimación de profundidad preentrenados para generar gradualmente nubes gaussianas. A continuación, se refinan, interpolan y perfeccionan las nubes gaussianas para mejorar los detalles de la escena generada. A diferencia de los métodos predominantes que se centran únicamente en objetos individuales o escenas de interiores, o que emplean trayectorias reducidas, nuestro método puede generar diferentes escenas que contienen una variedad de objetos, e incluso se extiende a la creación de escenas imaginarias. Por lo tanto, Text2Immersion puede tener un amplio impacto en diversas aplicaciones, como la realidad virtual, el desarrollo de juegos y la creación automática de contenido. Una extensa evaluación demuestra que nuestro sistema es superior a otros métodos en cuanto a calidad de renderizado y diversidad, y continúa impulsando la generación de escenas 3D basadas en texto.