Text2Immersion é um método elegante para gerar cenários 3D imersivos de alta qualidade a partir de prompts de texto. Nossa pipeline proposta usa primeiro modelos de difusão 2D e de estimativa de profundidade pré-treinados para gerar gradualmente nuvens gaussianas. Em seguida, essas nuvens gaussianas são refinadas, interpoladas e aprimoradas para melhorar os detalhes do cenário gerado. Diferentemente dos métodos convencionais que se concentram apenas em objetos individuais ou em cenários internos, ou que empregam trajetórias reduzidas, nosso método pode gerar diversos cenários contendo vários objetos, expandindo-se até mesmo para a criação de cenários imaginários. Portanto, o Text2Immersion pode ter um amplo impacto em diversas aplicações, como realidade virtual, desenvolvimento de jogos e criação automática de conteúdo. Várias avaliações comprovam que nosso sistema supera outros métodos em termos de qualidade de renderização e diversidade, e continua a avançar na geração de cenários 3D baseada em texto.