Text2Immersionは、テキストプロンプトから高品質な3D没入型シーンを生成する、洗練された手法です。提案するパイプラインは、まずプリトレーニング済みの2D拡散モデルと深度推定モデルを用いて、ガウシアンクラウドを段階的に生成します。次に、生成されたシーンの詳細を向上させるために、ガウシアンクラウドを洗練、補間、精密化します。単一のオブジェクトや室内シーンのみに焦点を当てたり、縮小軌跡を採用する主流の手法とは異なり、当手法は様々なオブジェクトを含む多様なシーンを生成でき、想像上のシーンの作成にも拡張可能です。そのため、Text2Immersionは、VR、ゲーム開発、自動コンテンツ作成など、様々な用途に幅広い影響を与える可能性があります。広範な評価により、当システムがレンダリング品質と多様性において他の手法を凌駕し、テキスト指向の3Dシーン生成をさらに進歩させることが実証されています。