DiffSplat es una innovadora tecnología de generación 3D capaz de generar rápidamente nubes de puntos gaussianas 3D a partir de indicaciones de texto e imágenes de vista única. Esta tecnología utiliza modelos de difusión de texto a imagen preentrenados a gran escala, lo que permite una generación de contenido 3D eficiente. Resuelve el problema de los conjuntos de datos limitados y la incapacidad de utilizar eficazmente los modelos preentrenados 2D en los métodos tradicionales de generación 3D, al tiempo que mantiene la coherencia 3D. Las principales ventajas de DiffSplat incluyen una velocidad de generación eficiente (entre 1 y 2 segundos), una salida 3D de alta calidad y compatibilidad con diversas condiciones de entrada. Este modelo tiene un amplio potencial en investigación académica y aplicaciones industriales, especialmente en escenarios que requieren la generación rápida de modelos 3D de alta calidad.