VASA-1 es un modelo desarrollado por Microsoft Research que se centra en la generación en tiempo real de animaciones faciales realistas que coinciden con el audio. Esta tecnología, mediante algoritmos de aprendizaje profundo, genera automáticamente la articulación y las expresiones faciales correspondientes al contenido de audio de entrada, ofreciendo al usuario una experiencia interactiva completamente nueva. La principal ventaja de VASA-1 radica en la alta fidelidad de sus resultados y su capacidad de respuesta en tiempo real, permitiendo una interacción más natural entre el personaje virtual y el usuario. Actualmente, VASA-1 se aplica principalmente en áreas como asistentes virtuales, educación online y entretenimiento. Aunque su estrategia de precios aún no se ha publicado, se espera que ofrezca una versión de prueba gratuita.