Dia es un modelo de texto a voz (TTS) desarrollado por Nari Labs, con 160 millones de parámetros, capaz de generar diálogos altamente realistas directamente a partir de texto. El modelo admite el control de emociones y tono, y puede generar comunicación no verbal, como risas y tos. Sus pesos de modelo preentrenados se alojan en Hugging Face y son adecuados para la generación en inglés. Este producto es crucial para fines de investigación y educativos, capaz de impulsar el desarrollo de la tecnología de generación de diálogos.