Dia est un modèle texte-à-parole (TTS) développé par Nari Labs, doté de 160 millions de paramètres, capable de générer directement à partir de texte des dialogues hautement réalistes. Ce modèle prend en charge le contrôle des émotions et de l'intonation, et peut générer des communications non verbales, telles que des rires et de la toux. Ses poids de modèle pré-entraînés sont hébergés sur Hugging Face et sont adaptés à la génération en anglais. Ce produit est essentiel pour la recherche et l'éducation, et peut contribuer à faire progresser les techniques de génération de dialogues.