Hace poco, un modelo de síntesis de voz llamado Qwen-TTS ha tenido nuevos avances. Su última versión ha sido actualizada a través de la API Qwen, ofreciendo a los usuarios una experiencia más rica en síntesis de voz.
En esta actualización, Qwen-TTS ha añadido soporte para tres dialectos chinos: el dialecto de Pekín, el dialecto de Shanghái y el dialecto de Sichuan, ampliando así sus aplicaciones. Este modelo se entrenó con una gran base de datos de más de 3 millones de horas, logrando un nivel de naturalidad y expresividad similar al humano. Qwen-TTS no solo puede sintetizar voz con precisión, sino que también puede ajustar automáticamente la entonación, el ritmo y los cambios emocionales según el texto de entrada, haciendo que la voz generada sea más realista y expresiva.
Actualmente, Qwen-TTS ya admite siete tonos de voz en chino e inglés, incluyendo tonos estándar como Cherry y Ethan, así como tonos especialmente diseñados para dialectos, como Dylan (dialecto de Pekín), Jada (dialecto de Shanghái) y Sunny (dialecto de Sichuan). Los usuarios pueden elegir el tono de voz adecuado según sus necesidades para realizar la síntesis de voz.
En aplicaciones prácticas, Qwen-TTS ha demostrado un rendimiento excelente. Ya sea describiendo escenas del día a día o expresando emociones complejas, puede generar voces naturales y fluidas. Por ejemplo, al usar el tono de voz de Dylan en chino mandarín para sintetizar textos sobre juegos de la infancia, la voz transmite diversión y energía infantil; mientras que al usar el tono de voz de Jada en el dialecto de Shanghái para sintetizar conversaciones sobre asuntos cotidianos, se transmite un auténtico ambiente shanghainés.
El equipo de desarrollo de Qwen-TTS indicó que continuarán optimizando el rendimiento del modelo y planean lanzar más idiomas y estilos de voz para satisfacer las crecientes necesidades de los usuarios. Además, ofrecen una interfaz de API sencilla, facilitando a los desarrolladores integrar Qwen-TTS en sus propias aplicaciones.
Modelo:https://help.aliyun.com/zh/model-studio/qwen-tts