Nueva versión de Qwen-TTS, se agregan tres dialectos chinos

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Jul 1, 2025

Hace poco, un modelo de síntesis de voz llamado Qwen-TTS ha tenido nuevos avances. Su última versión ha sido actualizada a través de la API Qwen, ofreciendo a los usuarios una experiencia más rica en síntesis de voz.

En esta actualización, Qwen-TTS ha añadido soporte para tres dialectos chinos: el dialecto de Pekín, el dialecto de Shanghái y el dialecto de Sichuan, ampliando así sus aplicaciones. Este modelo se entrenó con una gran base de datos de más de 3 millones de horas, logrando un nivel de naturalidad y expresividad similar al humano. Qwen-TTS no solo puede sintetizar voz con precisión, sino que también puede ajustar automáticamente la entonación, el ritmo y los cambios emocionales según el texto de entrada, haciendo que la voz generada sea más realista y expresiva.

Tongyi Qwen (5)

Actualmente, Qwen-TTS ya admite siete tonos de voz en chino e inglés, incluyendo tonos estándar como Cherry y Ethan, así como tonos especialmente diseñados para dialectos, como Dylan (dialecto de Pekín), Jada (dialecto de Shanghái) y Sunny (dialecto de Sichuan). Los usuarios pueden elegir el tono de voz adecuado según sus necesidades para realizar la síntesis de voz.

En aplicaciones prácticas, Qwen-TTS ha demostrado un rendimiento excelente. Ya sea describiendo escenas del día a día o expresando emociones complejas, puede generar voces naturales y fluidas. Por ejemplo, al usar el tono de voz de Dylan en chino mandarín para sintetizar textos sobre juegos de la infancia, la voz transmite diversión y energía infantil; mientras que al usar el tono de voz de Jada en el dialecto de Shanghái para sintetizar conversaciones sobre asuntos cotidianos, se transmite un auténtico ambiente shanghainés.

El equipo de desarrollo de Qwen-TTS indicó que continuarán optimizando el rendimiento del modelo y planean lanzar más idiomas y estilos de voz para satisfacer las crecientes necesidades de los usuarios. Además, ofrecen una interfaz de API sencilla, facilitando a los desarrolladores integrar Qwen-TTS en sus propias aplicaciones.

Modelo:https://help.aliyun.com/zh/model-studio/qwen-tts

DingTalk lanza por primera vez la función «Tablas de IA» e introduce la funcionalidad «Tablas como documentos»

Recientemente, DingTalk lanzó por primera vez la función «Tablas de IA», lo que marca el inicio oficial de un nuevo punto de entrada para las aplicaciones en la era de la inteligencia artificial. En las tablas de IA de DingTalk, la tecnología de inteligencia artificial se ha convertido en una capacidad nativa, y cada celda se ha convertido en un acceso a la inteligencia artificial, creando flujos de trabajo inteligentes y ofreciendo a las empresas y usuarios una forma sin precedentes de construir sistemas empresariales.

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

Nueva versión de Qwen-TTS, se agregan tres dialectos chinos

AIbase基地

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

AliHumanOmniV2 presenta un gran lanzamiento: el nuevo rey de la inteligencia artificial multimodal, con una tasa de precisión que sube al 69,33%

Nuevo avance en el modelo de ciclo: 500 pasos de entrenamiento hacen que las secuencias largas ya no sean difíciles

Samsung espera que las ganancias del segundo trimestre se reduzcan a la mitad, frente al desafío de la demanda de inteligencia artificial

¡La tabla de inteligencia artificial de DingTalk llega con fuerza: procesar 1000 tareas en una hora, realizar análisis de datos sin barreras!

Error de ChatGPT impulsa el desarrollo de una nueva función ¡Los desarrolladores se ven obligados a enfrentar la ola de usuarios!

Romper con lo tradicional, Modulus Technology obtiene financiación de millones de dólares y impulsa una nueva era para los sensores táctiles multimodales

Apple y la Universidad de Columbia desarrollan un sistema de inteligencia artificial SceneScout que ayuda a las personas ciegas a navegar en entornos urbanos

DingTalk lanza por primera vez la función «Tablas de IA» e introduce la funcionalidad «Tablas como documentos»

La acción de Baidu sube, la nube inteligente gana el doble campeón en el mercado de modelos grandes en el primer semestre

Microsoft Win11 lanzará próximamente una función de fondo dinámico basado en IA, el código de la versión preliminar ya ha aparecido