Sesame CSM
Un modelo para generar voz conversacional, que admite la generación de voz de alta calidad a partir de texto y entrada de audio.
Nuevo Producto PremiumProductividadSíntesis de vozInteligencia artificial
CSM es un modelo de generación de voz conversacional desarrollado por Sesame, capaz de generar voz de alta calidad a partir de texto y entrada de audio. Este modelo se basa en la arquitectura Llama y utiliza el codificador de audio Mimi. Se utiliza principalmente para la síntesis de voz y aplicaciones de voz interactivas, como asistentes de voz y herramientas educativas. Las principales ventajas de CSM son su capacidad para generar voz natural y fluida, y la posibilidad de optimizar la salida de voz mediante información contextual. Actualmente, este modelo es de código abierto y está disponible para fines de investigación y educativos.
Sesame CSM Situación del tráfico más reciente
Total de visitas mensuales
492133528
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:33