CSM 1B

CSM 1B es un modelo de generación de voz a texto desarrollado por Sesame, capaz de generar audio de alta calidad.

Producto ComúnOtrosSíntesis de vozTexto a voz

CSM 1B es un modelo de generación de voz basado en la arquitectura Llama, capaz de generar código de audio RVQ a partir de texto y entrada de audio. El modelo se aplica principalmente en el campo de la síntesis de voz, con una capacidad de generación de voz de alta calidad. Su ventaja radica en la capacidad de manejar escenarios de conversación con múltiples hablantes y generar voz natural y fluida mediante información contextual. Este modelo es de código abierto y está diseñado para apoyar la investigación y la educación, pero está explícitamente prohibido su uso para suplantación de identidad, fraude o actividades ilegales.

Abrir sitio web

CSM 1B Situación del tráfico más reciente

Total de visitas mensuales

25296546

Tasa de rebote

43.31%

Páginas promedio por visita

5.8

Duración promedio de la visita

00:04:45

CSM 1B Tendencia de visitas

CSM 1B Distribución geográfica de las visitas

CSM 1B Fuentes de tráfico

CSM 1B Alternativas

CSM 1B — CSM 1B es un modelo de generación de voz a texto desarrollado por Sesame, capaz de generar audio de alta calidad.

Otros

•Síntesis de voz•Texto a voz

612

MegaTTS 3 — Un modelo de síntesis de voz eficiente que admite chino, inglés y clonación de voz.

Música

•Síntesis de voz•Aprendizaje profundo

OpenAI.fm — Los desarrolladores pueden interactuar y experimentar con los nuevos modelos de voz de la API de OpenAI: gpt-4o-transcribe, gpt-4o-mini-transcribe y gpt-4o-mini-tts.

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

CSM 1B

CSM 1B Situación del tráfico más reciente

CSM 1B Tendencia de visitas

CSM 1B Distribución geográfica de las visitas

CSM 1B Fuentes de tráfico

CSM 1B Alternativas

CSM 1B — CSM 1B es un modelo de generación de voz a texto desarrollado por Sesame, capaz de generar audio de alta calidad.

MegaTTS 3 — Un modelo de síntesis de voz eficiente que admite chino, inglés y clonación de voz.

OpenAI.fm — Los desarrolladores pueden interactuar y experimentar con los nuevos modelos de voz de la API de OpenAI: gpt-4o-transcribe, gpt-4o-mini-transcribe y gpt-4o-mini-tts.

Orpheus TTS — Un sistema de texto a voz de código abierto, dedicado a lograr una naturalización del habla humana.

Zonos-v0.1-híbrido — Zonos-v0.1-híbrido es un modelo de texto a voz (TTS) de código abierto líder que ofrece servicios de síntesis de voz de alta calidad.

Llasa-1B — Llasa-1B es un modelo de texto a voz (TTS) basado en LLaMA, que admite la síntesis de voz en chino e inglés.

Llasa-3B — Llasa-3B es un modelo de síntesis de texto a voz (TTS) basado en LLaMA, que admite la generación de voz en chino e inglés.

Kokoro-82M — Un modelo de texto a voz (TTS) de vanguardia con 82 millones de parámetros.

Synthesys — Plataforma de generación de contenido con IA que ofrece servicios de generación de vídeo, voz e imágenes.

OuteTTS-0.2-500M — Modelo de síntesis de texto a voz de alto rendimiento

OuteTTS — Un modelo experimental de texto a voz.

OuteTTS-0.1-350M — Modelo de síntesis de texto a voz (TTS) basado en un modelo de lenguaje puro.

Fish Speech — Herramienta de síntesis de voz que ofrece servicios de generación de voz de alta calidad.

Demostración de TTS MaskGCT — Demostración de texto a voz (TTS) basada en el modelo MaskGCT

MaskGCT — Modelo de conversión de texto a voz (TTS) de cero ejemplos que no requiere información de alineación.

F5-TTS — Modelo de síntesis de texto a voz (TTS) de alta calidad basado en aprendizaje profundo

VALL-E 2 — Tecnología de síntesis de voz desarrollada por Microsoft Research Asia.

OptiSpeech — Modelo ligero de texto a voz de extremo a extremo

Bailing-TTS — Modelo de texto a voz (TTS) a gran escala que genera voz en dialectos chinos de alta calidad.

ToucanTTS — Kit de síntesis de texto a voz multilingüe y controlable

Seed-TTS — Serie de modelos de síntesis de texto a voz (TTS) de alta calidad y multifuncionales.

Generador de Voz AI — ¡Convierte cualquier texto en audio MP3 usando IA en segundos! ¡Genera tu primer audio gratis hoy mismo!

Baibao Yin — Software de síntesis de voz a texto en línea gratuito.

Demostración de Aura TTS de Deepgram — Demostración de Aura TTS de Deepgram, que muestra tecnología de síntesis de voz avanzada.

Luvvoice — Convertidor de texto a voz gratuito

Whisper Speech — Sistema de texto a voz de código abierto

Speechimo — Crea voces humanas realistas y mejora la calidad de tu contenido.

Crikk — Tecnología de texto a voz realista

StyleTTS 2 — Modelo de síntesis de texto a voz de nivel humano

Audioread — Lectura de audio con IA para aumentar la productividad