CSM 1B es un modelo de generación de voz basado en la arquitectura Llama, capaz de generar código de audio RVQ a partir de texto y entrada de audio. El modelo se aplica principalmente en el campo de la síntesis de voz, con una capacidad de generación de voz de alta calidad. Su ventaja radica en la capacidad de manejar escenarios de conversación con múltiples hablantes y generar voz natural y fluida mediante información contextual. Este modelo es de código abierto y está diseñado para apoyar la investigación y la educación, pero está explícitamente prohibido su uso para suplantación de identidad, fraude o actividades ilegales.