conversor-voz-a-voz es un proyecto modular GPT4-o de código abierto que realiza la conversión de voz a voz a través de una secuencia de partes: detección de actividad de voz, conversión de voz a texto, modelo de lenguaje y conversión de texto a voz. Utiliza la librería Transformers y modelos disponibles en Hugging Face Hub, ofreciendo una alta modularidad y flexibilidad.