O OuteTTS-0.2-500M é um modelo de síntese de texto para fala baseado no Qwen-2.5-0.5B, treinado em um conjunto de dados maior, apresentando melhorias significativas em precisão, naturalidade, vocabulário, capacidade de clonagem de voz e suporte multilíngue. O modelo agradece especialmente o apoio da Hugging Face por meio do fornecimento de recursos de GPU, essenciais para o seu treinamento.