phonetic-fidelity-voice-conversion-ptbr
PublicPropomos um fluxo de análise fonética com o LibriSpeech: extraímos fonemas dos áudios originais via Allosaurus, realizamos Voice Conversion (Seed-VC), extraímos novamente os fonemas dos áudios convertidos e comparamos as sequências usando métricas PER e CER para avaliar a preservação fonética.