OpenVoice V2 est un modèle texte-à-parole (TTS) lancé en avril 2024. Il inclut toutes les fonctionnalités de la version V1 et y apporte des améliorations. Grâce à une stratégie d'entraînement différente, il offre une meilleure qualité audio et prend en charge plusieurs langues, notamment l'anglais, l'espagnol, le français, le chinois, le japonais et le coréen. De plus, son utilisation commerciale est gratuite. OpenVoice V2 permet de cloner précisément la couleur de la tonalité de référence et de générer de la parole dans plusieurs langues et accents. Il supporte également le clonage vocal interlinguistique zéro-shot, c'est-à-dire que la langue de la parole générée et celle de la parole de référence n'ont pas besoin d'apparaître dans l'ensemble de données d'entraînement multilingue à grande échelle.