小米KaldiチームがOmniVoiceモデルをオープンソースした。600種以上の言語をサポートし、中国語および多言語TTSの基準テストで多数の指標がSOTAを達成した。中国語のWERは0.84%に至り、多言語性能は主流の商用モデルを超え、音声合成における新たな突破を遂げた。