小型テキスト読み上げモデルKokoro-TTS、TTSランキングで1位を獲得
人工知能の急速な発展に伴い、音声合成技術はますます注目を集めています。最近、Kokoroという最新のテキスト読み上げモデルがHugging Faceプラットフォームで正式に公開されました。このモデルは8200万パラメータを備え、音声合成分野における重要なマイルストーンを意味します。Kokoro v0.19は公開の数週間前、TTS(テキスト読み上げ)ランキングで1位を獲得し、パラメータ数の多い他のモデルを凌駕するパフォーマンスを示しました。このモデルはモノラル設定で、わずか…