非常に小さなTTSモデル Kitten TTS:パラメータ数はわずか1,500万
KittenMLチームがオープンソースの軽量なテキストから音声への変換モデルKitten TTSをリリースしました。サイズは25MBで、パラメータ数は1,500万、CPUでの動作をサポートしGPUは不要です。このモデルは高品質な複数の音声オプションを提供し、推論速度を最適化してリアルタイム合成を実現しています。また、簡単なインストールガイドも用意されています。現在は開発者プレビュー段階であり、今後、完全なモデル重み、モバイルSDK、およびWeb版が公開される予定です。これにより、音声合成技術の普及と応用が促進されます。