Barkは、Sunoが開発したTransformerベースのテキスト音声変換モデルです。リアルな多言語音声、音楽、背景ノイズ、シンプルな効果音など、様々な種類のオーディオを生成できます。笑い声、ため息、泣き声などの非言語コミュニケーションの生成にも対応しています。Barkは研究コミュニティをサポートしており、推論に使用でき、商用利用も可能な、事前学習済みモデルのチェックポイントを提供しています。