Bark es un modelo de texto a audio basado en Transformer, desarrollado por Suno, capaz de generar voz multilingüe realista y otros tipos de audio, como música, ruido de fondo y efectos de sonido simples. También admite la generación de comunicación no verbal, como risas, suspiros y llantos. Bark apoya a la comunidad investigadora, proporcionando puntos de control de modelos preentrenados, aptos para inferencia y utilizables con fines comerciales.