Whisper ist ein universelles Sprachmodell zur Spracherkennung. Es wurde mit einer großen Menge an vielfältigen Audiodaten trainiert und ist ein Multi-Task-Modell, das mehrsprachige Spracherkennung, Sprachübersetzung und Spracherkennung durchführen kann.