Whisper large-v3-turbo ist ein von OpenAI entwickeltes, hochmodernes automatisches Spracherkennungs-(ASR)- und Sprachübersetzungsmodell. Es wurde mit über 5 Millionen Stunden markierter Daten trainiert und kann in Zero-Shot-Einstellungen auf viele Datensätze und Bereiche verallgemeinert werden. Das Modell ist eine Feinabstimmung von Whisper large-v3, wobei die Decodierungsschichten von 32 auf 4 reduziert wurden, um die Geschwindigkeit zu erhöhen, was jedoch zu einer geringfügigen Qualitätsminderung führen kann.