Whisperは、汎用的な音声認識モデルです。多様な音声データを用いて大規模に訓練されており、多言語音声認識、音声翻訳、言語識別をこなすマルチタスクモデルです。