aiOla、OpenAIのWhisperより50%高速なオープンソース音声認識モデルWhisper-Medusaを発表
イスラエルのAIスタートアップ企業aiOlaは、OpenAIのWhisperより50%高速なオープンソース音声認識モデルWhisper-Medusaを発表しました。このモデルはWhisperをベースに構築されており、革新的な「マルチヘッドアテンション」アーキテクチャを採用することで、一度により多くのトークンを予測し、速度を大幅に向上させながら精度を維持しています。Whisper-Medusaは、MITライセンスの下でHugging Faceで公開されており、研究および商業利用が許可されています。aiOlaは弱教師あり学習を用いて…