イスラエル企業が速度50%向上を実現したオープンソース音声認識モデルWhisper Medusaを発表
イスラエルのAI企業aiOlaは、Whisper Medusaというオープンソースの音声認識モデルを発表しました。このモデルは改良されたアーキテクチャ設計に基づいており、マルチヘッドアテンション機構を導入することで、OpenAIのWhisperモデルよりも50%高速な処理を実現しています。Whisper Medusaは、従来の1トークンずつではなく、10トークンを並列に予測することで、音声認識速度を大幅に向上させながら、性能の低下を防いでいます。その革新的なトレーニング方法は弱教師あり学習を採用しており、主幹システムを凍結して—