アリババ、OpenAI Whisperを凌駕する新たな音声モデルQwen2-Audioを発表
アリババは最近、新たなオープンソースの音声モデルQwen2-Audioを発表しました。このモデルは音声認識、翻訳、音声分析において優れた性能を発揮し、大幅な性能向上を実現しています。Qwen2-Audioは、基礎版と命令微調整版を提供しており、中国語、広東語、フランス語、英語、日本語など複数の言語に対応し、感情分析や翻訳アプリケーションに利便性をもたらします。Qwen-Audioと比較して、Qwen2-Audioはアーキテクチャと性能において全面的な最適化が行われ、事前学習段階ではより自然な言語プロンプトが採用されています。