AIBase
ホーム
AIニュース
AIツール
AIモデル
MCP
AIサービス
AI計算力
AIチュートリアル
JA

AIニュース

もっと見る

西北工業大学オープンソース音声理解モデルOSUM、WhisperとQwen2を組み合わせ、8種類の音声理解タスクに対応

人工知能分野において、言語モデルの急速な発展は、音声理解言語モデル(SULMs)への注目を集めています。最近、西北工業大学ASLP研究所は、学術資源が限られた状況下で、音声理解モデルを効果的に訓練し活用する方法を探求し、学術界の研究とイノベーションを促進することを目的としたオープン音声理解モデルOSUMを発表しました。OSUMモデルはWhisperエンコーダーとQwen2言語モデルを融合し、音声認識(ASR)、タイムスタンプ付きなど8種類の音声タスクに対応しています。

4.7k 2 日前
西北工業大学オープンソース音声理解モデルOSUM、WhisperとQwen2を組み合わせ、8種類の音声理解タスクに対応

AI製品

もっと見る
Osum

Osum

AIを活用した市場調査ツール。成長のための洞察を提供します。

市場調査
7k
AIBase
未来を力づける、あなたの人工知能ソリューションシンクタンク
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
ビジネス協力サイトマップ