AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

AI資訊

查看更多

武漢大學聯合中國移動九天人工智能團隊開源音視頻說話人識別數據集 VoxBlink2

武漢大學聯合中國移動九天人工智能團隊和崑山杜克大學基於YouTube數據開源了超過11萬小時的音視頻說話人識別數據集VoxBlink2。該數據集包含9904382個高質量音頻片段及其相應的視頻片段,來自YouTube上的111284名用戶,是目前最大的公開可用的音視頻說話人識別數據集。數據集的發佈旨在豐富開源語音語料庫,支持訓練聲紋大模型。

20.2k 6 小時前
武漢大學聯合中國移動九天人工智能團隊開源音視頻說話人識別數據集 VoxBlink2
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖