AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

武漢大學聯合中國移動九天人工智能團隊開源音視頻說話人識別數據集 VoxBlink2

武漢大學聯合中國移動九天人工智能團隊和崑山杜克大學基於YouTube數據開源了超過11萬小時的音視頻說話人識別數據集VoxBlink2。該數據集包含9904382個高質量音頻片段及其相應的視頻片段,來自YouTube上的111284名用戶,是目前最大的公開可用的音視頻說話人識別數據集。數據集的發佈旨在豐富開源語音語料庫,支持訓練聲紋大模型。

17.5k 3 天前
武漢大學聯合中國移動九天人工智能團隊開源音視頻說話人識別數據集 VoxBlink2
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖