AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

MOSEL項目:爲歐洲AI語言模型打造開源語音數據庫

在人工智能快速發展的今天,一個國際研究團隊正在爲歐洲AI語言模型的發展鋪平道路。他們推出了名爲MOSEL(Massive Open-source compliant Speech data for European Languages)的項目,爲歐盟 24 種官方語言編制了一個全面的開源語音數據集。這一舉措旨在推動歐洲開放AI語言模型的發展,挑戰目前由英語數據集和大型科技公司專有系統主導的局面。MOSEL項目彙集了來自 18 個不同來源的語音數據,包括CommonVoice、LibriSpeech和VoxPopuli等知名項目。這個龐大的數據庫包含了帶轉錄的語音錄音和未標記的音頻數據

11.4k 3 天前
MOSEL項目:爲歐洲AI語言模型打造開源語音數據庫

模型

查看更多

CogVideoX-3

Chatglm

CogVideoX-3

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

Qwen_v2_1.5b_Instruct

Alibaba

Qwen_v2_1.5b_Instruct

$1

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

Qwen_v2.5_3b_Instruct

Alibaba

Qwen_v2.5_3b_Instruct

$1

輸入tokens/百萬

-

輸出tokens/百萬

32

上下文長度

Baichuan-7B

Baichuan

Baichuan-7B

-

輸入tokens/百萬

-

輸出tokens/百萬

4

上下文長度

EUBERT

EuropeanParliament

E

EUBERT是一個基於歐洲出版局文檔訓練的多語言BERT模型,支持24種歐盟語言,適用於文本分類、問答和語言理解任務。

自然語言處理TransformersTransformers多語言
EuropeanParliament
118
14
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖