AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

智源研究院發佈中文互聯網語料庫CCI3.0 包含1000GB數據集

在2024北京文化論壇上,北京智源人工智能研究院(BAAI)宣佈正式發佈新一代中文互聯網語料庫CCI3.0(Chinese Corpora Internet),進一步推動數據共建共享。CCI3.0包含1000GB的數據集及498GB的高質量子集CCI3.0-HQ,是繼2023年11月首次開源CCI1.0和2024年4月發佈CCI2.0之後的又一次重要更新。

17.9k 8 小時前
智源研究院發佈中文互聯網語料庫CCI3.0 包含1000GB數據集
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖