最好的Dolma AI工具模型_精选Dolma资讯

AI资讯

AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！

艾伦人工智能研究所（AI2）发布了一款开源大型语言模型OLMoE，旨在提供高性能与低成本的解决方案。该模型采用稀疏混合专家（MoE）架构，拥有70亿参数，但通过智能路由机制，每个输入标记仅使用10亿参数，实现高效计算。OLMoE包含通用与指令调优两个版本，支持4096标记的上下文窗口。其训练数据来源广泛，包括Common Crawl、Dolma CC和维基百科等。在性能测试中，OLMoE在多项指标上优于其他相似参数模型，甚至在某些情况下超越了更大规模的模型。AI2的目标是通过提供完全开源的AI模型，推动学术研究与开发，促进混合专家架构的广泛应用。

15.6k 10-23

AI2 发布大语言模型开源数据集 Dolma 包含 3 万亿个 token

["AI2 最近发布了一个名为 Dolma 的开源数据集，包含了 3 万亿个 token。","Dolma 的数据将为 AI2 正在开发中的开放语言模型 OLMo 提供基础，计划于 2024 年初发布。","Dolma 的数据集来自网络内容、学术出版物、代码和书籍等广泛来源，是目前公开可用的同类数据集中最大的一个。"]

10.1k 14 小时前

AI2 发布开放数据集 Dolma: 打破 AI 语言模型的数据壁垒

["艾伦人工智能研究所发布开放式文本数据集 Dolma，旨在促进 AI 语言模型的透明度和创新。","Dolma 作为 AI2 开放式语言模型计划的核心，为研究人员和开发者提供免费的数据资源。","Dolma 数据集具有 30 亿标记的规模，采用了中风险成果的 ImpACT 许可证，并鼓励用户提供联系信息和使用情况。"]

6.4k 前天