随着大型语言模型(LLMs)在自然语言处理(NLP)领域的广泛应用,文本生成和语言理解等任务的效果得显著提升。然而,阿拉伯语由于其复杂的词形变化、丰富的方言和文化背景,依然在语言模型的应用中被低估。许多先进的语言模型主要针对英语,导致阿拉伯语相关模型要么过于庞大,计算需求高,要么无法充分体现文化细节。超过70亿参数的模型如 Jais 和 AceGPT 具备强大的能力,但由于资源消耗巨大,难以在广泛应用中得到推广。因此,迫切需要一种兼顾效率与性能的阿拉伯语模型。为了
["Jais是首个面向阿拉伯语的开源大模型,参数达130亿","Jais在阿拉伯语任务表现可匹敌商业英语ChatGPT模型","Jais使用Cerebras专用AI芯片训练,具技术创新"]
["阿联酋科技集团 G42 与 Cerebras Systems 合作推出名为 Jais 的开源阿拉伯语 AI 模型,可为生成式 AI 应用提供支持。","Jais 是一个大语言模型,包含 130 亿个参数,是从阿拉伯语和英语数据中训练而成的。","Jais 将以开源许可方式提供,有助于促进阿拉伯语资源的开发和阿拉伯世界的 AI 进步。"]
13B参数阿拉伯语英语同构模型
linagora
Labess-7b-chat 是一个针对突尼斯方言(Derja)进行指令调优的开源模型,基于 jais-adapted-7b-chat 模型,使用突尼斯方言数据集进行持续预训练。
MBZUAI-Paris
Atlas-Chat是一系列专为摩洛哥口语Darija进行指令调优的开源大语言模型,是JAIS项目的一部分。该模型拥有20亿参数,能够高效生成流畅的摩洛哥Darija文本,适用于资源受限环境部署。
inceptionai
Jais系列是专为阿拉伯语优化的双语大语言模型,同时具备强大的英语能力。30B-16K版本拥有300亿参数,支持16,384个token的上下文长度。
Jais系列是专精阿拉伯语处理同时具备强大英语能力的双语大语言模型,包含从5.9亿到700亿参数的不同规模变体
Jais系列是一个全面的英阿双语大语言模型,专为阿拉伯语优化同时具备强大的英语能力。该模型经过指令微调,适用于对话场景。
Jais系列是专为阿拉伯语优化的英阿双语大语言模型,13B版本具有130亿参数,支持2048标记的上下文长度。
Jais系列是专为阿拉伯语优化的英阿双语大语言模型,具备强大的英语能力,参数量6.7亿
Jais家族是一个专为阿拉伯语优化的双语大语言模型系列,同时具备强大的英语能力。该6.7B参数模型采用从头预训练方式,支持阿拉伯语和英语文本生成。
Jais系列是专为阿拉伯语和英语优化的双语大语言模型,包含从5.9亿到700亿参数的不同规模变体
Jais是专为阿拉伯语优化的双语大语言模型家族,具备强大的英语能力,参数量从5.9亿到700亿不等
Jais Adapted 13B是基于Llama-2架构的双语(阿拉伯语-英语)大语言模型,通过自适应预训练增强阿拉伯语能力
Jais系列是专精阿拉伯语处理的双语大语言模型,具备强大的英语能力,参数量13亿
Jais系列是基于Llama-2架构的双语大语言模型,专为阿拉伯语优化同时具备强大英语能力。本模型为700亿参数规模的阿拉伯语自适应版本,支持4,096上下文长度。
Jais系列13亿参数阿拉伯语-英语双语大语言模型,专为卓越的阿拉伯语能力优化,同时具备强大英语能力
Jais系列是专精阿拉伯语处理的双语大语言模型,基于Llama-2架构进行阿拉伯语适配预训练
Jais系列是一个专为阿拉伯语优化的双语大语言模型,同时具备强大的英语能力。该590M参数版本是系列中最小的模型,适用于轻量级应用。
Jais系列是一个阿拉伯语-英语双语大语言模型,特别优化阿拉伯语表现,同时保持强大英语能力。590m版本是该系列的基础模型之一。
Jais系列是一组英阿双语大语言模型,针对阿拉伯语优化同时保持强大英语能力,包含从5.9亿到700亿参数的不同规模模型。
Jais系列是专为阿拉伯语优化的英阿双语大语言模型,基于Llama-2架构进行自适应预训练,具备强大的双语处理能力。
Jais-30b-chat-v3是基于Jais-30b-v3在精选阿拉伯语和英语问答数据集上微调而成的大语言模型,专为阿拉伯语和英语对话优化,具有8000令牌的长上下文处理能力。