隨着大型語言模型(LLMs)在自然語言處理(NLP)領域的廣泛應用,文本生成和語言理解等任務的效果得顯著提升。然而,阿拉伯語由於其複雜的詞形變化、豐富的方言和文化背景,依然在語言模型的應用中被低估。許多先進的語言模型主要針對英語,導致阿拉伯語相關模型要麼過於龐大,計算需求高,要麼無法充分體現文化細節。超過70億參數的模型如 Jais 和 AceGPT 具備強大的能力,但由於資源消耗巨大,難以在廣泛應用中得到推廣。因此,迫切需要一種兼顧效率與性能的阿拉伯語模型。爲了
["Jais是首個面向阿拉伯語的開源大模型,參數達130億","Jais在阿拉伯語任務表現可匹敵商業英語ChatGPT模型","Jais使用Cerebras專用AI芯片訓練,具技術創新"]
["阿聯酋科技集團 G42 與 Cerebras Systems 合作推出名爲 Jais 的開源阿拉伯語 AI 模型,可爲生成式 AI 應用提供支持。","Jais 是一個大語言模型,包含 130 億個參數,是從阿拉伯語和英語數據中訓練而成的。","Jais 將以開源許可方式提供,有助於促進阿拉伯語資源的開發和阿拉伯世界的 AI 進步。"]
13B參數阿拉伯語英語同構模型
linagora
Labess-7b-chat 是一個針對突尼斯方言(Derja)進行指令調優的開源模型,基於 jais-adapted-7b-chat 模型,使用突尼斯方言數據集進行持續預訓練。
MBZUAI-Paris
Atlas-Chat是一系列專為摩洛哥口語Darija進行指令調優的開源大語言模型,是JAIS項目的一部分。該模型擁有20億參數,能夠高效生成流暢的摩洛哥Darija文本,適用於資源受限環境部署。
inceptionai
Jais系列是專為阿拉伯語優化的雙語大語言模型,同時具備強大的英語能力。30B-16K版本擁有300億參數,支持16,384個token的上下文長度。
Jais系列是專精阿拉伯語處理同時具備強大英語能力的雙語大語言模型,包含從5.9億到700億參數的不同規模變體
Jais系列是一個全面的英阿雙語大語言模型,專為阿拉伯語優化同時具備強大的英語能力。該模型經過指令微調,適用於對話場景。
Jais系列是專為阿拉伯語優化的英阿雙語大語言模型,13B版本具有130億參數,支持2048標記的上下文長度。
Jais系列是專為阿拉伯語優化的英阿雙語大語言模型,具備強大的英語能力,參數量6.7億
Jais家族是一個專為阿拉伯語優化的雙語大語言模型系列,同時具備強大的英語能力。該6.7B參數模型採用從頭預訓練方式,支持阿拉伯語和英語文本生成。
Jais系列是專為阿拉伯語和英語優化的雙語大語言模型,包含從5.9億到700億參數的不同規模變體
Jais是專為阿拉伯語優化的雙語大語言模型家族,具備強大的英語能力,參數量從5.9億到700億不等
Jais Adapted 13B是基於Llama-2架構的雙語(阿拉伯語-英語)大語言模型,通過自適應預訓練增強阿拉伯語能力
Jais系列是專精阿拉伯語處理的雙語大語言模型,具備強大的英語能力,參數量13億
Jais系列是基於Llama-2架構的雙語大語言模型,專為阿拉伯語優化同時具備強大英語能力。本模型為700億參數規模的阿拉伯語自適應版本,支持4,096上下文長度。
Jais系列13億參數阿拉伯語-英語雙語大語言模型,專為卓越的阿拉伯語能力優化,同時具備強大英語能力
Jais系列是專精阿拉伯語處理的雙語大語言模型,基於Llama-2架構進行阿拉伯語適配預訓練
Jais系列是一個專為阿拉伯語優化的雙語大語言模型,同時具備強大的英語能力。該590M參數版本是系列中最小的模型,適用於輕量級應用。
Jais系列是一個阿拉伯語-英語雙語大語言模型,特別優化阿拉伯語表現,同時保持強大英語能力。590m版本是該系列的基礎模型之一。
Jais系列是一組英阿雙語大語言模型,針對阿拉伯語優化同時保持強大英語能力,包含從5.9億到700億參數的不同規模模型。
Jais系列是專為阿拉伯語優化的英阿雙語大語言模型,基於Llama-2架構進行自適應預訓練,具備強大的雙語處理能力。
Jais-30b-chat-v3是基於Jais-30b-v3在精選阿拉伯語和英語問答數據集上微調而成的大語言模型,專為阿拉伯語和英語對話優化,具有8000令牌的長上下文處理能力。