AI21Labs發佈開源小型語言模型Jamba Reasoning3B,專爲設備端AI計算設計。該模型基於自研混合狀態空間模型-變換器架構,採用Apache2.0許可證,區別於主流大型語言模型,是Jamba系列在特拉維夫開發的最新成果。
AI21Labs 近日發佈了其最新的 Jamba1.6系列大型語言模型,這款模型被稱爲當前市場上最強大、最高效的長文本處理模型。與傳統的 Transformer 模型相比,Jamba 模型在處理長上下文時展現出了更高的速度和質量,其推理速度比同類模型快了2.5倍,標誌着一種新的技術突破。Jamba1.6系列包括 Jamba Mini(12億參數)和 Jamba Large(94億參數),並且專門針對商業應用進行了優化,具備函數調用、結構化輸出(如 JSON)和基於現實的生成能力。這些模型的應用範圍廣泛,從企業級的智能助手到學術研究,均能發揮
["AI21宣佈完成C輪融資,籌得5,300萬美元,總估值達14億美元,總融資額達2.08億美元。","在OpenAI內部動盪中,AI21選擇宣佈融資,與競爭對手爭奪生成式AI市場份額。","AI21強調與企業公司密切合作,注重選擇、健壯性和安全性,與OpenAI不同的定製化解決方案。","AI21在競爭中表現不俗,迎來Intel Capital和Comcast Ventures等投資者的支持。"]
["以色列初創公司 AI21 Labs 宣佈完成 1.55 億美元融資","谷歌和英偉達也參與其中","AI21 Labs 專注於定製化的生成式 AI 模型","擁有自己的大模型 Jurassic-2","與 OpenAI 競爭,提供更準確和可靠的文本生成服務"]
AI21推出的Jamba 1.6模型,專為企業私有部署設計,具備卓越的長文本處理能力。
AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型,擅長長文本處理和高效推理。
先進的混合SSM-Transformer指令遵循基礎模型
高效能的長文本處理AI模型
bartowski
這是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技術進行優化,為不同硬件配置提供了多種量化選擇,支持高效推理。
ai21labs
AI21 Jamba 1.5是一系列先進的基礎模型,具備強大的長上下文處理能力和高效的推理速度,適用於多種業務場景。
AI21 Jamba 1.5 Mini 是一款先進的混合SSM-Transformer指令跟隨基礎模型,具有高效的長上下文處理能力和快速的推理速度。
Severian
Jamba-Hercules是基於ai21labs/Jamba-v0.1微調的大語言模型,使用Locutusque/hercules-v4.0數據集進行訓練,專注於文本生成任務。
lightblue
基於ai21labs/Jamba-v0.1微調的聊天機器人模型,支持多語言對話,經過數小時QLoRA微調,能在英語及其他語言中進行合理流暢的對話。
Jamba是最先進的混合SSM-Transformer大語言模型,結合了Mamba架構與Transformer優勢,支持256K上下文長度,在吞吐量和性能上超越同規模模型。