AI21Labs发布开源小型语言模型Jamba Reasoning3B,专为设备端AI计算设计。该模型基于自研混合状态空间模型-变换器架构,采用Apache2.0许可证,区别于主流大型语言模型,是Jamba系列在特拉维夫开发的最新成果。
AI21Labs 近日发布了其最新的 Jamba1.6系列大型语言模型,这款模型被称为当前市场上最强大、最高效的长文本处理模型。与传统的 Transformer 模型相比,Jamba 模型在处理长上下文时展现出了更高的速度和质量,其推理速度比同类模型快了2.5倍,标志着一种新的技术突破。Jamba1.6系列包括 Jamba Mini(12亿参数)和 Jamba Large(94亿参数),并且专门针对商业应用进行了优化,具备函数调用、结构化输出(如 JSON)和基于现实的生成能力。这些模型的应用范围广泛,从企业级的智能助手到学术研究,均能发挥
["AI21宣布完成C轮融资,筹得5,300万美元,总估值达14亿美元,总融资额达2.08亿美元。","在OpenAI内部动荡中,AI21选择宣布融资,与竞争对手争夺生成式AI市场份额。","AI21强调与企业公司密切合作,注重选择、健壮性和安全性,与OpenAI不同的定制化解决方案。","AI21在竞争中表现不俗,迎来Intel Capital和Comcast Ventures等投资者的支持。"]
["以色列初创公司 AI21 Labs 宣布完成 1.55 亿美元融资","谷歌和英伟达也参与其中","AI21 Labs 专注于定制化的生成式 AI 模型","拥有自己的大模型 Jurassic-2","与 OpenAI 竞争,提供更准确和可靠的文本生成服务"]
AI21推出的Jamba 1.6模型,专为企业私有部署设计,具备卓越的长文本处理能力。
AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型,擅长长文本处理和高效推理。
先进的混合SSM-Transformer指令遵循基础模型
高效能的长文本处理AI模型
bartowski
这是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技术进行优化,为不同硬件配置提供了多种量化选择,支持高效推理。
ai21labs
AI21 Jamba 1.5是一系列先进的基础模型,具备强大的长上下文处理能力和高效的推理速度,适用于多种业务场景。
AI21 Jamba 1.5 Mini 是一款先进的混合SSM-Transformer指令跟随基础模型,具有高效的长上下文处理能力和快速的推理速度。
Severian
Jamba-Hercules是基于ai21labs/Jamba-v0.1微调的大语言模型,使用Locutusque/hercules-v4.0数据集进行训练,专注于文本生成任务。
lightblue
基于ai21labs/Jamba-v0.1微调的聊天机器人模型,支持多语言对话,经过数小时QLoRA微调,能在英语及其他语言中进行合理流畅的对话。
Jamba是最先进的混合SSM-Transformer大语言模型,结合了Mamba架构与Transformer优势,支持256K上下文长度,在吞吐量和性能上超越同规模模型。