AI21Labsは、デバイスエッジで動作するためのオープンソースの小型言語モデルJamba Reasoning3Bをリリースしました。このモデルは独自開発のミックスドステートスペースモデル-トランスフォーマー構造に基づいており、Apache2.0ライセンスで提供されています。主流の大型言語モデルとは異なり、Jambaシリーズの中でテルアビブで開発された最新の成果です。
bartowski
これはAI21 LabsのJamba-Mini-1.7モデルの量子化バージョンで、llama.cppのimatrix技術を使用して最適化され、さまざまなハードウェア構成に対して複数の量子化オプションを提供し、高効率な推論をサポートします。
ai21labs
AI21 Jamba 1.5は一連の高度な基礎モデルで、強力な長文脈処理能力と高効率な推論速度を備え、さまざまな業務シーンに適しています。
AI21 Jamba 1.5 Mini は、効率的な長文コンテキスト処理能力と高速な推論速度を備えた先進的なハイブリッドSSM-Transformer命令追従型基盤モデルです。
Severian
Jamba-Herculesはai21labs/Jamba-v0.1をファインチューニングした大規模言語モデルで、Locutusque/hercules-v4.0データセットを使用して訓練され、テキスト生成タスクに特化しています。
lightblue
ai21labs/Jamba-v0.1をファインチューニングしたチャットボットモデルで、多言語対話をサポートし、数時間のQLoRAファインチューニングを経て、英語やその他の言語で合理的で流暢な対話が可能です。
Jambaは最先端のハイブリッドSSM-Transformer大規模言語モデルで、MambaアーキテクチャとTransformerの利点を組み合わせ、256Kのコンテキスト長をサポートし、スループットと性能において同規模のモデルを凌駕します。