AI21Labsは、デバイスエッジで動作するためのオープンソースの小型言語モデルJamba Reasoning3Bをリリースしました。このモデルは独自開発のミックスドステートスペースモデル-トランスフォーマー構造に基づいており、Apache2.0ライセンスで提供されています。主流の大型言語モデルとは異なり、Jambaシリーズの中でテルアビブで開発された最新の成果です。
説明はありません
AI21が提供するJamba 1.6モデルは、企業のプライベート展開向けに設計されており、優れた長テキスト処理能力を備えています。
AI21 Jamba Large 1.6は、長文処理と効率的な推論に優れた、強力な混合SSM-Transformerアーキテクチャの基礎モデルです。
高度洗練された混合SSM-Transformer命令追従基礎モデル
高度洗練された混合SSM-Transformer指令追従基盤モデル
ai21-labs
$3.53
入力トークン/百万
$7.99
出力トークン/百万
260k
コンテキスト長
$14.4
$57.6
256k
-
$1.44
$2.88
258k
bartowski
これはAI21 LabsのJamba-Mini-1.7モデルの量子化バージョンで、llama.cppのimatrix技術を使用して最適化され、さまざまなハードウェア構成に対して複数の量子化オプションを提供し、高効率な推論をサポートします。
ai21labs
AI21 Jamba 1.5は一連の高度な基礎モデルで、強力な長文脈処理能力と高効率な推論速度を備え、さまざまな業務シーンに適しています。
AI21 Jamba 1.5 Mini は、効率的な長文コンテキスト処理能力と高速な推論速度を備えた先進的なハイブリッドSSM-Transformer命令追従型基盤モデルです。
TechxGenus
Jambaは最先端のハイブリッドSSM-Transformerアーキテクチャの大規模言語モデルで、アテンション機構とMambaアーキテクチャの利点を組み合わせ、256Kのコンテキスト長をサポートし、80GB GPU単体での推論に適しています。
Severian
Jamba-Herculesはai21labs/Jamba-v0.1をファインチューニングした大規模言語モデルで、Locutusque/hercules-v4.0データセットを使用して訓練され、テキスト生成タスクに特化しています。
lightblue
ai21labs/Jamba-v0.1をファインチューニングしたチャットボットモデルで、多言語対話をサポートし、数時間のQLoRAファインチューニングを経て、英語やその他の言語で合理的で流暢な対話が可能です。
mlabonne
Jamba-v0.1をOpen-Platypus-ChatデータセットでQLoRAファインチューニングした大規模言語モデル、対話タスクに対応
Jambaは最先端のハイブリッドSSM-Transformer大規模言語モデルで、MambaアーキテクチャとTransformerの利点を組み合わせ、256Kのコンテキスト長をサポートし、スループットと性能において同規模のモデルを凌駕します。