月の暗面が「Kimi Linear」を発表。混合線形アーキテクチャで、短長距離情報処理と強化学習において従来の全注意機構を上回る性能を実現。Kimi Delta Attentionがゲート機構を導入し、RNNのメモリ管理効率を向上。....
月の暗面が「Kimi Linear」ハイブリッド線形アーキテクチャを発表。短長距離処理と強化学習で従来手法を上回り、独自の「Kimi Delta Attention」でRNNメモリ効率を向上。3つのKimiモジュールで多様なシナリオに対応。....
Minimax
$1
入力トークン/百万
$8
出力トークン/百万
128
コンテキスト長
moonshotai
Kimi Linearは、短い文脈、長い文脈、強化学習のシナリオのすべてで、従来の全アテンション方式を上回る高効率な混合線形アテンションアーキテクチャです。Kimi Delta Attention (KDA)メカニズムによりアテンション計算を最適化し、性能とハードウェア効率を大幅に向上させ、特に100万トークンに達する長文脈タスクの処理に優れています。
Mungert
RWKV - 7アーキテクチャに基づく軽量級言語モデルで、flash - linear attention形式を採用し、多言語サポートと深度思考能力を備え、テキスト生成タスクに適しています。
RWKV - 7アーキテクチャに基づく多言語テキスト生成モデルで、29億のパラメータを持ち、英語、中国語、日本語、韓国語、フランス語、アラビア語、スペイン語、ポルトガル語などの多言語をサポートします。flash - linear attention形式を採用し、高品質のテキスト生成タスクに適しています。