AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

​月之暗面推出新型混合線性注意力架構 “Kimi Linear”

月之暗面推出“Kimi Linear”混合線性注意力架構,在短長距離信息處理和強化學習中性能優於傳統全注意力方法。其核心Kimi Delta Attention優化了Gated DeltaNet,引入高效門控機制,提升有限狀態RNN的記憶管理效率。架構由三份KDA和一份全局MLA組成。

11.7k 前天
​月之暗面推出新型混合線性注意力架構 “Kimi Linear”

月之暗面發佈Kimi Linear架構:KV緩存減少75%,推理速度提升6倍,Attention機制迎來顛覆性革新!

月之暗面推出革命性“Kimi Linear”混合線性注意力架構,在短長距離處理及強化學習中超越傳統全注意力方法。核心創新“Kimi Delta Attention”優化門控機制,顯著提升有限狀態RNN記憶效率。獨特架構由三部分Kimi模塊構成,實現多場景性能突破。

11.5k 前天
月之暗面發佈Kimi Linear架構:KV緩存減少75%,推理速度提升6倍,Attention機制迎來顛覆性革新!

模型

查看更多

MiniMax Text 01

Minimax

MiniMax Text 01

$1

輸入tokens/百萬

$8

輸出tokens/百萬

128

上下文長度

Kimi Linear 48B A3B Instruct

moonshotai

K

Kimi Linear是一種高效混合線性注意力架構,在短上下文、長上下文和強化學習場景中均優於傳統全注意力方法。它通過Kimi Delta Attention (KDA)機制優化注意力計算,顯著提升性能和硬件效率,特別擅長處理長達100萬令牌的長上下文任務。

自然語言處理TransformersTransformers
moonshotai
15k
313
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖