AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

​月之暗面推出新型混合线性注意力架构 “Kimi Linear”

月之暗面推出“Kimi Linear”混合线性注意力架构,在短长距离信息处理和强化学习中性能优于传统全注意力方法。其核心Kimi Delta Attention优化了Gated DeltaNet,引入高效门控机制,提升有限状态RNN的记忆管理效率。架构由三份KDA和一份全局MLA组成。

12.7k 23 小时前
​月之暗面推出新型混合线性注意力架构 “Kimi Linear”

月之暗面发布Kimi Linear架构:KV缓存减少75%,推理速度提升6倍,Attention机制迎来颠覆性革新!

月之暗面推出革命性“Kimi Linear”混合线性注意力架构,在短长距离处理及强化学习中超越传统全注意力方法。核心创新“Kimi Delta Attention”优化门控机制,显著提升有限状态RNN记忆效率。独特架构由三部分Kimi模块构成,实现多场景性能突破。

11.5k 3 天前
月之暗面发布Kimi Linear架构:KV缓存减少75%,推理速度提升6倍,Attention机制迎来颠覆性革新!

模型

查看更多

MiniMax Text 01

Minimax

MiniMax Text 01

$1

输入tokens/百万

$8

输出tokens/百万

128

上下文长度

Kimi Linear 48B A3B Instruct

moonshotai

K

Kimi Linear是一种高效混合线性注意力架构,在短上下文、长上下文和强化学习场景中均优于传统全注意力方法。它通过Kimi Delta Attention (KDA)机制优化注意力计算,显著提升性能和硬件效率,特别擅长处理长达100万令牌的长上下文任务。

自然语言处理TransformersTransformers
moonshotai
15k
313
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图