Best 线性注意力 AI Tools & Models - Premium 线性注意力 News

AI News

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

清华大学TSAIL实验室与生数科技合作推出开源视频生成加速框架TurboDiffusion，通过集成SageAttention和稀疏线性注意力机制，显著降低高分辨率视频处理的计算开销，在保持生成质量的同时，将端到端扩散推理速度提升100至200倍。

12.9k 1 days ago

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

揭开MiniMax M2的神秘面纱：为何选择全注意力机制？

MiniMax M2模型采用全注意力机制，放弃线性或稀疏注意力技术。开发团队认为，尽管后者能节省计算资源，但全注意力在工业应用中更高效，能提升模型性能。这一决策旨在优化实际部署效果，推动AI技术发展。

12k 2 days ago

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

月之暗面团队推出Kimi Linear模型，在AIGC领域实现技术突破。该模型采用混合线性注意力架构，处理长上下文速度提升2.9倍，解码速度提高6倍，性能超越传统Softmax注意力机制，特别在上下文处理和强化学习等场景表现优异。

16.3k 21 hours ago

月之暗面推出新型混合线性注意力架构 “Kimi Linear”

月之暗面推出“Kimi Linear”混合线性注意力架构，在短长距离信息处理和强化学习中性能优于传统全注意力方法。其核心Kimi Delta Attention优化了Gated DeltaNet，引入高效门控机制，提升有限状态RNN的记忆管理效率。架构由三份KDA和一份全局MLA组成。

13.7k 2 days ago

Models

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

o1-pro

Openai

Input tokens/M

Output tokens/M

Context Length

Step-2-mini

Stepfun

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Starcoder2_3b

Bigcode

Input tokens/M

Output tokens/M

Context Length

Yi-Lightning

01-ai

$0.99

Input tokens/M

$0.99

Output tokens/M

Context Length

Gemma 2 9B

Google

Input tokens/M

Output tokens/M

Context Length

CogView-3-Plus

Chatglm

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

揭开MiniMax M2的神秘面纱：为何选择全注意力机制？

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

月之暗面推出新型混合线性注意力架构 “Kimi Linear”

Models

Qwen3-Next-80B-A3B-Instruct

Qwen3-0.6B

o1-pro

Step-2-mini

Qwen_v2.5_3b_Instruct

Starcoder2_3b

Yi-Lightning

Gemma 2 9B

CogView-3-Plus

Kimi Linear 48B A3B Base

Kimi Linear 48B A3B Instruct

Jet Nemotron 4B

Ring Lite Linear Preview

RWKV7 Goose Pile 168M HF

RWKV7 Goose World3 1.5B HF

RWKV7 Goose World3 2.9B HF

Rwkv7 0.1B G1

Rwkv7 1.5B World

Gla 1.3B 100B

Swinv2 Tiny Patch4 Window8 256

Swin Large Patch4 Window7 224

Yoso 4096

Swin Tiny Patch4 Window7 224

AI News

​清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

揭开MiniMax M2的神秘面纱：为何选择全注意力机制？

月之暗面推Kimi Linear模型：处理长上下文速度提高了2.9倍

​月之暗面推出新型混合线性注意力架构 “Kimi Linear”

Models

Qwen3-Next-80B-A3B-Instruct

Qwen3-0.6B

o1-pro

Step-2-mini

Qwen_v2.5_3b_Instruct

Starcoder2_3b

Yi-Lightning

Gemma 2 9B

CogView-3-Plus

Kimi Linear 48B A3B Base

Kimi Linear 48B A3B Instruct

Jet Nemotron 4B

Ring Lite Linear Preview

RWKV7 Goose Pile 168M HF

RWKV7 Goose World3 1.5B HF

RWKV7 Goose World3 2.9B HF

Rwkv7 0.1B G1

Rwkv7 1.5B World

Gla 1.3B 100B

Swinv2 Tiny Patch4 Window8 256

Swin Large Patch4 Window7 224

Yoso 4096

Swin Tiny Patch4 Window7 224

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

月之暗面推出新型混合线性注意力架构 “Kimi Linear”