Best 稀疏注意力 AI Tools & Models - Premium 稀疏注意力 News

AI News

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

清华大学TSAIL实验室与生数科技合作推出开源视频生成加速框架TurboDiffusion，通过集成SageAttention和稀疏线性注意力机制，显著降低高分辨率视频处理的计算开销，在保持生成质量的同时，将端到端扩散推理速度提升100至200倍。

14.1k 10 hours ago

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

DeepSeek V3.2 双模型发布：线性复杂度长文本 + 无惩罚深度思考，开源阵营再冲第一梯队

DeepSeek发布V3.2标准版与深度思考版。评测显示，V3.2在128k上下文场景下与GPT-5互有胜负；深度思考版在多项基准测试中与Gemini3Pro持平，并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术，通过优化token路由，显著降低了长文本的计算复杂度、显存占用，并提升了推理速度，首次在开源模型中实现了百万token的单卡推理能力。

12.2k 3 days ago

DeepSeek-V3.2 正式发布：引入创新稀疏注意力架构，API 成本腰斩，性能比肩顶尖闭源模型

12月1日，中国AI公司深度求索发布DeepSeek-V3.2系列模型，包括标准版和高计算增强版。该系列采用创新的稀疏注意力机制（DSA），首次实现细粒度稀疏注意力，有效降低长文本处理的计算成本。模型强化了Agent能力，旨在挑战GPT-5和Gemini 3.0 Pro等全球顶级AI模型。

14.2k 17 hours ago

揭开MiniMax M2的神秘面纱：为何选择全注意力机制？

MiniMax M2模型采用全注意力机制，放弃线性或稀疏注意力技术。开发团队认为，尽管后者能节省计算资源，但全注意力在工业应用中更高效，能提升模型性能。这一决策旨在优化实际部署效果，推动AI技术发展。

13k 6 hours ago

Models

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

o1-pro

Openai

Input tokens/M

Output tokens/M

Context Length

Step-2-mini

Stepfun

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Starcoder2_3b

Bigcode

Input tokens/M

Output tokens/M

Context Length

Yi-Lightning

01-ai

$0.99

Input tokens/M

$0.99

Output tokens/M

Context Length

Gemma 2 9B

Google

Input tokens/M

Output tokens/M

Context Length

CogView-3-Plus

Chatglm

Input tokens/M

Output tokens/M

Context Length

Gemini 1.5 Pro

Google

$17.5

Input tokens/M

$70

Output tokens/M

2.1k

Context Length

Doubao-1.5-pro-256k

Bytedance

Input tokens/M

Output tokens/M

256

Context Length

MCP

Vggt Mps

VGGT-MPS是基于苹果芯片优化的3D视觉重建工具，使用Metal Performance Shaders加速，能够从单张或多张图像生成深度图、相机姿态和3D点云，支持稀疏注意力实现城市级重建。

python

5.1k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

DeepSeek V3.2 双模型发布：线性复杂度长文本 + 无惩罚深度思考，开源阵营再冲第一梯队