最好的稀疏注意力 AI工具模型_精選稀疏注意力資訊

AI資訊

比肩 Claude 4.5！硅基流動上線高速版 GLM-5，國產大模型斬獲全球第四

國產大模型GLM-5在2026年初實現重大突破，開源後在全球權威榜單Artificial Analysis中位列第四，評分與Claude Opus4.5相當。其核心創新包括：參數規模擴展至744B，預訓練數據達28.5T；集成DeepSeek稀疏注意力機制，在保持長文本理解能力的同時降低部署成本；在編程與工程領域表現突出。

11.2k 1 小時前

比肩 Claude 4.5！硅基流動上線高速版 GLM-5，國產大模型斬獲全球第四

國產 AI 大模型競爭升級：智譜 GLM-5 與 MiniMax 2.5 聯袂發佈

春節期間國產大模型集中發佈，智譜AI推出旗艦模型GLM-5，定位全能型對話、編程與智能體模型，採用稀疏注意力與多Token預測技術，參數量達745B，約爲前代兩倍。

14.1k 49 分鐘前

國產 AI 大模型競爭升級：智譜 GLM-5 與 MiniMax 2.5 聯袂發佈

清華開源 TurboDiffusion：AI 視頻生成步入“秒級”時代，最高提速達 200 倍

清華大學TSAIL實驗室與生數科技合作推出開源視頻生成加速框架TurboDiffusion，通過集成SageAttention和稀疏線性注意力機制，顯著降低高分辨率視頻處理的計算開銷，在保持生成質量的同時，將端到端擴散推理速度提升100至200倍。

14.4k 2 天前

清華開源 TurboDiffusion：AI 視頻生成步入“秒級”時代，最高提速達 200 倍

DeepSeek V3.2 雙模型發佈：線性複雜度長文本 + 無懲罰深度思考，開源陣營再衝第一梯隊

DeepSeek發佈V3.2標準版與深度思考版。評測顯示，V3.2在128k上下文場景下與GPT-5互有勝負；深度思考版在多項基準測試中與Gemini3Pro持平，並在IMO2025盲測中達到金牌分數線。核心升級是轉正稀疏注意力技術，通過優化token路由，顯著降低了長文本的計算複雜度、顯存佔用，並提升了推理速度，首次在開源模型中實現了百萬token的單卡推理能力。

13.5k 前天

模型

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen3-0.6B

Alibaba

$0.3

輸入tokens/百萬

輸出tokens/百萬

上下文長度

o1-pro

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Step-2-mini

Stepfun

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_3b_Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Starcoder2_3b

Bigcode

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Yi-Lightning

01-ai

$0.99

輸入tokens/百萬

$0.99

輸出tokens/百萬

上下文長度

Gemma 2 9B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

CogView-3-Plus

Chatglm

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemini 1.5 Pro

Google

$17.5

輸入tokens/百萬

$70

輸出tokens/百萬

2.1k

上下文長度

Doubao-1.5-pro-256k

Bytedance

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

MCP

Vggt Mps

VGGT-MPS是基於蘋果芯片優化的3D視覺重建工具，使用Metal Performance Shaders加速，能夠從單張或多張圖像生成深度圖、相機姿態和3D點雲，支持稀疏注意力實現城市級重建。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

比肩 Claude 4.5！硅基流動上線高速版 GLM-5，國產大模型斬獲全球第四

國產 AI 大模型競爭升級：智譜 GLM-5 與 MiniMax 2.5 聯袂發佈

清華開源 TurboDiffusion：AI 視頻生成步入“秒級”時代，最高提速達 200 倍

DeepSeek V3.2 雙模型發佈：線性複雜度長文本 + 無懲罰深度思考，開源陣營再衝第一梯隊