最好的Token效率 AI工具模型_精選Token效率資訊

AI資訊

螞蟻百靈 Ling-2.6-1T 正式開源:萬億參數規模對標 GPT-5.4

螞蟻百靈大模型今日開源萬億參數旗艦模型Ling-2.6-1T，採用MLA與LinearAttention混合架構實現“快思考”機制，提升智效比，在評測中展現高Token效率，解決真實生產流中的效率難題。

螞蟻數科上線LingDT-2.6-flash 進一步爲企業提供實用型AI工具

大模型競爭焦點正從性能比拼轉向企業場景的規模化應用，追求低成本、高效率。螞蟻數科推出Ling-2.6-flash商業版LingDT-2.6-flash，主打“Token效率”，相比同參數級別模型可節省90%Token消耗，更快更省，適配企業真實場景大規模部署。

9.9k 52 分鐘前

吊打大模型？谷歌最強“輕量機”Gemini 3.1 曝光，實時渲染 UI 驚豔全場

Google DeepMind推出Gemini 3.1 Flash-Lite模型，實現AI生成式網頁渲染的突破。該模型響應速度較前代提升2.5倍，每秒可輸出超360個Token，大幅提升推理效率，推動AI從文本交互向動態UI構建發展。

17.7k 1 天前

吊打大模型？谷歌最強“輕量機”Gemini 3.1 曝光，實時渲染 UI 驚豔全場

大模型 Scaling 怎麼玩？楊植麟 GTC 首秀：押注 Token 效率與 Agent 集羣

月之暗面創始人楊植麟在英偉達GTC2026大會上首次系統披露Kimi K2.5模型技術路線圖，強調大模型發展已進入“後Scaling時代”，需重構底層邏輯，而非單純堆砌算力。他指出，突破智能上限關鍵在於優化器、注意力機制及殘差連接等核心技術的革新。

11.6k 12 小時前

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-1.6-flash

Bytedance

$0.15

輸入tokens/百萬

$1.5

輸出tokens/百萬

256

上下文長度

Qianfan-VL-70B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Grok Code Fast 1

Xai

$1.4

輸入tokens/百萬

$10.5

輸出tokens/百萬

256

上下文長度

Doubao-Seed-1.6-vision

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

MCP

Mcp Notion Server

Notion MCP服務器是一箇中間件服務，通過Notion API實現LLM與Notion工作區的交互，支持Markdown轉換優化token使用效率。

typescript

8.3k

2.0分

Onemcp

OneMCP是一個通用的MCP協議聚合器，通過元工具架構將多個外部MCP服務器的工具統一管理，採用漸進式發現和語義搜索技術，顯著降低LLM的token消耗並提高工具發現效率。

8.9k

2.0分

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

螞蟻百靈 Ling-2.6-1T 正式開源:萬億參數規模對標 GPT-5.4

螞蟻數科上線LingDT-2.6-flash 進一步爲企業提供實用型AI工具

吊打大模型？谷歌最強“輕量機”Gemini 3.1 曝光，實時渲染 UI 驚豔全場

大模型 Scaling 怎麼玩？楊植麟 GTC 首秀：押注 Token 效率與 Agent 集羣

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

qwen3-max

qwen-image-plus

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-1.5-pro-32k

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Doubao-Seed-1.6-vision

Llama 3_3 Nemotron Super 49B V1_5

Bitnet B1.58 2B 4T

Bitnet B1.58 2B 4T Bf16

Llama 3_1 Nemotron Ultra 253B CPT V1

MCP

Mcp Notion Server

Onemcp