最好的Token成本 AI工具模型_精選Token成本資訊

AI資訊

首token延遲砍掉3. 25 倍：小紅書聯手北大、上交提出HYPIC，給混合注意力大模型裝上"位置無關緩存"

大模型服務主戰場正轉向檢索增強問答、多文檔摘要和長程Agent。請求prompt由幾十到上百個語義獨立的片段（檢索文檔、技能說明、記憶、歷史輪次）拼接，形成數萬至數十萬token的超長上下文，預填充階段佔據主導算力開銷，成爲服務商最突出的成本來源，且引發更棘手的難題。

12.2k 5 分鐘前

馬斯克拋出Grok 4.5：自稱"Opus級"性能、價格僅十分之一，正面叫板OpenAI和Anthropic

馬斯克旗下SpaceXAI發佈Grok 4.5，爲上市後首個重大更新。模型定位通用主力，可完成代碼編寫等任務。馬斯克稱其達到Opus級水平，但速度更快、Token效率更高且成本更低。

18.1k 昨天

馬斯克拋出Grok 4.5：自稱"Opus級"性能、價格僅十分之一，正面叫板OpenAI和Anthropic

微信大招加碼： 10 億大模型額度免費送，AI生圖額度暴漲十倍

騰訊雲開發加碼微信AI小程序成長計劃：免費向開發者提供10億 Token 大模型額度，AI生圖額度從1萬張升至10萬張，大幅降低調用成本。核心模型同步升級。

85.6k 20 小時前

告別高額Token賬單：pxpipe如何用“圖像”重塑Claude Code開發成本

AI編程的高API調用成本是開發者痛點，新工具pxpipe作爲本地代理，能將龐大上下文信息轉爲圖像，繞過昂貴的文本Token計費，顯著降低Claude Code使用開銷。其原理是在請求發送前精確識別並轉化冗長文本，實現“以圖省字”的降本增效。

14.9k 6 小時前

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-1.6-flash

Bytedance

$0.15

輸入tokens/百萬

$1.5

輸出tokens/百萬

256

上下文長度

Doubao-Seedance-1.0-pro

Bytedance

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qianfan-VL-70B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

MCP

Onetool Mcp

OneTool是一個統一的MCP服務器，通過Python API暴露100多種工具，大幅減少AI調用工具時的token消耗和成本，避免上下文汙染，支持Web搜索、數據庫、文件操作、圖表繪製等多種功能。

python

7.8k

2.5分

Cursor Agent Mcp

基於cursor-agent CLI的MCP服務器，提供代碼分析、搜索、規劃和編輯等工具，幫助Claude Code減少token使用和成本

javascript

2.0分

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

首token延遲砍掉3. 25 倍：小紅書聯手北大、上交提出HYPIC，給混合注意力大模型裝上"位置無關緩存"

馬斯克拋出Grok 4.5：自稱"Opus級"性能、價格僅十分之一，正面叫板OpenAI和Anthropic

​微信大招加碼： 10 億大模型額度免費送，AI生圖額度暴漲十倍

告別高額Token賬單：pxpipe如何用“圖像”重塑Claude Code開發成本

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-1.5-pro-32k

Doubao-Seed-1.6-flash

Doubao-Seedance-1.0-pro

Qianfan-VL-70B

Minitron 8B Base

MCP

Onetool Mcp

Cursor Agent Mcp

微信大招加碼： 10 億大模型額度免費送，AI生圖額度暴漲十倍