Anthropic 悄然調整AI編程工具Claude Code計費標準,Token消耗成本翻倍,每位開發者活躍日平均使用成本升至約13美元,較此前預估顯著增加,凸顯AI編程領域成本壓力加劇。
DeepSeek宣佈全系API輸入緩存價格大幅下調至首發價的1/10,其中V4-Pro緩存輸入價格降至0.1元/百萬Tokens,限時優惠後僅0.025元,遠低於海外競品GPT-5.5Pro。此舉旨在通過極致性價比吸引更多開發者和企業接入,標誌着國產AI成本控制進入新階段。
國產模型MiniMax 2.7因OpenClaw插件走紅,官方宣佈本週末將開源,以降低開發者成本。該模型自3月發佈後迭代迅速,調用量領先,核心優勢在於軟件工程與專業辦公能力的雙重提升。
2026年除夕,阿里巴巴開源新一代大模型千問Qwen3.5-Plus,性能媲美Gemini3Pro,成爲全球最強開源大模型。該模型採用底層架構革新,參數3970億但激活僅170億,以更小規模超越萬億參數的Qwen3-Max,部署顯存佔用降低60%,長上下文推理吞吐量提升19倍。API成本低至每百萬Token 0.8元,僅爲Gemini3Pro的1/18。此外,它實現了從純文本到原生多模態的躍遷。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
-
$4
$16
$2
$20
Bytedance
$0.8
128
$0.15
$1.5
Baidu
32
nvidia
Minitron-8B-Base是通過剪裁Nemotron-4 15B獲得的大型語言模型,採用蒸餾持續訓練方法,相比從頭訓練節省了40倍的訓練token和1.8倍的計算成本。
OneTool是一個統一的MCP服務器,通過Python API暴露100多種工具,大幅減少AI調用工具時的token消耗和成本,避免上下文汙染,支持Web搜索、數據庫、文件操作、圖表繪製等多種功能。
基於cursor-agent CLI的MCP服務器,提供代碼分析、搜索、規劃和編輯等工具,幫助Claude Code減少token使用和成本