昨日,月之暗面旗下Kimi 开放平台宣布,上下文缓存(Context Caching)开始公测,该技术在 API 价格不变的前提下,可为开发者降低最高90% 的长文本旗舰大模型使用成本,并且显著提升模型的响应速度。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4