["螞蟻集團旗下CodeFuse代碼大模型開源ModelCache大模型語義緩存","ModelCache架構包括adapter、embedding、similarity和data_manager模塊","ModelCache可降低大型模型應用的推理成本,提升用戶體驗","命中緩存可將平均耗時降低10倍,提速率可達14.5%","ModelCache將繼續優化性能和精度,提升召回時間和準確率"]
Openai
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Alibaba
$4
$16
1k
Xai
$1.4
$10.5
256
$1
Bytedance
$0.5
Tencent
$3.5
$7
4
$0.7