信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

模型服务提交

提交模型信息和服务，精准推广和触达用户

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

GEO排名查询工具

检测品牌在AI平台中的可见度

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

信息

数据集合

提供用于训练、评估和测试模型的数据集

工具

智能文档识别解析

提供各类文档文字提取，支持自定义场景

Google Gemini API迎来隐式缓存功能自动节省开发成本高达75%

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · May 9, 2025

308

近期，Google 宣布在其 Gemini API 中推出一项新功能 —— 隐式缓存。这一功能旨在帮助第三方开发者在使用最新 AI 模型时节省成本，最高可达75% 的费用节约，尤其是在处理重复性上下文时效果显著。

隐式缓存的工作原理

隐式缓存的核心在于，它能够自动识别并重用之前请求中相似的内容。Google 表示，这项新功能已默认开启，适用于 Gemini2.5Pro 和2.5Flash 模型。当开发者向 Gemini2.5模型发送请求时，如果该请求与之前的某个请求存在相同的前缀，就有可能命中缓存，从而实现成本节约。

与此前的显式缓存不同，开发者在使用隐式缓存时不再需要手动定义高频请求。显式缓存的方式虽然承诺了节省成本，但由于其需要大量手动配置，导致许多开发者对此颇感不满，尤其是在最近几周关于 API 费用过高的投诉不断增加。

隐式缓存的优势

隐式缓存的最大优势在于其自动化程度。Google 在其官方博客中指出，当请求的上下文信息与先前请求相似时，系统会自动返回成本节约。这种方式简化了开发者的操作流程，减轻了他们的负担。

根据 Google 的开发者文档，隐式缓存的最低提示令牌数为2，048（针对2.5Pro 模型）和1，024(针对2.5Flash 模型)，这意味着开发者只需提供少量信息即可触发自动节省。令牌是模型处理的数据基本单元，大约1，000个令牌相当于750个单词。

使用建议与注意事项

为了更好地利用隐式缓存，Google 建议开发者在请求的开头尽量放置重复的上下文内容，以增加命中缓存的几率。而可能会在请求间变化的上下文信息，则建议放在请求的末尾。

尽管 Google 对此次隐式缓存的效果充满信心，但尚未提供第三方验证，因此开发者在使用过程中仍需保持谨慎。随着越来越多的开发者开始使用这一新功能，我们期待他们的反馈能够验证 Google 的承诺。

总的来说，Google 的隐式缓存功能无疑为开发者提供了一个降低成本的新选择。在 AI 模型的使用成本持续上升的背景下，这项创新功能的推出将对开发者社区产生积极影响。未来，随着反馈的积累，我们也将看到这一功能的实际效果。

官方博客:https://developers.googleblog.com/en/gemini-2-5-models-now-support-implicit-caching/

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作