国内大模型加速落地,公有云底层性能评价成为行业焦点。6月16日,“高质量Token服务研讨会”将召开,新版“公有云大模型Token服务性能监测平台”正式上线,并同步发布2026年6月性能监测结果。
支付宝宣布“AI支付”完成3亿笔AI智能体支付,支持95%通用智能体框架,成为全球首个大规模商用的AI原生支付基建。同时推出全球首个Token Pay服务和AI钱包产品,连同AI付与AI收,构建了涵盖授权、管理、支付、结算、安全与信任的全栈AI原生支付体系,标志着继快捷支付和扫码支付后的新里程碑。
支付宝宣布“AI支付”已完成3亿笔AI智能体支付,支持95%通用智能体框架,成为全球首个大规模商用的AI原生支付基建。同时发布Token Pay服务和AI钱包产品,构建全栈AI原生支付体系,助力AI时代发展。
中国电信推出系列试商用Token套餐,整合自有及第三方算力,打造“AI+连接+安全”一体化服务。套餐覆盖开发者、中小微企业、个人家庭及Token生态伙伴,降低AI门槛,加速大模型落地。其中,针对开发者和中小微企业,融合自研“星辰大模型”与国内主流大模型,推动多场景应用。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
Alibaba
$4
$16
$2
$20
-
Baidu
128
$6
$24
256
$15.8
$12.7
64
Bytedance
$0.8
$0.15
$1.5
32
$10.5
Tencent
$1
$8
HiveChat是一个专为中小团队设计的AI聊天应用,支持多种大模型服务商,提供分组管理、Token限额、第三方登录等功能。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。
MCP文本编辑器服务器是一个基于Model Context Protocol的文本文件编辑服务,提供行导向的文本文件操作能力,支持高效的部分文件访问以减少LLM工具的token消耗。具备并发编辑检测、多文件原子操作和多种编码支持等特性。
钉钉MCP服务是一个基于Model Control Protocol的钉钉API访问服务,提供获取token、部门及用户信息等功能。
godoc-mcp是一个高效的Go文档访问工具,通过MCP协议为LLM提供结构化、低token消耗的Go项目文档访问服务,支持本地和远程包文档查询。
OneTool是一个统一的MCP服务器,通过Python API暴露100多种工具,大幅减少AI调用工具时的token消耗和成本,避免上下文污染,支持Web搜索、数据库、文件操作、图表绘制等多种功能。
用于对xcstrings(字符串目录)文件进行增删改查操作的CLI工具和MCP服务器,提供针对性的本地化键值管理,避免AI助手处理大型文件时消耗过多token。
一个MCP服务器项目,提供基于token数量自动选择OpenAI O3或Google Gemini 2.5 Pro模型的服务,支持文件路径递归嵌入提示词,适用于代码审查和复杂问题解决。
一个与AI代码编辑器集成的MCP服务器,通过Gemini 2.5的百万token上下文窗口和任务管理功能,优化Cursor的代理能力。
一个基于MCP协议的内存缓存服务器,通过高效缓存语言模型交互数据来减少token消耗,支持自动管理和配置优化。
NCP是一个MCP协议智能编排器,将多个MCP服务器统一管理,通过语义理解自动路由工具调用,大幅减少AI工具的认知负担和token消耗,提升AI助手的工作效率和响应速度。
基于Gemini的上下文管理与缓存MCP服务器,支持2M token大上下文窗口,提供会话管理和API缓存功能。
Token Minter MCP是一个支持21条区块链的ERC-20代币铸造服务,提供代币部署、转账、查询等工具集。
RLM MCP服务器是一个基于递归语言模型模式的大规模上下文处理工具,允许Claude代码通过外部变量处理超过1000万token的文本,避免直接将海量内容输入提示词。它通过加载、分块、子查询和聚合的流程,支持自动分析和程序化执行,可连接Claude API或本地Ollama进行免费推理。
基于Notion的Markdown导航MCP服务,实现无token访问与智能笔记管理
MCP BatchIt是一个MCP工具调用批处理服务器,通过聚合多个MCP工具调用到一个请求中,显著减少AI代理的通信开销和token消耗。
一个用于Claude Code的MCP服务器,通过结构化增量快照实现90%以上的上下文压缩,显著节省token使用量
一个封装V2EX官方API 2.0的服务器,提供通知管理、用户信息、节点话题等接口功能,支持通过npm全局安装并配置token使用。
Token Optimizer MCP是一个智能令牌优化MCP服务器,通过智能缓存、压缩和工具替换,可将上下文窗口使用量减少60-90%,支持Claude Code和Claude Desktop等AI工具。
一个优化的Playwright MCP服务器,采用客户端-服务端架构实现浏览器自动化,通过创新的语义快照算法大幅减少页面内容传输量,保留关键元素的同时降低90%的token消耗。