亚马逊调整Anthropic模型服务定价,由按“计算小时”转为按“Token数量”计费,标志AI算力成本管理更趋精细化。此举升级了成本核算方式,能更精准反映不同任务的实际算力消耗,克服传统模式单一粗放的局限。
人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B,专为消费级硬件设计,优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构,总参数量8.3B,但每个Token仅激活1.5B参数,在降低计算成本的同时提升推理性能,可流畅运行于手机和笔记本电脑上。
李彦宏在2026百度AI开发者大会上提出,衡量AI行业繁荣的指标应从“Token消耗量”转向“日活智能体数”(DAA)。他认为,Token仅反映算力投入和成本,而非产出价值;只有关注智能体为人类实际交付结果的数量,才能触及AI产业发展的本质。
春节期间国产大模型集中发布,智谱AI推出旗舰模型GLM-5,定位全能型对话、编程与智能体模型,采用稀疏注意力与多Token预测技术,参数量达745B,约为前代两倍。
代码行数和token数量统计工具
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
Alibaba
$4
$16
$1
$10
256
$2
$20
-
$6
$24
Bytedance
$0.8
$0.15
$1.5
Baidu
32
$10.5
Tencent
$8
$0.75
$0.35
400
Decompose是一个用于AI代理的确定性文本分类工具,通过纯正则表达式和启发式方法将文本分解为结构化语义单元,无需LLM即可实现快速、离线的文档预处理,显著减少LLM处理的token数量。
一个MCP服务器项目,提供基于token数量自动选择OpenAI O3或Google Gemini 2.5 Pro模型的服务,支持文件路径递归嵌入提示词,适用于代码审查和复杂问题解决。
一个通过JSONPath从URL中高效提取JSON数据的MCP服务,可大幅减少LLM处理的token数量并提高数据准确性