Best Token数量 AI Tools & Models - Premium Token数量 News

AI News

成本压力传导：亚马逊调整 Anthropic 模型计费模式，明年起按 Token 计费

亚马逊调整Anthropic模型服务定价，由按“计算小时”转为按“Token数量”计费，标志AI算力成本管理更趋精细化。此举升级了成本核算方式，能更精准反映不同任务的实际算力消耗，克服传统模式单一粗放的局限。

端侧大模型迎突破！Liquid AI 开源混合专家模型 LFM2.5

人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B，专为消费级硬件设计，优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构，总参数量8.3B，但每个Token仅激活1.5B参数，在降低计算成本的同时提升推理性能，可流畅运行于手机和笔记本电脑上。

21.9k yesterday

李彦宏：AI 时代不看 Token，日活智能体数才是新“度量衡”

李彦宏在2026百度AI开发者大会上提出，衡量AI行业繁荣的指标应从“Token消耗量”转向“日活智能体数”（DAA）。他认为，Token仅反映算力投入和成本，而非产出价值；只有关注智能体为人类实际交付结果的数量，才能触及AI产业发展的本质。

13.3k 19 hours ago

国产 AI 大模型竞争升级：智谱 GLM-5 与 MiniMax 2.5 联袂发布

春节期间国产大模型集中发布，智谱AI推出旗舰模型GLM-5，定位全能型对话、编程与智能体模型，采用稀疏注意力与多Token预测技术，参数量达745B，约为前代两倍。

21k 23 hours ago

国产 AI 大模型竞争升级：智谱 GLM-5 与 MiniMax 2.5 联袂发布

AI Products

ctoc

代码行数和token数量统计工具

AI开发助手

11.5k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Doubao-Seed-1.6-flash

Bytedance

$0.15

Input tokens/M

$1.5

Output tokens/M

256

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-1.6-vision

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

MCP

Decompose

Decompose是一个用于AI代理的确定性文本分类工具，通过纯正则表达式和启发式方法将文本分解为结构化语义单元，无需LLM即可实现快速、离线的文档预处理，显著减少LLM处理的token数量。

python

7.6k

2.5points

Mcp Sage

一个MCP服务器项目，提供基于token数量自动选择OpenAI O3或Google Gemini 2.5 Pro模型的服务，支持文件路径递归嵌入提示词，适用于代码审查和复杂问题解决。

javascript

30k

2.5points

Fetch Jsonpath Mcp

一个通过JSONPath从URL中高效提取JSON数据的MCP服务，可大幅减少LLM处理的token数量并提高数据准确性

python

6.4k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map