最好的Token效率 AI工具模型_精选Token效率资讯

AI资讯

蚂蚁百灵 Ling-2.6-1T 正式开源:万亿参数规模对标 GPT-5.4

蚂蚁百灵大模型今日开源万亿参数旗舰模型Ling-2.6-1T，采用MLA与LinearAttention混合架构实现“快思考”机制，提升智效比，在评测中展现高Token效率，解决真实生产流中的效率难题。

蚂蚁数科上线LingDT-2.6-flash 进一步为企业提供实用型AI工具

大模型竞争焦点正从性能比拼转向企业场景的规模化应用，追求低成本、高效率。蚂蚁数科推出Ling-2.6-flash商业版LingDT-2.6-flash，主打“Token效率”，相比同参数级别模型可节省90%Token消耗，更快更省，适配企业真实场景大规模部署。

8.9k 51 分钟前

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

Google DeepMind推出Gemini 3.1 Flash-Lite模型，实现AI生成式网页渲染的突破。该模型响应速度较前代提升2.5倍，每秒可输出超360个Token，大幅提升推理效率，推动AI从文本交互向动态UI构建发展。

17.7k 1 天前

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

大模型 Scaling 怎么玩？杨植麟 GTC 首秀：押注 Token 效率与 Agent 集群

月之暗面创始人杨植麟在英伟达GTC2026大会上首次系统披露Kimi K2.5模型技术路线图，强调大模型发展已进入“后Scaling时代”，需重构底层逻辑，而非单纯堆砌算力。他指出，突破智能上限关键在于优化器、注意力机制及残差连接等核心技术的革新。

11.6k 16 小时前

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-1.5-pro-32k

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

128

上下文长度

Doubao-Seed-1.6-flash

Bytedance

$0.15

输入tokens/百万

$1.5

输出tokens/百万

256

上下文长度

Qianfan-VL-70B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Grok Code Fast 1

Xai

$1.4

输入tokens/百万

$10.5

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6-vision

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

MCP

Onemcp

OneMCP是一个通用的MCP协议聚合器，通过元工具架构将多个外部MCP服务器的工具统一管理，采用渐进式发现和语义搜索技术，显著降低LLM的token消耗并提高工具发现效率。

8.9k

2.0分

Mcp Notion Server

Notion MCP服务器是一个中间件服务，通过Notion API实现LLM与Notion工作区的交互，支持Markdown转换优化token使用效率。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

蚂蚁百灵 Ling-2.6-1T 正式开源:万亿参数规模对标 GPT-5.4

蚂蚁数科上线LingDT-2.6-flash 进一步为企业提供实用型AI工具

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

大模型 Scaling 怎么玩？杨植麟 GTC 首秀：押注 Token 效率与 Agent 集群

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qwen3-Next-80B-A3B-Instruct

Doubao-Seed-1.6

Doubao-1.5-pro-32k

Doubao-Seed-1.6-flash

Qianfan-VL-70B

Grok Code Fast 1

Doubao-Seed-1.6-vision

Llama 3_3 Nemotron Super 49B V1_5

Bitnet B1.58 2B 4T

Bitnet B1.58 2B 4T Bf16

Llama 3_1 Nemotron Ultra 253B CPT V1

MCP

Onemcp

Mcp Notion Server