最好的tokens AI工具模型_精选tokens资讯

AI资讯

日均 37 万亿 Tokens！中国企业大模型需求“大爆发”：阿里云千问市占率翻倍，稳坐行业头把交椅

中国企业通用人工智能需求激增，2025年下半年日均调用量达37万亿tokens，较上半年增长263%，显示市场应用加速落地。

14.1k 9 分钟前

中国企业大模型调用量暴增263%:阿里云千问领跑，三强格局初现

沙利文报告显示，2025年下半年中国企业级大模型市场爆发增长，日均调用量激增263%至37万亿tokens。市场竞争激烈，头部效应显著，阿里云千问表现强劲，市场份额从17.7%跃升至32.1%，稳居行业第一，字节跳动豆包紧随其后。

11.1k 3 天前

千问PC和网页端上线国内最强推理模型，主动性更强、擅长逻辑推理

阿里发布旗舰推理模型Qwen3-Max-Thinking，参数量超万亿，预训练数据达36T Tokens。该模型通过强化学习训练，在事实知识、数学推理等方面表现优异，已接入千问PC端和网页端，App即将支持。用户可一键切换体验更强推理能力。

16.1k 9 分钟前

国产算力新突破！摩尔线程×硅基流动在MTT S5000上实现DeepSeek V3 671B满血版高效推理，单卡性能逼近国际顶尖水平

国产AI芯片与大模型协同优化取得重要进展。摩尔线程与硅基流动基于国产GPU MTT S5000，成功完成对千亿参数大模型DeepSeek V3 671B的深度适配。通过应用FP8低精度推理技术，实现单卡预填充吞吐量超4000 tokens/秒，解码吞吐量超1000 tokens/秒，推理速度已接近国际主流高端AI加速器水平。

13.2k 1 天前

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Qwen3-Next-80B-A3B-Instruct

Alibaba

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6-flash

Bytedance

$0.15

输入tokens/百万

$1.5

输出tokens/百万

256

上下文长度

Qianfan-VL-70B

Baidu

输入tokens/百万

输出tokens/百万

上下文长度

Grok Code Fast 1

Xai

$1.4

输入tokens/百万

$10.5

输出tokens/百万

256

上下文长度

Doubao-Seed-1.6-vision

Bytedance

$0.8

输入tokens/百万

输出tokens/百万

256

上下文长度

Hunyuan-T1-latest

Tencent

输入tokens/百万

输出tokens/百万

上下文长度

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

输入tokens/百万

输出tokens/百万

256

上下文长度

GPT-5 nano

Openai

$0.35

输入tokens/百万

$2.8

输出tokens/百万

400

上下文长度

qwen3-coder-flash

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

MCP

TokenScope

TokenScope是一个面向大型语言模型的令牌感知目录探索工具，提供智能目录结构分析、文件内容令牌感知提取、令牌使用统计和综合报告生成功能。

python

7.2k

2.5分

Cosa Sai

该项目实现了一个基于Gemini API的MCP服务器，提供对多种技术文档的访问能力。通过2M tokens的大上下文窗口，无需传统RAG系统的分块或检索步骤，直接处理完整文档。支持查询文档、检查代码规范、解决问题提示等功能，适用于Roo/Cline环境。

typescript

8.4k

2.5分

Layerzero_mcp

LayerZero OFT MCP是一个基于TypeScript/Node.js的模型上下文协议服务器，用于创建、部署和跨链桥接Omnichain Fungible Tokens（OFTs）。它通过抽象化跨链交互的复杂性，提供了一个结构化的、上下文感知的层，便于与LLM代理、机器人或需要去中心化跨链功能的应用程序集成。

typescript

7.7k

2.0分