Best 国产大模型 AI Tools & Models - Premium 国产大模型 News

AI News

小米MiMo登顶OpenRouter全球调用量榜首，国产大模型首次问鼎

小米MiMo在全球最大AI模型API聚合平台OpenRouter上登顶全球调用量榜首，成为首个获此成就的国产大模型。近一个月，MiMo贡献1.45万亿Token调用量，在300多个模型中脱颖而出。其端云协同架构设计带来高推理效率和低成本，实用性优先的定位获全球开发者认可。生态上，Nous Research已与小米合作，MiMo系列全面接入增长最快的开源生态。

11.9k 2 minutes ago

AMD 推出 vLLM-ATOM 插件，深度优化国产大模型推理表现

AMD发布vLLM-ATOM插件，旨在不改变现有工作流的前提下，充分挖掘硬件潜力，为DeepSeek-R1、Kimi-K2等主流大语言模型推理显著提速。vLLM本身是优化高并发场景吞吐量与显存利用率的开源框架，专注请求调度和缓存管理，ATOM插件则进一步强化了这一能力。

12.9k 52 minutes ago

视频生成“独角兽”呼之欲出?快手回应可灵AI分拆传闻:正评估外部融资方案

快手科技5月12日公告确认，正评估重组可灵AI业务，计划引入外部融资并推动独立上市。市场消息称，快手已启动Pre-IPO融资洽谈，拟融资20亿美元，目标估值200亿美元。此举旨在加速该大模型业务的独立扩张，利用外部资源提升竞争力。可灵AI作为国产视频生成模型，分拆后有望获得更快发展。

12.2k 22 minutes ago

加速国产大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

AMD发布vLLM-ATOM插件，专为大语言模型部署优化，在不改变现有工作流下，显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制，利用vLLM框架的高显存利用率优势，让开发者以低学习成本实现技术迁移，获得性能平滑升级。

18.7k 22 minutes ago

AI Products

岩芯数智

国产化大模型，支持多模态，快速低成本智能化转型。

AI模型

11.3k

AI对话鸭

一键发起AI机器人对话，集成多款国产大模型。

聊天机器人

15.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

小米MiMo登顶OpenRouter全球调用量榜首，国产大模型首次问鼎

AMD 推出 vLLM-ATOM 插件，深度优化国产大模型推理表现

视频生成“独角兽”呼之欲出?快手回应可灵AI分拆传闻:正评估外部融资方案

加速国产大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

AI Products

岩芯数智

AI对话鸭

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

qwen3-max

Qianfan-Lightning

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Fugaku LLM 13B