Best AI推理大模型 AI Tools & Models - Premium AI推理大模型 News

AI News

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

Google DeepMind推出Gemini 3.1 Flash-Lite模型，实现AI生成式网页渲染的突破。该模型响应速度较前代提升2.5倍，每秒可输出超360个Token，大幅提升推理效率，推动AI从文本交互向动态UI构建发展。

12.6k 9 minutes ago

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

欧洲 AI 霸主祭出“全能王”！Mistral Small 4 发布：推理、多模态、编程我全都要

欧洲Mistral AI发布全能型大模型Mistral Small4，首次在单一模型中融合旗舰级推理、多模态理解和强大编程能力，让开发者无需在不同垂直模型间选择，实现“全都要”。

15.1k 49 minutes ago

AI日报：xAI发布Grok4.20；美团上线AI搜索产品“问小团”；百度健康内测AI医生助手“DoctorClaw”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录xAI发布Grok4.20，其推理性能显著提升，非幻觉率高达78%，创行业纪录。国产模型凭借高性价比优势，正在推动大模型Token消耗量的增长。

30.2k 29 minutes ago

AI日报：腾讯WorkBuddy支持微信一键直连；小红书首发龙虾禁令；ComfyUI推出App Mode

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。8、NVIDIA发布开源大模型Nemotron3Super：性能直逼GPT-5.4NVIDIA发布了专为AI智能体设计的开源大模型Nemotron3Super，凭借卓越的推理效率和任务成功率迅速成为开源社区焦点。该模型采用创新的Mamba-MoE混合架构，支持超长上下文，性能表现接近闭源大模型，同时适配最新硬件平台并被多家科技巨头集成。

30.6k 29 minutes ago

AI日报：腾讯WorkBuddy支持微信一键直连；小红书首发龙虾禁令；ComfyUI推出App Mode

AI Products

DeepSeek-V3/R1 推理系统

DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构，专为大规模 AI 模型优化设计。

模型训练与部署

9.2k

DeepSeek Japanese

DeepSeek 是一款先进的 AI 语言模型，擅长逻辑推理、数学和编程任务，提供免费使用。

AI模型

10.7k

Qwen2.5-Coder-14B-Instruct-AWQ

开源代码生成与推理的大型语言模型

AI模型

10.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

吊打大模型？谷歌最强“轻量机”Gemini 3.1 曝光，实时渲染 UI 惊艳全场

欧洲 AI 霸主祭出“全能王”！Mistral Small 4 发布：推理、多模态、编程我全都要

AI日报：xAI发布Grok4.20；美团上线AI搜索产品“问小团”；百度健康内测AI医生助手“DoctorClaw”

AI日报：腾讯WorkBuddy支持微信一键直连；小红书首发龙虾禁令；ComfyUI推出App Mode

AI Products

DeepSeek-V3/R1 推理系统

DeepSeek Japanese

Qwen2.5-Coder-14B-Instruct-AWQ

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Mistralai_Mistral Large 3 675B Instruct 2512 GGUF

Pokee_research_7b GGUF

GLM 4.6 GGUF

Qwen3 0.6B

GLM 4.5 Air 3bit DWQ V2

NVIDIA Nemotron Nano 9B V2

GLM 4.5 Air 6bit

Llama 3_3 Nemotron Super 49B V1_5 GGUF

II Medical 8B

ISA 03 Mini 3B Hybrid Preview

GLM Z1 9B 0414

DeepSeek V3 0324 BF16

STILL 3 TOOL 32B

Microsoft_WizardLM 2 7B

WizardLM 2 8x22B

Mixtral 8x22B V0.1

Mixtral_11Bx2_MoE_19B