Best 模型评测 AI Tools & Models - Premium 模型评测 News

AI News

MiniMax M2.5 开源低成本 Agent 时代来临

MiniMax 发布 M2.5 模型，这是其 M2 系列在 108 天内的第三次升级。模型开源权重同步上线魔搭 ModelScope，在编程、搜索、办公等多场景表现领先，实现了能力、效率与成本的三重突破。该版本提供从零代码使用到私有化部署的全流程方案，并附有工具调用与推理参数调优的实战指南，旨在推动低成本 Agent 时代的到来。M2.5 在多项评测中成绩突出，例如在 SWE-Bench Verified 中表现亮眼。

13.7k 5 hours ago

字节跳动 Seedance 2.0 震撼发布：影视飓风 Tim 揭露 AI 训练“黑盒”

知名博主Tim评测字节AI视频模型Seedance 2.0，肯定其生成精度等表现，但发现两个涉及数据伦理的细节：模型能精准生成未观测到的空间盲区，并克隆未授权语音，引发行业对AI训练数据来源与隐私的担忧。

16.8k 17 hours ago

OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

OpenAI CEO Sam Altman宣布推出编程大模型GPT-5.3-Codex，该模型在技术指标和应用层面实现突破，推动AI辅助编程进入新阶段。在SWE-Bench Pro评测中达到57%，在TerminalBench2.0和OSWorld评测中表现优异。

13.8k 9 minutes ago

万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro

上海人工智能实验室发布并开源万亿参数科学多模态大模型“书生 Intern-S1-Pro”，基于“通专融合”架构 SAGE 打造，刷新开源社区参数规模纪录，在多项科学能力上实现突破，综合学科评测稳居 AI4S 领域国际前列。

11.7k 14 hours ago

AI Products

FlagEval

模型评测平台

AI模型

9.7k

SuperCLUE

领先的AI评测基准，衡量和比较AI模型性能。

AI模型

11.4k

LMSYS Chatbot Arena Leaderboard

大型语言模型 (LLM) 性能评测的众包开放平台

AI聊天机器人

19.2k

Awesome-Domain-LLM

收集和梳理垂直领域的开源模型、数据集及评测基准

AI模型

10.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

MiniMax M2.5 开源低成本 Agent 时代来临

字节跳动 Seedance 2.0 震撼发布：影视飓风 Tim 揭露 AI 训练“黑盒”

OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro

AI Products

FlagEval

SuperCLUE

LMSYS Chatbot Arena Leaderboard

Awesome-Domain-LLM

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

YugoGPT Florida_Q8_0 GGUF

Sarashina2.2 1b Instruct V0.1

GRM Llama3.2 3B Rewardmodel Ft

MiniCPM 1B Sft Bf16

Tao 8k

14B DPO Alpha

Skywork 13B Base

XVERSE 7B Chat

Vi Mrc Large

AI News

MiniMax M2.5 开源 低成本 Agent 时代来临

字节跳动 Seedance 2.0 震撼发布：影视飓风 Tim 揭露 AI 训练“黑盒”

​OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

​万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro

AI Products

FlagEval

SuperCLUE

LMSYS Chatbot Arena Leaderboard

Awesome-Domain-LLM

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

YugoGPT Florida_Q8_0 GGUF

Sarashina2.2 1b Instruct V0.1

GRM Llama3.2 3B Rewardmodel Ft

MiniCPM 1B Sft Bf16

Tao 8k

14B DPO Alpha

Skywork 13B Base

XVERSE 7B Chat

Vi Mrc Large

MiniMax M2.5 开源低成本 Agent 时代来临

OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro