Best AI评测 AI Tools & Models - Premium AI评测 News

AI News

通义实验室发布Qwen3.7-Max，以“正交解耦”技术斩获多项评测国内第一

通义实验室发布新一代AI Agent基座大模型Qwen3.7-Max，在多项评测中获国内第一，旨在解决智能体长链路运行中断、崩溃问题。在未知硬件ZW-M890L PPU的极限压力测试中，该模型无文档和先验数据，凭运行时反馈展现长程策略连贯性与泛化力，连续运行35小时、1158次工具调用零中断。

15k 42 minutes ago

视觉大模型遭遇滑铁卢：首个中国古文字OCR评测基准开源

腾讯混元大模型联合故宫博物院等机构推出“Chronicles-OCR”，这是业界首个覆盖汉字“七体之变”演化轨迹的古文字感知评测基准。数据集由专家多层交叉标注，包含2800张图像，旨在测试AI对甲骨文等古文字的识别能力，推动人工智能理解汉字从龟甲刻痕到现代代码的完整演变。

56.7k 2 minutes ago

智效比提升十倍：蚂蚁集团百灵大模型Ling-2.6-flash正式开源

蚂蚁集团百灵大模型今日开源Ling-2.6-flash，推出BF16、FP8、INT4等多量化版本，降低AI部署门槛。该模型总参数104B，激活参数7.4B，此前以匿名身份在国际评测平台表现优异，并针对中英文切换与代码生成完成多轮优化。

10.7k 7 hours ago

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

SuperCLUE-VLM 2026年4月评测报告显示，中文多模态视觉语言模型领域发生结构性变动。在对全球17款主流大模型深度横评中，国产AI阵营表现强劲，中文理解优势显著，综合得分反超海外顶尖模型。字节跳动Doubao-Seed-2.0-Pro-260215以90.66分登顶总榜，多款国产模型跻身第一梯队。

15.1k 2 hours ago

AI Products

ToolCenter

发现 1500 多种 AI 工具，提供诚实的评测与比较。

AI信息平台

5.1k

虾评 Skill

面向AI Agent的Coze Skill分享评测平台，汇聚优质技能资源

AI信息平台

46.3k

SuperCLUE

领先的AI评测基准，衡量和比较AI模型性能。

AI模型

11.8k

AI Amazon Product Reviews / Manuals

AI驱动的亚马逊产品评测和使用手册

电商

10.5k

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-tts-flash-realtime

Alibaba

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

通义实验室发布Qwen3.7-Max，以“正交解耦”技术斩获多项评测国内第一

视觉大模型遭遇滑铁卢：首个中国古文字OCR评测基准开源

智效比提升十倍：蚂蚁集团百灵大模型Ling-2.6-flash正式开源

​国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

AI Products

ToolCenter

虾评 Skill

SuperCLUE

AI Amazon Product Reviews / Manuals

Models

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-max

Qianfan-Lightning

wan2.5-i2i-preview

qwen-image-edit

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

wan2.5-t2i-preview

wan2.5-i2v-preview

qwen3-omni-flash-realtime

qwen3-tts-flash-realtime

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一