Best 大模型应用实验室 AI Tools & Models - Premium 大模型应用实验室 News

AI News

阿里云析言 XiYan-SQL 强势夺冠，全球 SQL 诊断评测榜单第一！

阿里云飞天实验室研发的“析言XiYan-SQL”数据分析智能体，在全球权威SQL诊断评测BIRD-CRITIC中登顶所有开放榜单，超越国内外顶尖团队，刷新行业纪录。该基准由学术界与Google Cloud合作推出，旨在测试大语言模型解决真实数据库应用问题的能力，聚焦企业常见数据库报错的诊断与修复。

11.7k 9 hours ago

沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn

沙特AI实验室Misraj AI在AWS大会上推出阿拉伯语大模型Kawn，旨在推动各行业阿拉伯语应用。其特色包括双向阿英翻译模型Mutarjim，以及首个支持15种方言的翻译模型Lahjawi，便于跨方言交流，尤其适用于聊天机器人等场景。

6.2k 10 hours ago

DeepGEM大模型落地！金域医学联手腾讯、广医一院，用AI精准“读取”癌症基因密码

金域医学推出AI癌症病理基因大模型DeepGEM，已投入临床应用。该模型融合组织切片、基因测序和临床数据，显著提升基因突变识别效率与准确率，推动AI从实验室走向癌症诊疗一线，加速精准医疗发展。

9.1k 5 hours ago

上海AI实验室发布首个视频转网页评测基准IWR-Bench：GPT-5综合得分仅36.35分

上海人工智能实验室联合浙江大学推出IVR-Bench基准测试，首次专门评估大语言模型将视频转化为交互式网页代码的能力。该测试通过观看记录用户操作流程的视频，要求模型重建动态网页，填补了AI前端开发领域动态交互评测的空白，推动多模态大语言模型在真实场景中的应用。

7.2k 5 days ago

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​阿里云析言 XiYan-SQL 强势夺冠，全球 SQL 诊断评测榜单第一！

沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn

DeepGEM大模型落地！金域医学联手腾讯、广医一院，用AI精准“读取”癌症基因密码

上海AI实验室发布首个视频转网页评测基准IWR-Bench：GPT-5综合得分仅36.35分

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

阿里云析言 XiYan-SQL 强势夺冠，全球 SQL 诊断评测榜单第一！