Best 多模态推理模型 AI Tools & Models - Premium 多模态推理模型 News

AI News

DeepSeek V4下周发布:原生支持影音图文生成，适配国产算力

深度求索将于下周发布多模态大模型V4，原生支持图像、视频与文本生成，旨在填补国内高性能低成本开源多模态模型市场空白。这是继1月发布R1推理模型后的首次重大更新。发布初期将提供简要技术说明，一个月后公开详细工程报告。V4模型已与华为、寒武纪完成底层生态合作。

20.9k 8 minutes ago

DeepSeek V4 发布在即！全新多模态模型让 AI 生成更智能

深度求索将于下周推出多模态大模型DeepSeek V4，原生支持图像、视频和文本生成。这是继今年1月发布R1推理模型后的首次重大更新，旨在满足国内对低成本开源模型的需求，推动AI发展。同时将发布简要技术说明，详细版本预计一个月后推出。

12.6k 1 hours ago

商汤重磅开源 SenseNova-MARS：开启多模态自主推理新篇章

商汤科技开源多模态自主推理模型SenseNova-MARS，提供8B和32B版本。该模型是首个Agentic VLM，融合动态视觉推理与图文搜索，能理解图像并自主推理，推动多模态大模型发展。

11.1k 21 hours ago

亚马逊发布新款 Nova 2 模型家族，技术性能全面领先

亚马逊云科技在2025年re:Invent大会上推出Nova2模型系列，包括四款新模型，在推理、多模态、对话AI、代码生成和Agent任务方面具备领先性价比。其中，Nova2Lite专为日常负载设计，支持文本、图像和视频输入并生成文本输出，是一款快速经济的推理模型。

10.4k 23 hours ago

AI Products

Step-R1-V-Mini

全新多模态推理模型，支持图文输入、文字输出，具备高精度图像感知与复杂推理能力。

AI模型

8.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

DeepSeek V4下周发布:原生支持影音图文生成，适配国产算力

DeepSeek V4 发布在即！全新多模态模型让 AI 生成更智能

商汤重磅开源 SenseNova-MARS：开启多模态自主推理新篇章

亚马逊发布新款 Nova 2 模型家族，技术性能全面领先

AI Products

Step-R1-V-Mini

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Unsloth Magistral Small 2509 Mlx Mxfp4

Apriel 1.5 15b Thinker GGUF

Apriel 1.5 15b Thinker AWQ 8bit

Apriel 1.5 15b Thinker GGUF

Apriel 1.5 15b Thinker

Intern S1 FP8

Intern S1

Patho R1 7B

Skywork R1V2 38B

VL Reasoner 7B

General Reasoner 14B Preview

OpenVLThinker 7B

VisualThinker R1 Zero