Best 多模态融合 AI Tools & Models - Premium 多模态融合 News

AI News

万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro

上海人工智能实验室发布并开源万亿参数科学多模态大模型“书生 Intern-S1-Pro”，基于“通专融合”架构 SAGE 打造，刷新开源社区参数规模纪录，在多项科学能力上实现突破，综合学科评测稳居 AI4S 领域国际前列。

12.5k 12 hours ago

上海 AI 实验室发布科学多模态模型书生Intern-S1-Pro

上海AI实验室发布全球最大开源科学多模态模型“书生 Intern-S1-Pro”，参数达1万亿。该模型基于“通专融合”架构SAGE，在科学能力上达到国际领先水平，尤其在复杂学科评测中展现出卓越的逻辑推理能力。

10.1k yesterday

涂鸦变游戏：Google 发布 Project Genie，一句话生成可交互虚拟世界

谷歌DeepMind开放Project Genie AI模型，用户可通过文本或图片生成可交互虚拟世界，实现游戏式探索。该工具融合Genie3、Nano Banana Pro图像生成和Gemini多模态模型，突破传统内容生成边界。

12.5k 13 hours ago

涂鸦变游戏：Google 发布 Project Genie，一句话生成可交互虚拟世界

商汤重磅开源 SenseNova-MARS：开启多模态自主推理新篇章

商汤科技开源多模态自主推理模型SenseNova-MARS，提供8B和32B版本。该模型是首个Agentic VLM，融合动态视觉推理与图文搜索，能理解图像并自主推理，推动多模态大模型发展。

10.9k 17 hours ago

AI Products

DeepSeek-VL2

先进的多模态理解模型，融合视觉与语言能力。

AI模型

13.5k

InternVL2_5-4B

多模态大型语言模型，融合视觉与语言理解。

AI模型

6.6k

InternVL2_5-26B

多模态大型语言模型，融合视觉与语言理解。

AI模型

10.9k

Spirit LM

多模态语言模型，融合文本和语音

AI模型

9.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro

上海 AI 实验室发布科学多模态模型书生Intern-S1-Pro

涂鸦变游戏：Google 发布 Project Genie，一句话生成可交互虚拟世界

商汤重磅开源 SenseNova-MARS：开启多模态自主推理新篇章

AI Products

DeepSeek-VL2

InternVL2_5-4B

InternVL2_5-26B

Spirit LM

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Wan2.2 I2V A14B Diffusers

Vae Lyra

Qwen3 VL 2B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 4B Instruct NPU

FuseLIP B CC12M MM

SkyReels V2 I2V 14B 720P

Llama 4 Scout 17B 4E Instruct

ReT CLIP ViT L 14

Phi 4 Multimodal Instruct

Phi 4 Multimodal Instruct

ViTucano 2b8 V1

Eagle X4 8B Plus

Chameleon 30b

Llama3 Mova 8b

Chameleon 7b

Moondream1

NousResearch_Nous Hermes 2 Vision GGUF

Mustango

Llava Roco 8bit

万亿参数巅峰：上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro