Best 多模态生成AI模型 AI Tools & Models - Premium 多模态生成AI模型 News

AI News

DeepSeek V4 即将上线！全新多模态模型将颠覆AI界

DeepSeek将于下周发布多模态大模型V4，支持图像、视频及文本生成。该模型全面适配国产算力，旨在优化与中国制造芯片的兼容性，有望推动本土半导体需求并加速AI推理与国产芯片的融合。

23.7k 6 minutes ago

DeepSeek V4 发布在即！全新多模态模型让 AI 生成更智能

深度求索将于下周推出多模态大模型DeepSeek V4，原生支持图像、视频和文本生成。这是继今年1月发布R1推理模型后的首次重大更新，旨在满足国内对低成本开源模型的需求，推动AI发展。同时将发布简要技术说明，详细版本预计一个月后推出。

15.6k 2 hours ago

谷歌发布新Flow:集成 Nano Banana 模型并打通 Veo 视频工作流

谷歌于2026年2月25日宣布对其AI创意工作室Flow进行重大升级，核心是将图像生成项目Whisk与ImageFX深度整合进平台，推动多模态AI工具从分散实验转向统一工作流。新版Flow搭载最新的图像模型Nano Banana，支持生成高精度图像，并可直接作为素材导入Veo视频模型，实现从静态图像到动态内容的流畅创作。

12.2k 10 hours ago

谷歌发布新Flow:集成 Nano Banana 模型并打通 Veo 视频工作流

谷歌重磅推出 Lyria 3！AI 音乐生成新纪元，合规与创作的双重挑战

谷歌推出最新AI音乐生成模型Lyria 3，支持多模态输入，可生成30秒高保真音乐，适用于多种语言，桌面端已逐步开放体验。

8.6k 8 hours ago

AI Products

LTX-2

LTX-2 是代多模态 AI 视频生成模型。

视频生成

7.6k

Dreamomni2

统一的多模态AI，支持基于指令的图像编辑与生成，超越商业模型。

图片生成

7.8k

OmniGen2

一个强大的统一多模态模型，支持文本到图像生成及图像编辑。

图片生成

13.8k

Magma-8B

Magma-8B 是微软推出的一款多模态 AI 模型，能够处理图像和文本输入并生成文本输出。

AI模型

11.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

javascript

9.2k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

DeepSeek V4 即将上线！全新多模态模型将颠覆AI界

DeepSeek V4 发布在即！全新多模态模型让 AI 生成更智能

谷歌发布新Flow:集成 Nano Banana 模型并打通 Veo 视频工作流

谷歌重磅推出 Lyria 3！AI 音乐生成新纪元，合规与创作的双重挑战

AI Products

LTX-2

Dreamomni2

OmniGen2

Magma-8B

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen-image-edit

Qwen3 VL 2B Instruct GGUF

Cosmos Reason1 7B

Meta Llama_Llama 4 Maverick 17B 128E Instruct

Magma 8B

Xgen Mm Phi3 Mini Instruct R V1

Uform3 Image Text Multilingual Base

Uform3 Image Text English Small

MCP

MCPollinations