Best 多模态生成AI模型 AI Tools & Models - Premium 多模态生成AI模型 News

AI News

智谱推出 GLM-5V-Turbo：为 AI 编程安上“眼睛”，设计稿秒变代码

智谱AI发布GLM-5V-Turbo大模型，专为视觉编程设计。该模型突破纯文本局限，具备原生多模态能力，可直接理解设计稿和网页截图。开发者上传草图或界面截图后，模型能自动生成可运行的前端代码。其视觉感知能力实现了从“读文档”到“看界面”的转变，并支持200k超长上下文窗口。

7.5k 3 minutes ago

Dreamina AI 重磅发布:Seedance2.0与 Seedream5.0Lite 正式上线

CapCut旗下AI创作平台Dreamina AI发布多模态视频模型Seedance2.0和图像生成模型Seedream5.0Lite。Seedance2.0支持图像、视频、文本输入，实现跨场景一致性，提升表现力与操控灵活性，满足专业视频创作需求。

16.4k 17 hours ago

Dreamina AI 重磅发布:Seedance2.0与 Seedream5.0Lite 正式上线

蚂蚁集团开启“抢人”模式：技术岗占8. 5 成，AI 浓度直接拉满！

蚂蚁集团2026年春招启动，技术岗占比85%，其中超七成聚焦人工智能领域，重点招聘大模型算法、多模态生成等方向，彰显全面向AI进发的战略布局。

12.4k 2 hours ago

蚂蚁集团启动2026春季校园招聘：技术岗占比达85%，超七成聚焦AI领域

蚂蚁集团启动2026年度春季校园招聘，技术类岗位占比达85%，其中超70%与人工智能直接相关，聚焦大模型算法、多模态生成、数据智能及AI安全等核心领域。工作地点覆盖全球多个城市。蚂蚁连续六年春招技术类岗位占比超80%，显示其持续加码AI。

13.5k 2 hours ago

AI Products

LTX-2

LTX-2 是代多模态 AI 视频生成模型。

视频生成

10.7k

Dreamomni2

统一的多模态AI，支持基于指令的图像编辑与生成，超越商业模型。

图片生成

8.9k

OmniGen2

一个强大的统一多模态模型，支持文本到图像生成及图像编辑。

图片生成

14.1k

Magma-8B

Magma-8B 是微软推出的一款多模态 AI 模型，能够处理图像和文本输入并生成文本输出。

AI模型

10.8k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

MCPollinations

MCPollinations是一个基于Model Context Protocol（MCP）的多模态AI服务，支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务，兼容多种AI模型，并支持图像保存和Base64编码返回。

javascript

9.6k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

智谱推出 GLM-5V-Turbo：为 AI 编程安上“眼睛”，设计稿秒变代码

Dreamina AI 重磅发布:Seedance2.0与 Seedream5.0Lite 正式上线

蚂蚁集团开启“抢人”模式：技术岗占8. 5 成，AI 浓度直接拉满！

蚂蚁集团启动2026春季校园招聘：技术岗占比达85%，超七成聚焦AI领域

AI Products

LTX-2

Dreamomni2

OmniGen2

Magma-8B

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-max

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Qwen3 VL 2B Instruct GGUF

Cosmos Reason1 7B

Meta Llama_Llama 4 Maverick 17B 128E Instruct

Magma 8B

Xgen Mm Phi3 Mini Instruct R V1

Uform3 Image Text Multilingual Base

Uform3 Image Text English Small

MCP

MCPollinations