最好的图生视频大模型 AI工具模型_精选图生视频大模型资讯

AI资讯

亚马逊发布新款 Nova 2 模型家族，技术性能全面领先

亚马逊云科技在2025年re:Invent大会上推出Nova2模型系列，包括四款新模型，在推理、多模态、对话AI、代码生成和Agent任务方面具备领先性价比。其中，Nova2Lite专为日常负载设计，支持文本、图像和视频输入并生成文本输出，是一款快速经济的推理模型。

6.4k 10 小时前

AI日报：可灵AI全量上线O1视频大模型；千问APP接入万相Wan2.5；PixVerse V5.5发布

可灵AI公司宣布其O1视频大模型已全量上线，采用统一多模态架构，支持文字、图像等多种输入方式，实现一句话生成视频。

21.4k 1 小时前

AI日报：可灵AI全量上线O1视频大模型；千问APP接入万相Wan2.5；PixVerse V5.5发布

可灵AI今日全量上线O1 视频大模型：统一多模态架构支持一句话生成视频

可灵AI公司宣布，其O1视频大模型已全量开放。该模型采用多模态视觉语言统一架构，支持文字、图像、视频融合输入，并引入思维链推理，号称全球首个统一多模态视频大模型。它可一次性完成文生视频、图生视频、局部编辑及镜头延展等任务，无需分步操作。

12.1k 15 小时前

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

昆仑元AI在2025世界计算大会上发布全模态融合模型BaiZe-Omni-14b-a2b，基于昇腾平台，具备文本、音频、图像和视频的理解与生成能力。采用模态解耦编码、统一跨模态融合和双分支功能设计等创新架构，推动多模态应用发展。模型流程包括输入处理、模态适配、融合、核心功能和输出解码。

11.2k 11 小时前

AI产品

Qwen2.5-VL

Qwen2.5-VL 是一款强大的视觉语言模型，能够理解图像和视频内容并生成相应文本。

AI模型

16.9k

Story Flicks

使用AI大模型一键生成高清故事短视频，支持多种语言模型和图像生成技术。

视频生成

22.4k

Ruyi

图生视频大模型，专为动漫和游戏场景设计

视频生成

11.5k

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

o3-mini

Openai

$7.7

输入tokens/百万

$30.8

输出tokens/百万

200

上下文长度

GPT-5 Codex

Openai

输入tokens/百万

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-coder-plus

Alibaba

输入tokens/百万

$16

输出tokens/百万

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-max

Alibaba

输入tokens/百万

$24

输出tokens/百万

256

上下文长度

Qianfan-Lightning

Baidu

输入tokens/百万

输出tokens/百万

128

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

亚马逊发布新款 Nova 2 模型家族，技术性能全面领先

AI日报：可灵AI全量上线O1视频大模型；千问APP接入万相Wan2.5；PixVerse V5.5发布

可灵AI今日全量上线O1 视频大模型：统一多模态架构支持一句话生成视频

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

AI产品

Qwen2.5-VL

Story Flicks

Ruyi

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Text2Motion

Wan2.1 T2V 14B

Ola 7b

AuroraCap 7B VID Xtuner

VideoLLaMA2 8x7B

Video LLaVA 7B Hf

AI资讯

亚马逊发布新款 Nova 2 模型家族，技术性能全面领先

AI日报：可灵AI全量上线O1视频大模型；千问APP接入万相Wan2.5；PixVerse V5.5发布

可灵AI今日全量上线O1 视频大模型：统一多模态架构 支持一句话生成视频

​昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展

AI产品

Qwen2.5-VL

Story Flicks

Ruyi

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Text2Motion

Wan2.1 T2V 14B

Ola 7b

AuroraCap 7B VID Xtuner

VideoLLaMA2 8x7B

Video LLaVA 7B Hf

可灵AI今日全量上线O1 视频大模型：统一多模态架构支持一句话生成视频

昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b，推动 AI 技术新进展