最好的图像到视频 AI工具模型_精选图像到视频资讯

AI资讯

ElevenLabs炸裂级更新：图像、视频、音乐一站式生成

多模态AI公司ElevenLabs推出集成式内容创作平台，融合图像生成、视频制作、声音合成、音乐创作和音效设计功能，实现从剧本到成品视频的一站式闭环生产，帮助创作者和营销人员告别多平台切换，高效完成商业视频制作。

Grok支持纯文本生成视频了一句话即可生成带音效视频

xAI旗下Grok Imagine实现纯文本生成短视频，用户输入描述即可在17秒内获得带音效、动态镜头和专业画质的6-15秒视频，无需图像输入或编辑基础。这一升级打通“想法到成片”环节，以高速优势挑战OpenAI Sora和Google Veo的市场地位。

19.5k 1 小时前

Adobe Firefly Image 5重磅升级：400万像素原生生成、AI音轨+自定义模型，创作者迎来“全栈式”AI创作时代

Adobe发布专业级AI图像生成模型Firefly Image5，实现从“够用”到专业级的质变。新功能包括原生400万像素输出、分层提示编辑、自定义艺术风格模型及AI语音配乐生成，打通图像、视频、音频的AI创作闭环，重新定义创意工作流。

11.9k 昨天

Adobe Firefly Image 5重磅升级：400万像素原生生成、AI音轨+自定义模型，创作者迎来“全栈式”AI创作时代

NotebookLM集成Nano Banana，可用于视频生成配图

谷歌NotebookLM集成Nano Banana图像生成模型，实现从文本处理到多模态创作的升级，用户可将笔记转化为视频，提升学习与创作效率。本周起向Pro用户逐步推送，预计数周内全面覆盖。

11.2k 昨天

AI产品

Wan 2.1 AI

Wan 2.1 AI 是一款将文本和图像转化为高质量视频的先进 AI 视频生成模型。

视频生成

12.1k

Wan2GP

Wan2GP 是一个优化后的开源视频生成模型，专为低配置 GPU 用户设计，支持多种视频生成任务。

视频生成

18.6k

Wan2.1-T2V-14B

Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型，支持多种视频生成任务。

视频生成

12.4k

Magic 1-For-1

Magic 1-For-1 是一个高效的图像到视频生成模型，可在一分钟内生成一分钟的视频。

视频生成

10.5k

模型

GPT-4.1 mini

Openai

$2.8

输入tokens/百万

$11.2

输出tokens/百万

上下文长度

Gemini 2.0 Flash-Lite

Google

$0.49

输入tokens/百万

$2.1

输出tokens/百万

上下文长度

Grok 4 Fast

Xai

$1.4

输入tokens/百万

$3.5

输出tokens/百万

上下文长度

Claude 3 Opus

Anthropic

$105

输入tokens/百万

$525

输出tokens/百万

200

上下文长度

Gemini 2.0 Flash

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

Claude Haiku 4.5

Anthropic

输入tokens/百万

$35

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash

Google

$2.1

输入tokens/百万

$17.5

输出tokens/百万

上下文长度

Claude Sonnet 4.5

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Claude 3 Sonnet

Anthropic

$21

输入tokens/百万

$105

输出tokens/百万

200

上下文长度

Gemini 2.5 Flash-Lite

Google

$0.7

输入tokens/百万

$2.8

输出tokens/百万

上下文长度

qwen-image-plus

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-vl-plus

Alibaba

输入tokens/百万

$10

输出tokens/百万

256

上下文长度

wan2.5-i2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-vl-235b-a22b-thinking

Alibaba

输入tokens/百万

$20

输出tokens/百万

上下文长度

qwen-image-edit

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

输入tokens/百万

$240

输出tokens/百万

上下文长度

Doubao-Seed-Translation

Bytedance

$1.2

输入tokens/百万

$3.6

输出tokens/百万

上下文长度

wan2.5-t2i-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-t2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

wan2.5-i2v-preview

Alibaba

输入tokens/百万

输出tokens/百万

上下文长度

MCP

Comfyui_storydiffusion

ComfyUI_StoryDiffusion是一个基于ComfyUI的插件，支持StoryDiffusion和MS-Diffusion模型，用于生成连贯的长序列图像和视频。项目支持多种功能，包括双角色同框、ControlNet控制、Lora加速、文本到图像和图像到图像转换等。

智启未来，您的人工智能解决方案智库

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

ElevenLabs炸裂级更新：图像、视频、音乐一站式生成

Grok支持纯文本生成视频了 一句话即可生成带音效视频

Adobe Firefly Image 5重磅升级：400万像素原生生成、AI音轨+自定义模型，创作者迎来“全栈式”AI创作时代

NotebookLM集成Nano Banana，可用于视频生成配图

AI产品

Wan 2.1 AI

Wan2GP

Wan2.1-T2V-14B

Magic 1-For-1

模型

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

wan2.5-i2i-preview

qwen3-vl-235b-a22b-thinking

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

wan2.5-t2i-preview

wan2.5-t2v-preview

wan2.5-i2v-preview

SteadyDancer 14B

HunyuanVideo 1.5

CausalWan2.2 I2V A14B Preview Diffusers

UME R1 7B GGUF

LongCat Video

Qwen3 VL 32B Thinking AWQ

Joywan Lora

Wan21_diddly_01 Lora

Natalie_wan_2.2 Lora

My_first_lora_v1 Lora

B4ddie4i Lora

Animat3d_style_wan Lora

Alexis_Noir_Wan2.2 Lora

My_first_lora_v2 Lora

Bl00dsqibWan22 Lora

Alita_lora Lora

Fraemwerk_t2v_v1 Lora

My_first_lora_v1 Lora

Testing Lora

Third_lora Lora

MCP

Comfyui_storydiffusion

Grok支持纯文本生成视频了一句话即可生成带音效视频