ComfyUI,一家由开源项目发展而来的AI初创公司,于4月24日宣布完成3000万美元融资,估值达5亿美元。本轮由Craft Ventures领投,Pace Capital等跟投。其核心产品是基于节点的工作流平台,通过模块化框架解决主流扩散模型在生成图像、视频、音频时缺乏精确控制的问题,让用户能精细调节生成过程的每一步,与Midjourney等提示词驱动的“老虎机”式工具形成对比。
MiniMax推出MMX-CLI命令行工具,专为AI Agent设计,简化全模态模型调用流程。该工具解决了接口适配繁琐、代码冗余等问题,使Agent能像原生应用一样轻松调度多种AI能力。用户可在主流开发环境中一键调用编程、视频生成等功能,无需额外编写MCP Server或适配复杂接口。
通义实验室推出Wan2.7-Video视频创作工具,旨在解决AI视频创作中内容不专业和修改困难两大痛点。该工具支持文本、图像、视频和音频全模态输入,提供先进的模型以提升画面结构、剧情走向等内容的生成质量,增强创作自由度与编辑灵活性。
谷歌AI笔记工具NotebookLM推出“电影级视频概览”功能,用户上传文档后,AI可自动生成沉浸式电影风格视频,用于内容讲解。相比此前幻灯片形式,新功能深度整合谷歌先进AI模型,实现定制化视频生成。
免费AI视频制作与图片生成工具,文字/图片转视频,登录领免费积分
一站式工作台,可完成 AI 视频与图片的生成、编辑等操作
一站式AI视频与图像创作工作室,支持多种模型,可文本、图像生成音视频。
Nano Banana可在一个AI工作区编辑图片、生成视频,免费在线使用。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$2
$20
$6
$24
256
$8
$240
52
Hikarias
f3rnanda_wan22-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于图像到视频的生成任务。该模型使用Wan2.2-I2V-A14B作为基础模型,支持在多种AI工具中使用,包括ComfyUI、AUTOMATIC1111等主流平台。
lichorosario
piccoli_no_style-lora 是一个基于图像到视频技术的LoRA模型,使用AI Toolkit进行训练,主要用于图像生成任务,可与多种主流AI工具配合使用。
MCP Kling是首个且唯一完整的Kling AI MCP服务器,提供13种创意工具,支持视频生成、图像处理、唇形同步及虚拟试衣等功能,实现与Claude的无缝集成,适用于内容创作者和开发者。
Media Gen MCP 是一个严格遵循TypeScript和MCP规范的服务器,专注于使用OpenAI和Google的AI模型生成和编辑图像与视频。它提供了一系列工具,包括图像生成/编辑、视频创建/混音、文件获取与处理,并支持智能资源链接和内联输出,适用于各种MCP兼容客户端。
这是一个基于Runway API的MCP服务器项目,允许用户通过Claude Desktop调用Runway的各种AI生成功能,包括视频生成、图像生成、视频编辑和超分辨率等工具。
manim-mcp 是一个基于 manimgl 库的文本转视频动画生成工具,通过多智能体 LLM 流水线将自然语言描述转换为高质量数学动画,可作为 CLI 工具、AI 代理或 MCP 服务器与 Claude 等助手集成。
Tavus MCP服务器是一个基于Model Context Protocol的AI视频生成服务接口,提供完整的Tavus API v2功能,包括AI数字人创建、视频生成、对话式AI、唇形同步和语音合成等25个工具。
Luma AI MCP服务器是一个基于Model Context Protocol的服务,集成了Luma AI的Dream Machine API(v1),提供AI生成视频/图像的工具集,包括文本/图像转视频、视频扩展、音频添加、画质提升等功能,支持通过Claude Desktop直接调用。