火山引擎发布Seedance 2.0系列API服务,提供先进的视频生成技术,支持文本、图片、音频和视频四种输入方式,具备多模态内容创建与编辑能力,适用于复杂互动和动态场景。该服务旨在帮助企业及个人用户优化工作流程,探索创新应用,同时确保AI视频创作的合规性与安全性。
火山引擎推出Seedance 2.0系列API服务,作为全球领先的视频生成模型,面向企业和个人开放。该模型支持文字、图片、音频和视频混合输入,具备多模态内容参考与编辑能力,旨在通过高性能视频生成重塑行业工作流,探索新应用场景。
MiniMax推出MMX-CLI命令行工具,专为AI Agent设计,简化全模态模型调用流程。该工具解决了接口适配繁琐、代码冗余等问题,使Agent能像原生应用一样轻松调度多种AI能力。用户可在主流开发环境中一键调用编程、视频生成等功能,无需额外编写MCP Server或适配复杂接口。
OpenAI宣布将关闭视频生成模型Sora,其应用将于4月下线,API服务9月停止。该模型曾因效果逼真吸引百万用户,但热度迅速下滑,日活降至50万后持续低迷。高昂运营成本与商业化困难是关闭主因,Sora成为公司战略调整的牺牲品。
一个从URL、YouTube视频或文本提示生成交互式思维导图的Web应用。
Edits 是一款由 Instagram 推出的免费视频编辑应用,专为创作者设计,支持高清导出和多平台分享,帮助用户轻松创作高质量视频。
一个基于AI的应用程序,可以在几秒钟内生成博客文章、YouTube视频和播客。
创意强大的视频编辑应用
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$2
$20
$6
$24
256
Baidu
128
$8
$240
52
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
bigdoinks420518
这是一个使用AI Toolkit by Ostris训练的LoRA模型,基于Wan-AI/Wan2.1-T2V-14B-Diffusers基础模型,主要用于文本到视频生成,在图像生成领域有独特应用价值。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
Lightricks
基于DiT架构的实时高质量视频生成模型,支持文本转视频及图像转视频两种应用场景
该项目提供了一系列社区贡献的OpenMCP服务,支持与任何MCP兼容的LLM应用程序或框架协同工作。包含快速入门示例、GitHub PR审查工具和文本转播客视频生成工具。