Runway发布最新视频生成模型Gen-4.5,专为创作者、影视制作人和企业用户设计,即将向所有订阅层级开放。该模型在文本转视频基准测试中以1247分领先,超越谷歌Veo3等竞品,成为当前最强文生视频模型。其卓越性能得益于先进的NVIDIA Hopper与Blackwell GPU平台支持。
Runway公司最新模型Gen-4.5在第三方盲测平台Video Arena中击败谷歌Veo3与OpenAI Sora2Pro,成为首个由小团队登顶的大模型。其CEO强调“专注研究、快速迭代”的可行性,并指出“一百人对万亿,靠的不是预算,而是密度”。该模型采用自研时空混合Transformer架构,展现了小团队在AI视频生成领域的突破。
昆仑元AI在2025世界计算大会上发布全模态融合模型BaiZe-Omni-14b-a2b,基于昇腾平台,具备文本、音频、图像和视频的理解与生成能力。采用模态解耦编码、统一跨模态融合和双分支功能设计等创新架构,推动多模态应用发展。模型流程包括输入处理、模态适配、融合、核心功能和输出解码。
OpenAI为付费用户推出购物研究功能,通过实时抓取电商、论坛、视频等数据,自动过滤虚假评价,生成无广告的购物报告。报告包含性价比排行、优缺点对比和多平台比价,帮助用户高效决策。
Sora 3是强大的AI视频生成平台,能从文本、图像快速生成高质量视频。
专业AI视频生成平台,从文字和图片创建视频,可对输入视频广泛编辑。
Gen-4.5是先进AI视频生成平台,可将文本和图像转为专业视频
Aivvid AI是一体化AI创意平台,可生成视频、图像、音乐和配音。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
$2
$20
Baidu
128
$8
$240
52
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
Hikarias
f3rnanda_wan22-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于图像到视频的生成任务。该模型使用Wan2.2-I2V-A14B作为基础模型,支持在多种AI工具中使用,包括ComfyUI、AUTOMATIC1111等主流平台。
THUDM
CogVideoX 是一个开源视频生成模型,支持从图像生成视频,类似于清影平台。
zai-org
CogVideoX-5B-I2V 是清英平台开源的高质量图像转视频生成模型,能够根据输入的静态图像生成6秒时长的动态视频,分辨率为720×480,帧率为8fps。
Video Editor MCP是一个视频编辑服务器,提供视频上传、搜索、生成和编辑功能,支持通过LLM和Video Jungle平台进行操作。
百度智能云曦灵数字人开放平台提供基于MCP协议的13个API接口,支持数字人视频生成、音色克隆等功能,兼容多种MCP代理助手快速接入。
TwelveLabs MCP服务是一个基于TwelveLabs API的视频分析平台,提供索引管理、视频分析、文本搜索和内容生成功能。
一个集成Scenext AI视频生成平台的MCP服务器,用于根据题目生成教学讲解视频。