火山引擎推出豆包视频生成模型1.0pro fast,生成速度提升3倍,价格降低72%,同时优化视频质量和场景适配性,为开发者提供高效低成本AI工具。
谷歌发布Veo 3.1视频生成模型,新增音频功能和精细化编辑能力,提升了视频的真实感与编辑控制粒度,同时优化了图像转视频质量。
谷歌升级视频生成模型Veo3.1,提升音频输出、编辑控制精度和图像转视频质量,能生成更真实视频并精准响应指令。新增功能支持在视频中添加对象并自动匹配画面风格,即将在Flow工具中推出移除对象功能,增强编辑灵活性。
YouTube明星MrBeast担忧AI技术将冲击创作者行业,认为当AI生成视频质量媲美真人作品时,可能威胁数百万创作者的生存,并称之为"可怕的时代"。他以其独特内容闻名,强调这一技术变革的潜在负面影响。
基于Tongyi Wan 2.2 Plus模型,可快速生成高质量AI视频,功能强大
免费AI工具,一键快速去除Sora 2视频水印,还原内容清晰度和质量
一键生成高质量视频,轻松实现创意。
AI驱动,将长视频转化为高质量病毒式片段,用于多平台分享
lightx2v
基于LoRA的4步推理高性能视频生成模型,从Wan2.2蒸馏模型中提取的LoRA权重,具备灵活部署、存储高效和出色生成质量的特点
rand0nmr
Wan2.2是基础视频模型的重大升级版本,引入了混合专家(MoE)架构、融入精心策划的美学数据、在更大数据上训练以提升复杂运动生成能力。该模型支持生成480P和720P分辨率的5秒视频,在视频生成质量和性能上有显著提升。
BarleyFarmer
natalie_wan_2.2-lora 是基于 AI Toolkit by Ostris 训练的 LoRA 模型,专门用于文本到视频转换任务,能够有效提升图像生成的质量和效果。
DFloat11
这是Wan-AI/Wan2.2-T2V-A14B模型的DFloat11无损压缩版本,通过先进的压缩技术将模型大小减少32%,同时保持位相同的输出质量,支持在单张24GB GPU上高效生成720P视频。
ZuluVision
MoviiGen 1.1是一款基于Wan2.1微调的电影级视频生成模型,在电影美学和视觉质量上表现卓越。
Vchitect
RepVideo是一个创新的视频生成模型,通过重新思考跨层表示来提升视频生成质量。
zai-org
视觉奖励视频模型(VisionReward-Video)是一种通过细粒度和多维度框架使视觉生成模型与人类偏好保持一致的通用策略,专门针对视频质量评估进行优化
TIGER-Lab
VideoScore-v1.1是基于Mantis-8B-Idefics2的视频质量评估模型,支持48帧推理,在文本到视频对齐子评分上表现优异。
NimVideo
基于千万级视频数据微调的图像到视频生成模型,生成质量媲美CogVideoX-5B的SBS级别水准
vdo
CogVideoX是源自清影的视频生成模型开源版本,5B版本具有更大的模型规模,能生成更高质量的视频内容。
q-future
Q-Align是一个多任务视觉评估模型,专注于图像质量评估(IQA)、美学评估(IAA)和视频质量评估(VQA),在ICML2024上发表。