发现与 Stable Video Diffusion 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Stable Diffusion 的网页版界面
适用于GPU云端和本地环境的ComfyUI Docker镜像。包含AI-Dock基础镜像,用于身份验证和提升用户体验。
只需一张照片,即可实时换脸,一键生成深度伪造视频
开源免费的替代方案,可替代OpenAI、Claude等。支持本地自托管,无需GPU,可在家用硬件上运行。可直接替换OpenAI,支持gguf、transformers、diffusers等多种模型架构。功能包括:文本、音频、视频、图像生成,语音克隆,分布式和P2P推理。
适用于直播和流媒体的跨平台、可定制机器学习解决方案
Diffusers:一个基于PyTorch和FLAX的库,包含最先进的扩散模型,用于图像、视频和音频生成。
Invoke 是一个领先的 Stable Diffusion 模型创意引擎,赋能专业人士、艺术家和爱好者使用最新的 AI 技术生成和创作视觉媒体。该方案提供业界领先的 WebUI,并作为多个商业产品的基础。
这款图像修复工具由先进的AI模型驱动。您可以轻松移除照片中任何不需要的物体、瑕疵或人物,或者使用稳定扩散模型擦除并替换照片中的任何内容。
落地SAM:融合DINO、Segment Anything、Stable Diffusion和Recognize Anything,实现自动检测、分割和生成任何物体
稳定的扩散模型 WebUI 协作平台
视频、图片和GIF的超分辨率放大(超清重建)以及视频帧率插值。技术基于Waifu2x、Real-ESRGAN、Real-CUGAN、RTX Video Super Resolution VSR、SRMD、RealSR、Anime4K、RIFE、IFRNet、CAIN、DAIN和ACNet等算法。
只需一键,AI就能自动完成Netflix级别的视频字幕制作,包括分割、翻译、校对和配音等所有步骤,就像一个全自动的字幕团队。
使用CVAT,业界领先的机器学习数据引擎,提升标注效率。无论团队规模大小,无论数据量多少,都能信赖CVAT。
一个基于机器学习的视频超分辨率和帧插值框架,创作于2018年黑客谷II活动期间。
把视频从一种语言翻译成另一种语言,并配上配音。这个过程包括语音识别转录、语音合成和字幕翻译。
Diffusion Bee 是在你的 M1 Mac 上运行 Stable Diffusion 最简单的方法。它提供一键安装程序,无需任何依赖项或技术知识。
关于扩散模型的资源和论文集
文本和图像到视频生成:CogVideoX(2024)和CogVideo(ICLR 2023)
AI绘画资源大全:涵盖国内外可用平台、使用方法详解、参数设置指南、部署教程以及行业最新资讯,包含Stable Diffusion、AnimateDiff、Stable Cascade、Stable SDXL Turbo等热门工具的完整资料。
Stable Baselines 的 PyTorch 版本,提供了可靠的强化学习算法实现。