Stable Video Diffusion (SVD) 1.1 画像から動画生成は、静止画を条件フレームとして用いて、対応する動画を生成する拡散モデルです。このモデルは潜在拡散モデルであり、画像から短い動画クリップを生成するように訓練されています。1024x576ピクセルの解像度で、25フレームの動画を生成するように訓練されており、その訓練は同サイズのコンテキストフレームに基づいており、SVD Image-to-Video [25 frames] から微調整されています。微調整時には、出力の一貫性を向上させるため、6FPSとモーションバケットID 127の条件を固定し、ハイパーパラメータの調整は行いませんでした。