VFusion3D ist ein skalierbares 3D-Generierungsmodell, das auf einem vortrainierten Video-Diffusionsmodell basiert. Es löst das Problem der schwierigen und limitierten Beschaffung von 3D-Daten, indem es durch Feinabstimmung eines Video-Diffusionsmodells groß angelegte synthetische Multi-View-Datensätze generiert und so ein Feedforward-3D-Generierungsmodell trainiert, das 3D-Assets schnell aus einem einzelnen Bild generieren kann. Das Modell zeigt in Nutzerstudien hervorragende Ergebnisse, wobei die Nutzer in über 90% der Fälle die von VFusion3D generierten Ergebnisse bevorzugen.