FlowVid est un modèle de synthèse vidéo guidé par le flux optique qui assure la cohérence temporelle entre les images d'une vidéo en exploitant les informations spatiales et temporelles du flux optique. Il s'intègre parfaitement aux modèles de synthèse d'images existants pour permettre diverses modifications, notamment la stylisation, l'échange d'objets et l'édition locale. FlowVid est rapide : une vidéo de 4 secondes, 30 FPS et 512x512 pixels est générée en 1,5 minute, soit 3,1 fois plus vite que CoDeF, 7,2 fois plus vite que Rerender et 10,5 fois plus vite que TokenFlow. Selon les évaluations des utilisateurs, la qualité de FlowVid atteint un score de 45,7 %, nettement supérieur à celui de CoDeF (3,5 %), Rerender (10,2 %) et TokenFlow (40,4 %).