FIFO-डिफ़्यूज़न एक नवीन अनुमान तकनीक है जो पूर्व-प्रशिक्षित डिफ़्यूज़न मॉडल पर आधारित है, जिसका उपयोग पाठ-सशर्त वीडियो निर्माण के लिए किया जाता है। यह बिना प्रशिक्षण के असीमित लंबाई के वीडियो उत्पन्न करने में सक्षम है, क्रमिक रूप से विकर्ण शोर हटाने को निष्पादित करके, साथ ही कतार में लगातार फ्रेमों की श्रृंखला के धीरे-धीरे बढ़ते शोर स्तर को संसाधित करता है; यह विधि एक पूरी तरह से शोर रहित फ्रेम को शीर्ष से हटाती है, और साथ ही पूँछ में एक नया यादृच्छिक शोर फ्रेम जोड़ती है। इसके अलावा, प्रशिक्षण-अनुमान अंतर को कम करने के लिए संभावित विभाजन को शामिल किया गया है, और आगे के संदर्भों के लाभों का उपयोग करने के लिए आगे की ओर शोर हटाने का उपयोग किया गया है।