Pippo Meta Reality Labs और कई विश्वविद्यालयों के सहयोग से विकसित एक जनरेटिव मॉडल है, जो एक साधारण तस्वीर से उच्च-रिज़ॉल्यूशन वाला बहु-दृष्टिकोण वीडियो बना सकता है। इस तकनीक का मुख्य लाभ यह है कि उच्च-गुणवत्ता वाले 1K रिज़ॉल्यूशन वीडियो बनाने के लिए अतिरिक्त इनपुट (जैसे पैरामीट्रिक मॉडल या कैमरा पैरामीटर) की आवश्यकता नहीं होती है। यह बहु-दृष्टिकोण डिफ्यूज़न ट्रांसफ़ॉर्मर आर्किटेक्चर पर आधारित है, जिसका वर्चुअल रियलिटी, फिल्म निर्माण आदि में व्यापक अनुप्रयोग है। Pippo का कोड ओपन-सोर्स है, लेकिन इसमें प्री-ट्रेन्ड वेट शामिल नहीं हैं, उपयोगकर्ताओं को स्वयं मॉडल को प्रशिक्षित करने की आवश्यकता है।