Pippo es un modelo generativo desarrollado en colaboración entre Meta Reality Labs y varias universidades. Es capaz de generar videos de alta resolución con múltiples perspectivas a partir de una sola fotografía común. La principal ventaja de esta tecnología es que genera videos de alta calidad (1K de resolución) sin necesidad de información adicional (como modelos paramétricos o parámetros de cámara). Se basa en una arquitectura de transformador de difusión multiperspectiva y tiene un amplio rango de aplicaciones, como la realidad virtual y la producción cinematográfica. El código de Pippo es de código abierto, pero no incluye pesos preentrenados; los usuarios deben entrenar el modelo por sí mismos.