Meta a publié le modèle vidéo IA V-JEPA, tandis que Yann LeCun doute que le modèle Sora comprenne véritablement le monde physique. V-JEPA est un modèle non génératif qui perçoit le monde de la même manière qu'un humain et excelle dans les applications multitâches. Utilisant l'apprentissage autosupervisé, son efficacité en matière d'annotation est supérieure à celle d'autres modèles.