TCAN est un nouveau framework d'animation de portrait basé sur les modèles de diffusion, capable de maintenir une cohérence temporelle et de bien généraliser à des domaines inconnus. Ce framework utilise des modules uniques, tels qu'une couche d'adaptation apparence-pose (couche APPA), un réseau de contrôle temporel et une carte de température pilotée par la pose, pour garantir que la vidéo générée conserve l'apparence de l'image source, suit la pose de la vidéo pilote, tout en maintenant la cohérence de l'arrière-plan.