TCAN es un nuevo marco de animación de retratos basado en modelos de difusión que mantiene la consistencia temporal y se generaliza bien a dominios no vistos. El marco utiliza módulos únicos, como la capa de adaptación apariencia-postura (capa APPA), la red de control temporal y el mapa de temperatura impulsado por la postura, para garantizar que los vídeos generados mantengan la apariencia de la imagen de origen, sigan la postura del vídeo de conducción y mantengan la coherencia del fondo.