X-Dyna es una innovadora técnica de generación de animación de imágenes humanas de muestra cero que genera efectos dinámicos realistas y expresivos mediante la transferencia de expresiones faciales y movimientos corporales de un vídeo de conducción a una sola imagen humana. Esta tecnología, basada en modelos de difusión, integra eficazmente el contexto de apariencia de referencia en la atención espacial del modelo de difusión a través del módulo Dynamics-Adapter, al tiempo que conserva la capacidad del módulo de movimiento para sintetizar detalles dinámicos complejos y fluidos. No solo permite el control de la postura corporal, sino que también puede capturar expresiones faciales independientes de la identidad mediante el módulo de control local, logrando una transmisión precisa de las expresiones. X-Dyna se entrena en datos mixtos de varios vídeos de humanos y escenas, pudiendo aprender el movimiento físico del cuerpo humano y la dinámica de escenas naturales, generando animaciones de alta fidelidad y expresividad.