Wav2Lip es un proyecto de código abierto que utiliza técnicas de aprendizaje profundo para sincronizar con alta precisión los labios de una persona en un video con cualquier audio de destino. El proyecto proporciona código de entrenamiento completo, código de inferencia y modelos preentrenados, compatibles con cualquier identidad, voz e idioma, incluyendo rostros CGI y voces sintéticas. La tecnología detrás de Wav2Lip se basa en el artículo 'A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild', publicado en ACM Multimedia 2020. El proyecto también ofrece una demostración interactiva y un cuaderno de Google Colab para facilitar el inicio rápido de los usuarios. Además, proporciona nuevos puntos de referencia y métricas de evaluación fiables, junto con instrucciones sobre cómo calcular dichas métricas en el artículo.