InstantID é uma solução baseada em um poderoso modelo de difusão que permite a personalização de imagens usando apenas uma imagem facial, em diversos estilos, garantindo alta fidelidade. Desenvolvemos um inovador IdentityNet, que integra imagens faciais e de pontos de referência com prompts de texto, aplicando fortes condições semânticas e fracas condições espaciais para guiar a geração de imagens. O InstantID demonstra excelente desempenho em aplicações práticas e integra-se perfeitamente a modelos de difusão populares de texto para imagem (como SD1.5 e SDXL), funcionando como um plugin adaptável. Nosso código e checkpoints pré-treinados estarão disponíveis neste URL.