O StructLDM é um modelo de difusão latente estruturado usado para aprender a gerar corpos humanos 3D a partir de imagens 2D. Ele é capaz de gerar corpos humanos diversos e consistentes em diferentes perspectivas, e suporta diferentes níveis de geração e edição controláveis, como geração composicional e edição de roupas local. O modelo realiza geração e edição independentes do tipo de roupa sem a necessidade de condições de tipo de roupa ou máscara. O projeto foi proposto por Tao Hu, Fangzhou Hong e Ziwei Liu do S-Lab da Universidade Tecnológica de Nanyang, e o artigo relacionado foi publicado no ECCV 2024.