MoMask é um modelo de geração de movimento corporal 3D baseado em texto, que alcança desempenho excepcional por meio de quantização hierárquica e estrutura Transformer. Apresenta desempenho superior em tarefas de geração de movimento a partir de texto e reparação temporal. Experimentos demonstram sua posição de liderança na modelagem de movimento corporal 3D.