アリババは、表情豊かな顔の表情と頭部の姿勢を持つ音声肖像動画を生成できる肖像動画生成フレームワークEMOを発表しました。EMO(Emote Portrait Alive)は、DreamTalk、Wav2Lip、SadTalkerなどの既存の先進的な手法よりも優れています。EMOモデルは犯罪ツールとして悪用される可能性があります。
表情と動作を生成する拡散確率モデル