Le nouveau framework de génération de vidéos basées sur l'audio, EMO, développé par Alibaba, permet de générer des vidéos de n'importe quelle durée à partir d'une entrée audio. Développé par l'équipe de l'Institut de calcul intelligent d'Alibaba, ce framework représente une technologie de génération vidéo expressive. EMO marque une amélioration significative par rapport aux méthodes précédentes de génération de vidéos par IA, bien qu'il présente l'inconvénient d'être relativement long. L'équipe, incluant Liefeng Bo et d'autres, détaille l'approche technique et les caractéristiques d'EMO dans un article de recherche. Cette nouvelle technologie représente une avancée majeure dans le domaine de l'IA, suscitant un optimisme quant aux développements futurs.
Alibaba lance EMO, un générateur de vidéos IA basé sur l'audio

量子位
Cet article provient d'AIbase Daily
Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.