Pas de panique si vous payez pour Canling ! Un nouvel outil gratuit de génération de vidéos arrive. Le modèle de génération de vidéo Vidu de Shengshu Technology, très attendu, est désormais officiellement disponible dans le monde entier. Les utilisateurs peuvent s'inscrire et se connecter directement avec leur adresse e-mail, sans attente de validation. Après l'inscription, les utilisateurs reçoivent 80 points.

Ce générateur de vidéos IA est non seulement complet en termes de fonctionnalités, mais aussi facile à utiliser. Les utilisateurs peuvent facilement générer des vidéos HD de 4 ou 8 secondes, avec une résolution allant jusqu'à 1080p, répondant ainsi aux exigences de production vidéo les plus élevées.

Points forts de Vidu :

  • Génération rapide : Vidu a atteint la vitesse d'inférence la plus rapide du secteur, ne nécessitant que 30 secondes pour générer une vidéo de 4 secondes, soit deux fois plus vite que les meilleurs concurrents.

  • Haute fidélité : Que ce soit dans un style animé ou réaliste, Vidu génère des images réalistes et dynamiques, avec des mouvements de personnages naturels et fluides, même pour les mouvements importants.

  • Cohérence des personnages : Vidu prend en charge la cohérence des personnages. Après avoir téléchargé une image de personnage, vous pouvez spécifier que ce personnage effectue n'importe quelle action dans n'importe quel scénario, ce qui facilite la création de mèmes et d'autocollants.

  • Prise en charge de plusieurs styles : En plus du style réaliste, Vidu prend également en charge la génération de vidéos d'animation, avec un style rappelant celui de Miyazaki, riche en imagination.

  • Conversion directe de texte en vidéo : Grâce à une architecture sous-jacente innovante, les vidéos de Vidu donnent une impression de plan-séquence, la vidéo étant générée de manière continue du début à la fin, sans traces d'interpolation d'images.

  • Applications variées : De la création de jeux et la post-production cinématographique à l'éducation et à la formation, Vidu offre un support puissant.

Par rapport à Canling et Luma, Vidu se distingue principalement par ses deux fonctionnalités clés : la cohérence des personnages et le style animé.

Ici, AIbase utilise directement des illustrations 2D précédemment générées pour les tests. Ce type d'images est difficile à transformer en vidéo sur des plateformes comme Canling, où les visages ont tendance à être déformés.

L'interface utilisateur de Vidu est simple. Il suffit de télécharger une image et de sélectionner son utilisation. Ici, je n'ai pas l'intention de modifier l'arrière-plan de l'image originale, je choisis donc de l'utiliser comme image de départ, puis je clique sur « Générer ».

Capture d'écran du jeune garçon.jpg

Invite : Un jeune garçon saute joyeusement dans une flaque d'eau, la pluie devient de plus en plus forte.

Résultat du test :

On peut constater que Vidu est relativement meilleur que Canling pour la génération de vidéos d'animation, le mouvement des personnages est normal et les personnages ne sont pas déformés. À part la dernière image qui s'écarte légèrement de l'invite, la partie précédente est utilisable.

Pour vérifier la puissance de Vidu dans le domaine de l'animation, AIbase a également utilisé un « problème ancestral », un personnage d'animation de style chinois classique, pour effectuer un test. Hier, j'ai testé Canling et Luma avec cette image, les résultats n'étaient pas satisfaisants. Les personnages d'animation de style chinois classique sont toujours un défi pour les modèles de génération de vidéo.

Capture d'écran du bel homme au style chinois classique (1).jpg

Invite : Le garçon ajuste son chapeau et sourit soudainement.

Résultat du test :

On peut observer que le processus d'animation du personnage est globalement cohérent, et les mains et le visage ne sont pas trop déformés. Cependant, le personnage est légèrement moins beau. Comparé à Canling, Vidu gère relativement bien la transformation d'illustrations chinoises classiques en vidéo.

Vidu maîtrise également facilement les images de type modèle 3D :

Invite : Un adorable petit dragon mécanique joue avec des bulles.

De même pour les personnages d'animation au style dessiné à la main, Vidu n'a aucun problème :

Invite : Couple, baiser.

Test de cohérence des personnages :

Ici, AIbase choisit une image d'une belle femme en tulipe générée précédemment comme image de test :

1_1714287429137_ai2023_A_beautiful_Chinese_girl_with_a_sweet_smile_wearing_a_ye_6586d6d4-4754-4dac-b308-cd3b22b52bed.png

Résultat :

Invite : Une fille vêtue d'un hanfu de style Song se promène dans une ruelle de style Jiangnan.

AIbase a testé plusieurs vidéos. Pour l'instant, la cohérence des personnages de Vidu semble instable, les vidéos générées sont floues et les personnages sont parfois déformés.

Il est important de noter que Vidu, contrairement à Canling, ne prend pas en charge le traitement simultané de plusieurs tâches. Si la génération d'une vidéo n'est pas terminée, la génération d'une autre vidéo ne peut pas être lancée.

Capture d'écran QQ 20240730115425.jpg

Bien que la publicité officielle indique que Vidu ne nécessite que 30 secondes pour générer une vidéo de 4 secondes, les tests effectués par AIbase montrent qu'une vidéo prend au moins 2 ou 3 minutes à générer. Cependant, c'est toujours nettement plus rapide que Canling et Luma.

Vous pouvez essayer vous-même : Adresse du produit :https://top.aibase.com/tool/viduguanwang

Vidu a été développé par une équipe dirigée par le professeur Zhu Jun de l'université Tsinghua, basé sur l'architecture U-ViT entièrement développée en interne. Cette architecture est la première au monde à fusionner Diffusion et Transformer, et a été proposée avant l'architecture DiT utilisée par Sora.

L'innovation de Vidu réside dans sa capacité à réaliser une conversion directe et continue de texte en vidéo, évitant l'interpolation et le montage des traitements traditionnels en plusieurs étapes, ce qui rend les vidéos générées plus fluides et plus naturelles.

Shengshu Technology a été fondée en mars 2023. L'équipe de Shengshu Technology est composée de membres clés de l'Institut de recherche en intelligence artificielle de l'université Tsinghua. Ils possèdent une solide expérience dans le développement de grands modèles multimodaux universels. Depuis sa création en 2023, la société a reçu l'approbation d'institutions industrielles de renom, telles qu'Ant Group et Qiming Venture Partners, et a réalisé un financement de plusieurs centaines de millions de yuans, devenant ainsi l'équipe de création la plus valorisée dans le secteur des grands modèles multimodaux en Chine.