Inscription gratuite ! Sora, développé par l'université Tsinghua, est officiellement lancé ! Test de génération de vidéos Vidu, effets animés plus impressionnants que RunwayML

Pas de panique si vous payez pour Canling ! Un nouvel outil gratuit de génération de vidéos arrive. Le modèle de génération de vidéo Vidu de Shengshu Technology, très attendu, est désormais officiellement disponible dans le monde entier. Les utilisateurs peuvent s'inscrire et se connecter directement avec leur adresse e-mail, sans attente de validation. Après l'inscription, les utilisateurs reçoivent 80 points.

Ce générateur de vidéos IA est non seulement complet en termes de fonctionnalités, mais aussi facile à utiliser. Les utilisateurs peuvent facilement générer des vidéos HD de 4 ou 8 secondes, avec une résolution allant jusqu'à 1080p, répondant ainsi aux exigences de production vidéo les plus élevées.

Points forts de Vidu :

Génération rapide : Vidu a atteint la vitesse d'inférence la plus rapide du secteur, ne nécessitant que 30 secondes pour générer une vidéo de 4 secondes, soit deux fois plus vite que les meilleurs concurrents.
Haute fidélité : Que ce soit dans un style animé ou réaliste, Vidu génère des images réalistes et dynamiques, avec des mouvements de personnages naturels et fluides, même pour les mouvements importants.
Cohérence des personnages : Vidu prend en charge la cohérence des personnages. Après avoir téléchargé une image de personnage, vous pouvez spécifier que ce personnage effectue n'importe quelle action dans n'importe quel scénario, ce qui facilite la création de mèmes et d'autocollants.
Prise en charge de plusieurs styles : En plus du style réaliste, Vidu prend également en charge la génération de vidéos d'animation, avec un style rappelant celui de Miyazaki, riche en imagination.
Conversion directe de texte en vidéo : Grâce à une architecture sous-jacente innovante, les vidéos de Vidu donnent une impression de plan-séquence, la vidéo étant générée de manière continue du début à la fin, sans traces d'interpolation d'images.
Applications variées : De la création de jeux et la post-production cinématographique à l'éducation et à la formation, Vidu offre un support puissant.

Par rapport à Canling et Luma, Vidu se distingue principalement par ses deux fonctionnalités clés : la cohérence des personnages et le style animé.

Ici, AIbase utilise directement des illustrations 2D précédemment générées pour les tests. Ce type d'images est difficile à transformer en vidéo sur des plateformes comme Canling, où les visages ont tendance à être déformés.

L'interface utilisateur de Vidu est simple. Il suffit de télécharger une image et de sélectionner son utilisation. Ici, je n'ai pas l'intention de modifier l'arrière-plan de l'image originale, je choisis donc de l'utiliser comme image de départ, puis je clique sur « Générer ».

Capture d'écran du jeune garçon.jpg

Invite : Un jeune garçon saute joyeusement dans une flaque d'eau, la pluie devient de plus en plus forte.

Résultat du test :

On peut constater que Vidu est relativement meilleur que Canling pour la génération de vidéos d'animation, le mouvement des personnages est normal et les personnages ne sont pas déformés. À part la dernière image qui s'écarte légèrement de l'invite, la partie précédente est utilisable.

Pour vérifier la puissance de Vidu dans le domaine de l'animation, AIbase a également utilisé un « problème ancestral », un personnage d'animation de style chinois classique, pour effectuer un test. Hier, j'ai testé Canling et Luma avec cette image, les résultats n'étaient pas satisfaisants. Les personnages d'animation de style chinois classique sont toujours un défi pour les modèles de génération de vidéo.

Capture d'écran du bel homme au style chinois classique (1).jpg

Invite : Le garçon ajuste son chapeau et sourit soudainement.

Résultat du test :

On peut observer que le processus d'animation du personnage est globalement cohérent, et les mains et le visage ne sont pas trop déformés. Cependant, le personnage est légèrement moins beau. Comparé à Canling, Vidu gère relativement bien la transformation d'illustrations chinoises classiques en vidéo.

Vidu maîtrise également facilement les images de type modèle 3D :

Invite : Un adorable petit dragon mécanique joue avec des bulles.

De même pour les personnages d'animation au style dessiné à la main, Vidu n'a aucun problème :

Invite : Couple, baiser.

Test de cohérence des personnages :

Ici, AIbase choisit une image d'une belle femme en tulipe générée précédemment comme image de test :

1_1714287429137_ai2023_A_beautiful_Chinese_girl_with_a_sweet_smile_wearing_a_ye_6586d6d4-4754-4dac-b308-cd3b22b52bed.png

Résultat :

Invite : Une fille vêtue d'un hanfu de style Song se promène dans une ruelle de style Jiangnan.

AIbase a testé plusieurs vidéos. Pour l'instant, la cohérence des personnages de Vidu semble instable, les vidéos générées sont floues et les personnages sont parfois déformés.

Il est important de noter que Vidu, contrairement à Canling, ne prend pas en charge le traitement simultané de plusieurs tâches. Si la génération d'une vidéo n'est pas terminée, la génération d'une autre vidéo ne peut pas être lancée.

Capture d'écran QQ 20240730115425.jpg

Bien que la publicité officielle indique que Vidu ne nécessite que 30 secondes pour générer une vidéo de 4 secondes, les tests effectués par AIbase montrent qu'une vidéo prend au moins 2 ou 3 minutes à générer. Cependant, c'est toujours nettement plus rapide que Canling et Luma.

Vous pouvez essayer vous-même : Adresse du produit :https://top.aibase.com/tool/viduguanwang

Vidu a été développé par une équipe dirigée par le professeur Zhu Jun de l'université Tsinghua, basé sur l'architecture U-ViT entièrement développée en interne. Cette architecture est la première au monde à fusionner Diffusion et Transformer, et a été proposée avant l'architecture DiT utilisée par Sora.

L'innovation de Vidu réside dans sa capacité à réaliser une conversion directe et continue de texte en vidéo, évitant l'interpolation et le montage des traitements traditionnels en plusieurs étapes, ce qui rend les vidéos générées plus fluides et plus naturelles.

Shengshu Technology a été fondée en mars 2023. L'équipe de Shengshu Technology est composée de membres clés de l'Institut de recherche en intelligence artificielle de l'université Tsinghua. Ils possèdent une solide expérience dans le développement de grands modèles multimodaux universels. Depuis sa création en 2023, la société a reçu l'approbation d'institutions industrielles de renom, telles qu'Ant Group et Qiming Venture Partners, et a réalisé un financement de plusieurs centaines de millions de yuans, devenant ainsi l'équipe de création la plus valorisée dans le secteur des grands modèles multimodaux en Chine.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Inscription gratuite ! Sora, développé par l'université Tsinghua, est officiellement lancé ! Test de génération de vidéos Vidu, effets animés plus impressionnants que RunwayML

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Amazon Web Services prévoit un investissement supplémentaire de 5 milliards de dollars en Corée du Sud pour développer des centres de données axés sur l'intelligence artificielle

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

Journal de l'IA : Douyin lance un système de doublage automatique pour plusieurs personnes ; Adobe Firefly Image 5 se voit fortement amélioré ; Soul présente le modèle vocal SoulX-Podcast

Qualcomm entre dans le secteur des centres de données ! Présentation des puces AI200/AI250 visant NVIDIA, la valeur actions a bondi de 20 % en une seule journée

Magic Leap annonce un nouveau partenariat avec Google pour développer un prototype de lunettes AR de prochaine génération

Tsinghua et Kuaishou lancent un nouveau modèle de diffusion SVG, l'efficacité d'entraînement augmente de 6200%

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liu Li, vice-président de Douyin : La technologie d'IA aide à lutter contre la désinformation et à créer un environnement fiable sur la plateforme

Le vice-président de Douyin, Li Liang, affirme que l'IA rend la diffusion de fausses informations plus facile, et la plateforme utilise activement des agents intelligents pour lutter contre les rumeurs