Midjourney a officiellement lancé son premier modèle de génération vidéo V1, marquant un nouveau jalon dans l'essor de cette entreprise célèbre pour sa génération d'images vers le domaine de la création multimédia. En tant que plateforme d'intelligence artificielle leader dans la création artistique, le lancement de ce modèle a suscité une grande attention chez les créateurs de digital art et de vidéos. Cet article, rédigé par la rédaction d'Aibase, compile les informations les plus récentes pour vous offrir une analyse détaillée des principales caractéristiques et du potentiel futur du modèle V1.

image.png

De statique à dynamique : Les fonctionnalités centrales de V1

Le modèle de génération vidéo Midjourney V1 met en avant la fonctionnalité Image-to-Video (I2V). Les utilisateurs peuvent transformer une image statique en une vidéo animée via le bouton "Animate" sur l'interface web. La durée par défaut est de 5 secondes, avec chaque génération proposant quatre fragments vidéo ayant des styles différents, permettant aux utilisateurs de choisir celui qui correspond le mieux à leurs besoins. De plus, la durée de la vidéo peut être prolongée de 4 secondes à la fois, jusqu'à un maximum de 20 secondes.

Deux modes de mouvement sont disponibles :

Mode de faible dynamisme : Idéal pour les scènes environnementales où la caméra reste relativement stable et où le sujet bouge lentement ou intentionnellement, créant une atmosphère immersive.

Mode de haute dynamique : Conçu pour les scènes avec un rythme plus marqué, apportant des effets visuels plus impactants.

Les utilisateurs peuvent opter pour le mode d'animation automatique, où l’IA décide du mouvement, ou personnaliser manuellement via des prompts textuels pour ajuster davantage la direction créative de la vidéo. Midjourney souligne que V1 hérite de la forte cohérence de son modèle d'image V6.1, garantissant une qualité exceptionnelle en termes de détails et de style dans les vidéos générées.

Prix abordables, accessibles à tous les créateurs

Midjourney vise à offrir une solution accessible à bas coût. Sa stratégie de tarification pour le modèle V1 suit son style habituel de proximité avec les utilisateurs. Le plan Basic à seulement 10 USD/mois permet d’utiliser la fonction de génération vidéo, tandis que les plans Pro (60 USD/mois) et Mega (120 USD/mois) offrent la possibilité de générer des vidéos sans limite dans le mode "Relax". Toutefois, le coût de calcul pour la génération vidéo est environ huit fois supérieur à celui des images, nécessitant aux utilisateurs une planification adéquate de leur quota mensuel.

En parallèle, Midjourney ne propose pas encore de fonctionnalités avancées comme l'amélioration de la résolution vidéo ou la génération audio. L'actuelle sortie vidéo est en 480p avec un taux de 24 images/seconde. Bien qu'elle soit moins sophistiquée que certains concurrents comme Runway Gen-4, Luma Dream Machine ou OpenAI's Sora, son entrée de gamme accessible et sa qualité visuelle exceptionnelle lui assurent une position unique sur le marché.

Orientée vers l'avenir : La vision ambitieuse de Midjourney

David Holz, PDG de Midjourney, a mentionné dans un billet de blog que le modèle V1 représente une étape importante vers leur objectif de simulation de mondes ouverts en temps réel. Plutôt que de se concentrer sur la génération de simples images B-roll pour Hollywood ou la publicité, Midjourney s'efforce de développer des modèles d'IA capables de simuler des mondes interactifs 3D. Holz insiste : « Nous avons besoin de la visualisation (modèles d'image), et nous avons besoin que les images bougent (modèles vidéo), c'est la pierre angulaire de notre avenir. »

L'introduction de V1 n'est pas seulement une percée technologique, mais elle injecte également une nouvelle vitalité dans l'écosystème de Midjourney. En combinant avec leur dernier modèle V7 de génération texte-image, les utilisateurs peuvent passer d'un texte à une image puis directement à une vidéo, formant ainsi une boucle créative complète. Ce processus de création de bout en bout offre des outils efficaces aux créateurs indépendants, artistes numériques et petites entreprises.

Défis et controverses : L'ombre d'une procédure en contrefaçon

Malgré l'engouement autour du lancement de V1, Midjourney fait face à des poursuites pour contrefaçon intentées par Disney et Universal Pictures. Ces deux géants d'Hollywood accusent Midjourney d'utiliser ses droits intellectuels (comme les personnages de Star Wars ou Minions) sans autorisation lors de la formation de son modèle IA, générant ainsi des images et vidéos presque identiques. Cette procédure pourrait constituer un obstacle à l'expansion des services vidéo de Midjourney et émet un signal d'alerte pour toute l'industrie de l'IA générative en matière de normes de propriété intellectuelle.

Retours utilisateurs et réactions du marché

Selon les derniers retours en ligne, le modèle V1 reçoit de nombreuses louanges de la part des créateurs pour sa simplicité d'utilisation et sa beauté visuelle. De nombreux utilisateurs soulignent que même sans des prompts complexes, V1 peut générer des vidéos avec une sensation de réalisme et des détails subtils, particulièrement performante dans les scènes à faible dynamisme. Cependant, certaines scènes à haute dynamique peuvent présenter un léger problème de clignotement, indiquant qu'il reste encore de la marge pour des améliorations techniques.

Par ailleurs, le lancement de V1 a provoqué une vague de popularité sur les réseaux sociaux. Les créateurs partagent largement les vidéos générées par V1, montrant une diversité d'applications allant des paysages féériques aux scènes science-fiction. L'activité communautaire de Midjourney continue d'augmenter, attirant probablement de nouveaux utilisateurs à son plateau.

La rédaction d'Aibase considère que le lancement de Midjourney V1 n'est pas seulement une percée technologique, mais aussi une autre étape vers la démocratisation des outils créatifs IA. Sa combinaison de coût bas et de qualité élevée permet à davantage de créateurs indépendants d'accéder au domaine de la création vidéo à un prix minimal. Bien que ses fonctionnalités soient actuellement limitées, le plan clair et l'ambition de Midjourney montrent que V1 n'est qu'un point de départ dans son parcours de génération vidéo.

À l'avenir, nous espérons voir Midjourney apporter des innovations dans des domaines tels que l'amélioration de la résolution, la fonctionnalité texte-videos, et l'intégration audio. La résolution des questions de copyright sera également cruciale pour son succès durable. Aibase continuera de suivre les développements de Midjourney et vous fournira les informations de l'industrie en temps réel.