Dans le domaine de l'AIGC, l'art des invites textuelles est primordial. Le lancement du modèle Gen-3 Alpha de Runway a révolutionné la manière de contrôler précisément l'IA générative. Ce n'est pas seulement une victoire technologique, mais aussi un bond en avant pour la créativité et l'expression.
Lors de l'utilisation de produits d'IA générative tels que Gen-3, vous constaterez peut-être que les résultats générés sont parfois très différents de vos attentes. Cela est généralement dû à des invites incomplètes ou imprécises. Par exemple, la simple invite « coucher de soleil dans le désert » est trop vague pour guider le modèle vers votre véritable intention.
La bonne approche consiste à fournir une description visuelle détaillée, telle que « désert au coucher du soleil, lumière dorée sur des dunes ondulantes, un groupe de chameaux revenant de loin en levant beaucoup de poussière, style réaliste haute définition en ralenti ». Cela permettra au modèle de mieux saisir votre créativité.
Structure des invites textuelles de Gen-3
Runway recommande de diviser les détails du décor, du sujet et du mouvement de la caméra en différents modules. Cette structure claire est la plus efficace. La structure d'invite standard de Gen-3 comprend une invite textuelle pour établir la scène et des détails supplémentaires, par exemple :
Gros plan : un mini-chiot curieux perché sur un doigt en haute définition.
Changement de scène : survol d'un château irlandais, découverte des gratte-ciel d'une ville futuriste cyberpunk.
Bien que Runway Gen-3 offre d'excellents résultats, son prix d'abonnement élevé rebute de nombreux utilisateurs. Si vous hésitez à souscrire à Gen-3, pas de problème, les mêmes invites peuvent être utilisées sur DALL-E (ou un autre générateur d'images équivalent).
Cependant, différents produits peuvent avoir des logiques différentes. Par exemple, l'invite « un mini-chiot curieux perché sur un doigt en haute définition » ne donnera pas facilement de bons résultats sur DALL-E. Pourquoi ? Parce que la logique de DALL-E est basée sur la réalité, donc le chiot généré pourrait ne pas être assez miniature et ne pas avoir l'effet réaliste et irréel de Runway Gen-3.
Pour obtenir un tel effet avec DALL-E, il faut modifier légèrement l'invite et indiquer à l'IA la taille souhaitée du chiot.
Voici comment AIbase reproduit un mini-zèbre sur un doigt en utilisant cette logique. L'invite est la suivante : un doigt en haute définition, un adorable mini-zèbre marchant sur le doigt, aussi petit qu'une fourmi, zèbre miniature.
Vous obtiendrez alors un adorable mini-zèbre :
En suivant la même méthode, il suffit de remplacer le nom de l'animal pour créer des pandas, des tigres miniatures, etc.
Exemples d'invites détaillées fournis par l'équipe Runway :
Transition fluide
Séquence FPV ultra-rapide : la caméra traverse sans interruption un canyon glaciaire pour atteindre un paysage nuageux onirique.
Mouvement de la caméra
Océan scintillant de nuit, avec des créatures bioluminescentes sous l'eau. La scène commence par un gros plan sur une méduse bioluminescente, puis s'élargit pour révéler l'océan entier illuminé de différentes couleurs bioluminescentes sous un ciel étoilé. Mouvement de caméra : commence par un gros plan sur la méduse, puis recule et monte doucement pour montrer l'océan scintillant.
Carte de titre
Écran titre avec animation. La scène commence par un mur peint de couleurs vives. Soudain, de la peinture noire coule sur le mur pour former le mot « Runway ». Les détails de la peinture qui coule sont riches, la texture est nette, le mot est centré, avec un excellent éclairage cinématographique.
Mots clés
Les mots clés aident à obtenir un style spécifique dans le rendu. En assurant la cohérence des mots clés avec l'invite globale, vous les rendrez plus visibles dans le rendu.
Par exemple, dans un plan large, si l'appareil photo ne peut pas se concentrer précisément sur un visage, ajouter des mots clés sur la texture de la peau n'est pas utile. En revanche, ajouter plus de détails sur l'environnement peut être très bénéfique pour un plan large.
Gardez cette cohésion à l'esprit. Voici quelques mots clés à essayer lors de la rédaction de vos invites :