Le groupe Tencent a officiellement publié son tout dernier modèle d'image Hunyuan 2.0 (Hunyuan Image2.0), marquant ainsi l'entrée de la technologie de génération d'images IA dans une ère de réactivité « au milliseconde ».
Le nouveau modèle présente une amélioration significative en termes de vitesse par rapport à sa version précédente. Avec une augmentation d'un ordre de grandeur de ses paramètres, le modèle Hunyuan Image2.0 combine un encodeur-décodeur efficace et une architecture de diffusion novatrice. Il est capable de répondre en temps réel, en quelques millisecondes, alors que les produits commerciaux similaires nécessitent habituellement entre 5 et 10 secondes pour effectuer des inférences. Lorsque les utilisateurs génèrent des images, ils peuvent recevoir des résultats immédiatement tout en entrant du texte ou en donnant des instructions vocales, ce qui transforme radicalement le modèle traditionnel de « tirage – attente – re-tirage », améliorant ainsi l’expérience utilisateur.
Qualité d'image hyper-réaliste
Outre cette avancée en matière de vitesse, le modèle Hunyuan Image2.0 a également progressé sur le plan de la qualité des images générées. Grâce à l’apprentissage renforcé et à l’introduction de grandes quantités de connaissances esthétiques humaines, il évite efficacement l’aspect trop artificiel des images générées par IA. Les images produites sont non seulement très réalistes, détaillées, mais aussi d'une haute utilité. Dans les tests benchmark internationaux GenEval, le modèle Hunyuan Image2.0 a obtenu un taux de précision supérieur à 95 % dans l'évaluation de la compréhension et de la génération de commandes complexes, surpassant largement les autres modèles similaires.
Fonctionnalité de table de dessin en temps réel
Lors de cette mise à jour, une fonctionnalité de table de dessin en temps réel a été introduite. En utilisant la capacité de génération instantanée de l'image du nouveau modèle, lorsqu’un utilisateur dessine un croquis ou ajuste les paramètres, la zone de prévisualisation génère automatiquement l'effet de coloriage en temps réel. Cette fonction brise le processus traditionnel de « dessin – attente – modification », facilitant considérablement le travail des concepteurs professionnels. De plus, la table de dessin en temps réel supporte la fusion d'images multiples : les utilisateurs peuvent télécharger plusieurs esquisses, et l’IA coordonne automatiquement les perspectives et les éclairages, en suivant les mots-clés fournis par l'utilisateur pour générer une image fusionnée, enrichissant encore l'expérience interactive de la génération d'images IA.
Tencent a également révélé qu’un modèle de grande taille multimodal natif de génération d'images était en cours de développement. Ce nouveau modèle devrait se distinguer dans la génération itérative d'images et dans l'expérience interactive en temps réel, offrant aux utilisateurs une expérience créative encore plus riche.
Portail du produit : https://hunyuan.tencent.com/