Tencent Hunyuan a lancé et open-sourcé son dernier modèle de génération d'images multimodales, « HunyuanImage3.0 ». Cette publication marque le fait que le nombre de paramètres du modèle a atteint 80 milliards, en faisant le premier modèle de génération multimodale natif industriel open-source. Selon les responsables officiels, les performances de génération de ce modèle peuvent rivaliser avec celles des modèles fermés les plus avancés du secteur.
Les points forts principaux de HunyuanImage3.0 sont sa capacité à traiter des contenus sémantiques complexes, à interpréter des textes de plusieurs milliers de caractères et à générer des images correspondantes. Grâce au raisonnement sur les connaissances, ce modèle est capable de générer des textes longs, ce qui représente un progrès important par rapport aux modèles de génération d'images précédents. Cette avancée technologique offre non seulement une expérience de création plus riche aux utilisateurs, mais ouvre également de nouvelles possibilités dans le domaine de la génération d'images par l'intelligence artificielle.
Cette mise à jour constitue une amélioration importante du série Hunyuan depuis la version 2.0 lancée en mai de cette année. La version 2.0 a déjà permis une réponse en millisecondes et une qualité d'image extrêmement réaliste, tout en soutenant la génération en temps réel d'images. Les utilisateurs peuvent ainsi voir le processus de génération d'images pendant qu'ils tapent du texte. Cette fonctionnalité de retour instantané améliore considérablement l'expérience d'interaction utilisateur.
Au cours des derniers mois, Tencent Hunyuan a progressivement open-sourcé plusieurs technologies de génération d'IA, notamment des modèles de génération 3D, des plug-ins de génération d'images personnalisées appelés InstantCharacter, et des outils de génération vidéo multimodale appelés HunyuanCustom. Ces projets open-source ont construit un écosystème complet de technologies de contenu généré par l'IA (AIGC), permettant aux développeurs et aux utilisateurs d'explorer et d'appliquer ces technologies dans plusieurs domaines.
** Points clés : **
🌟 HunyuanImage3.0 est le premier modèle de génération multimodale industriel open-source de Tencent, avec un nombre de paramètres de 80 milliards.
🖼️ Le modèle est capable d'interpréter des sémantiques complexes et de générer des textes longs de plusieurs milliers de caractères, avec des résultats comparables aux modèles fermés les plus performants.
🚀 C'est une mise à jour après la version 2.0, supportant une réponse en millisecondes et une expérience d'interaction avec la génération en temps réel d'images.