Tencent annonce le dévoilement officiel de son moteur d'IA 3D Hunyuan 3D AI Engine 2.5 demain, marquant une avancée majeure dans la création de contenu 3D pilotée par l'IA. Selon AIbase, cette version améliorée de Hunyuan 3D 2.0 devrait apporter des progrès significatifs en matière de génération de géométrie, de synthèse de textures et de vitesse de génération, offrant ainsi des solutions plus efficaces aux développeurs de jeux vidéo, aux créateurs de réalité virtuelle et aux designers. L'annonce officielle de Tencent a suscité un vif intérêt auprès des développeurs et des créateurs du monde entier, les détails étant attendus lors de la conférence de demain. AIbase vous propose un aperçu exclusif.
Améliorations clés : qualité supérieure et vitesse de génération accrue
Fort du succès de Hunyuan 3D 2.0, Hunyuan 3D AI Engine 2.5 optimisera encore son pipeline de génération en deux étapes (génération de géométrie + synthèse de textures). AIbase analyse les améliorations attendues :
Précision géométrique améliorée : grâce à l'optimisation du modèle Hunyuan3D-DiT (Diffusion Transformer), la version 2.5 générera des maillages 3D plus précis, améliorant la représentation des bords et des détails des structures complexes, tels que les visages humains et les pièces mécaniques.
Synthèse de textures améliorée : le modèle Hunyuan3D-Paint prendra en charge la sortie de textures à plus haute résolution, optimisant la cohérence multi-vues pour garantir un réalisme visuel à 360°.
Vitesse de génération améliorée : par rapport aux 10 à 25 secondes de génération de la version 2.0, la version 2.5 pourrait réduire ce temps à 5 à 15 secondes, notamment avec les modèles allégés (comme Hunyuan3D-2mini-Turbo).
Optimisation des entrées multimodales : prise en charge d'entrées plus complexes combinant texte et images, permettant aux utilisateurs de générer des actifs 3D hautement personnalisés à partir de descriptions en langage naturel ou d'images de référence.
La communauté spécule que la version 2.5 pourrait intégrer le dernier modèle de génération de textures RomanTex et la technologie de génération de matériaux PBR MaterialMVP (prévue pour le 1er avril), pour une prise en charge du rendu en temps réel et des applications haute fidélité. AIbase note que Hunyuan 3D 2.0 a déjà surpassé les produits concurrents open source et propriétaires lors des évaluations VBench, et les performances de la version 2.5 sont très attendues.
Architecture technique : continuité et innovation
Hunyuan 3D AI Engine 2.5 conserve l'architecture de génération en deux étapes de la version 2.0. Les composants clés incluent :
Hunyuan3D-DiT : basé sur un transformateur de diffusion, il est chargé de générer des structures géométriques 3D haute précision, prenant en charge la cohérence multi-vues et l'alignement d'images conditionnelles.
Hunyuan3D-Paint : utilisant des a priori géométriques et des modèles de diffusion, il génère des textures haute résolution, prenant en charge la coloration flexible des maillages dessinés à la main et générés.
Hunyuan3D-Studio : plateforme de création tout-en-un. La version 2.5 devrait ajouter des fonctionnalités d'édition d'animation et d'aperçu en temps réel, simplifiant le flux de travail des utilisateurs professionnels et amateurs.
AIbase a appris que la version 2.5 pourrait intégrer le guidage sans classifieur adaptatif (Adaptive Classifier-Free Guidance) 2.0, améliorant encore l'alignement des résultats générés avec les conditions d'entrée. De plus, les problèmes d'optimisation topologique signalés par la communauté (comme la prise en charge de l'animation squelettique) pourraient être résolus dans la version 2.5, améliorant ainsi son utilité dans le développement de jeux vidéo.
Applications : une capacité d'adaptation complète, des jeux vidéo au commerce électronique
Le lancement de Hunyuan 3D AI Engine 2.5 étendra encore les applications de l'IA dans la création de contenu 3D. AIbase résume les principaux scénarios :
Développement de jeux vidéo : génération rapide d'actifs à faible polygone et de modèles de personnages haute fidélité, accélération de la conception de niveaux et des tests de prototypes. Tencent Maps utilise déjà Hunyuan 3D pour améliorer de 91 % l'efficacité de la génération d'icônes de navigation.
Réalité virtuelle et métavers : génération d'environnements 3D immersifs et de personnages dynamiques, prise en charge de la création de contenu VR/AR, amélioration de l'expérience utilisateur.
Commerce électronique : génération de modèles 3D interactifs pour les produits, prise en charge de l'affichage à 360° et de l'ajustement des textures en temps réel, amélioration de l'expérience d'achat des consommateurs.
Cinéma et animation : génération d'actifs de prévisualisation et de séquences d'animation de haute qualité, réduction des coûts de VFX et de post-production.
AIbase observe que Hunyuan 3D 2.0 a déjà démontré un fort potentiel dans la création UGC et la synthèse de textures de produits. Les améliorations de la version 2.5 devraient stimuler davantage les applications commerciales dans ces domaines.
Guide de prise en main : open source et convivialité
Hunyuan 3D AI Engine 2.5 devrait conserver une stratégie open source. Le code et les modèles seront publiés sur Hugging Face et GitHub. AIbase a rassemblé les étapes de prise en main préliminaires :
Accédez au site Web de Hunyuan3D Studio (3d.hunyuan.tencent.com) ou à l'espace Hugging Face pour télécharger le modèle 2.5 et le code d'inférence ;
Installez l'environnement (Python 3.9+, NVIDIA A100/RTX3090+, 32 Go de RAM recommandés), exécutez le script env_install.sh ;
Utilisez l'application Gradio ou l'API pour charger le modèle, saisissez du texte (par exemple, « ville cyberpunk ») ou une image pour générer des actifs 3D ;
Éditez les textures, les animations ou exportez au format glb/obj dans Hunyuan3D-Studio.
Les plugins ComfyUI-Hunyuan3DWrapper et Blender fournis par la communauté continueront à prendre en charge la version 2.5, réduisant ainsi le seuil d'utilisation. AIbase conseille aux utilisateurs de suivre la conférence de demain pour obtenir les dernières mises à jour de compatibilité Windows et le module d'optimisation 6 Go de VRAM (tel que Hunyuan3D-2GP).
Réactions de la communauté et perspectives d'avenir
Depuis le lancement de Hunyuan 3D 2.0, son score CLIP élevé (0,809) et sa capacité de génération rapide ont été salués par la communauté. Cependant, les problèmes topologiques et la prise en charge des scènes complexes nécessitent encore des améliorations. AIbase observe que les développeurs attendent de la version 2.5 une optimisation de la compatibilité de l'animation squelettique et du traitement des invites multilingues. Certains utilisateurs souhaitent l'ajout d'une fonctionnalité image vers vidéo (I2V). Tencent a répondu que la version 2.5 résoudra certains points faibles et prévoit de lancer un modèle vidéo Hunyuan en 2025, pour rivaliser avec Runway Gen-3 et Luma 1.6. AIbase prévoit qu'avec l'expansion de l'écosystème Hunyuan 3D, Tencent pourrait lancer un marché MCP, intégrant des outils tels que Blender et Unity, pour créer un cadre de création IA unifié.