La société XiYu Technology a réalisé une avancée dans le domaine de la génération de vidéos et a officiellement lancé son nouveau modèle de génération de vidéos, Hailuo02.
Il est rapporté que Hailuo02 se distingue particulièrement lorsqu'il traite des scènes complexes telles que les mouvements de gymnastique, et il s'agit du seul modèle au monde capable d'atteindre un tel effet. Depuis la présentation du démonstrateur de génération de vidéos en août dernier, le produit vidéo HaiLuo de XiYu Technology a aidé les créateurs à générer plus de 370 millions de vidéos. L'introduction de Hailuo02 a encore réduit les barrières à l'entrée pour la création de vidéos tout en améliorant la qualité des créations.
L'architecture centrale derrière Hailuo02 est appelée Noise-aware Compute Redistribution (NCR). Cette architecture permet une amélioration de 2,5 fois de l'efficacité d'entraînement et de déduction avec la même quantité de paramètres. Cela permet aux créateurs d'utiliser des modèles de plus grande taille sans augmenter leurs coûts tout en améliorant considérablement la performance du modèle. En outre, compte tenu des opportunités d'optimisation pour la déduction, le nombre total de paramètres du modèle a été multiplié par trois par rapport à la version précédente.
Grâce à une plus grande quantité totale de paramètres et une efficacité accrue pendant l'entraînement, Hailuo02 peut simuler davantage de données. En combinant les retours des créateurs sur Hailuo01, la quantité de données a quadruplé par rapport à la version précédente, avec une qualité et une diversité améliorées. Cela a permis à ce nouveau modèle de progresser significativement dans l'exécution de commandes complexes et les représentations physiques, répondant pleinement aux commandes complexes et offrant un meilleur retour aux prompts soigneusement rédigés. De plus, les créateurs peuvent générer des vidéos natives en 1080p à un prix relativement abordable.
Dans les tests de l'Artificial Analysis Video Arena, une version précoce de Hailuo02 a occupé la deuxième place mondiale. Actuellement, ce modèle a été intégré dans les versions Web, mobiles et API ouvertes de HaiLuo Vidéo, offrant trois versions : 768p-6s, 768p-10s et 1080p-6s. XiYu Technology continue de fournir aux créateurs les tarifs les plus compétitifs du secteur et prévoit de mettre à jour rapidement les vitesses de génération, l'alignement des préférences, la réalisation de fonctionnalités de haut niveau et l'exploration des limites technologiques et artistiques.