Kuaishou Technology Beijing Co., Ltd. a récemment annoncé que l'API de son grand modèle de génération visuelle, Kling (可灵AI), a bénéficié d'une nouvelle mise à niveau de ses capacités. L'API Kling améliorée a réalisé des progrès significatifs dans deux fonctions principales : l'essayage virtuel et la synchronisation labiale, offrant ainsi un support technique plus puissant aux clients des secteurs du commerce électronique, du marketing publicitaire, du divertissement et des outils d'IA.

Dans le domaine de l'essayage virtuel, le modèle V1.5 de Kling est capable non seulement de traiter les vêtements individuels, mais aussi les combinaisons « haut + bas ». Cette amélioration permet au système de capturer et de préserver avec précision chaque détail des vêtements. Combinée à la fonction de génération de vidéos à partir d'images, les utilisateurs peuvent créer des vidéos d'essayage naturelles et fluides, améliorant considérablement le réalisme et l'utilité de l'expérience d'essayage virtuel.

微信截图_20241231082555.png

De plus, la capacité de synchronisation labiale de Kling est désormais entièrement disponible. Elle permet une synchronisation parfaite entre la bouche des personnages vidéo et des fichiers audio locaux (voix ou chants) ou des voix générées en ligne. Cette fonctionnalité rend les vidéos générées extrêmement réalistes, imitant l'effet d'une personne qui parle ou chante, ouvrant ainsi de nouvelles possibilités pour la création de contenu vidéo.

Kuaishou Technology Beijing Co., Ltd. a déclaré que ces améliorations aideront les entreprises clientes à progresser dans leur croissance commerciale, tout en démontrant la puissance et le potentiel d'innovation de Kling dans le domaine de la génération visuelle. Grâce à ces nouvelles fonctionnalités, les utilisateurs peuvent facilement et efficacement réaliser diverses créations artistiques, stimulant ainsi l'innovation et le développement du contenu visuel.