Une équipe de Tencent a lancé un modèle d'IA impressionnant pour la chanson intitulé LeVo, qui suscite des discussions dans l'industrie grâce à ses capacités exceptionnelles de clonage vocal, de génération en stéréo et de reproduction fidèle de la musique. Selon les informations disponibles, LeVo égale ou dépasse les principaux indicateurs de Suno4.5, consolidant ainsi la place de la technologie de génération musicale chinoise sur la scène internationale. AIbase rassemble les dernières informations pour vous fournir une analyse approfondie des fonctionnalités révolutionnaires et du potentiel de LeVo.

À la hauteur de Suno4.5 : la puissance technique de LeVo

Conçu par le laboratoire d'IA de Tencent, LeVo utilise une architecture basée sur des modèles linguistiques (LM), combinée avec LeLM et un décodeur musical, permettant de générer simultanément des pistes mixtes (fusion de la voix et de l'accompagnement) ou des pistes doubles (séparation entre la voix et l'accompagnement). Sur plusieurs dimensions, comme la musicalité, la qualité sonore, la cohérence entre la voix et l'accompagnement, ainsi que l'alignement des paroles, LeVo dépasse largement les modèles académiques actuels en open source. D'après les derniers tests, LeVo excelle dans la capacité d'alignement des paroles (LYC), surpassant Suno4.5 de 0,21 points, ce qui illustre sa maîtrise exceptionnelle du contrôle textuel.

image.png

Adresse du projet : https://levo-demo.github.io/

Clonage vocal sans échantillons : un nouveau niveau dans la création musicale personnalisée

LeVo prend en charge le clonage vocal sans échantillons (Zero-Shot Voice Cloning), permettant de copier fidèlement un timbre vocal en seulement 3 secondes d'enregistrement audio. Cette fonction ne nécessite pas de grandes quantités de données d'entraînement, réduisant ainsi les obstacles techniques dans la création musicale. Que ce soit pour personnaliser une voix unique ou imiter le style de chanteurs célèbres, LeVo produit des résultats naturels et fluides, offrant aux créateurs une infinité de possibilités.

Génération en stéréo : un outil précieux pour la production musicale professionnelle

Contrairement aux modèles traditionnels de génération musicale IA, LeVo supporte la génération en double piste, séparant la voix de l'accompagnement, ce qui offre plus de flexibilité pour le mixage et l'édition ultérieure. Cette fonction est particulièrement utile pour les producteurs musicaux professionnels, leur permettant de générer facilement des pistes de haute qualité, optimisant ainsi leurs processus de création. Contrairement à Suno4.5, qui est légèrement en retrait dans la clonage vocal et la prise en charge des pistes, LeVo établit ainsi un nouvel standard dans l'industrie.

Fidélité sonore et applications variées

LeVo se distingue par sa qualité sonore proche des standards industriels de Suno4.5, notamment en termes de musicalité, de cohérence entre la voix et l'accompagnement, et de score MOS. Bien qu'il soit légèrement inférieur à Suno4.5 et Mureka-O1 en matière de clarté structurelle des chansons, LeVo optimise les résultats grâce à des méthodes multi-préférences, garantissant une fidélité sonore élevée dans divers styles et scénarios. Que ce soit pour la musique populaire, la musique de fond pour films ou des productions publicitaires, LeVo offre une sortie professionnelle.

Engagement open-source : la promotion de l'écosystème musical IA

Tencent a annoncé que LeVo sera publié sous forme open-source, avec la disponibilité complète du code et des modèles pré-entraînés, accessibles gratuitement pour tous les développeurs mondiaux. Cette initiative reflète non seulement l'ambition de Tencent dans le domaine de la musique IA, mais injecte également une nouvelle vitalité dans la communauté mondiale de la création musicale. AIbase souligne que la stratégie open-source de LeVo réduira efficacement les barrières à l'entrée, aidant les créateurs de contenu et les amateurs de musique à exprimer leur créativité.

Lancement de LeVo par Tencent marque une avancée significative de la technologie chinoise de génération musicale IA sur la scène mondiale. Grâce à ses fonctionnalités révolutionnaires comme le clonage vocal sans échantillon et la génération en stéréo, LeVo apporte une rupture dans la création musicale. Bien qu'il existe encore des écarts avec Suno4.5 dans certains indicateurs, LeVo, grâce à sa rentabilité et à son engagement open-source, devient un concurrent puissant dans le domaine de la musique IA. AIbase considère que le lancement de LeVo non seulement renforce l'influence internationale de la technologie IA chinoise, mais donne également un coup d'accélérateur à la démocratisation de la création musicale.