Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Oct 29, 2025

Récemment, le domaine de la reconnaissance vocale par l'intelligence artificielle a connu une innovation majeure : le modèle vocal SoulX-Podcast lancé par Soul, qui est rapidement devenu un sujet de débat dans l'industrie grâce à ses fonctions révolutionnaires. Ce modèle, conçu spécifiquement pour les contenus de type podcast, permet de générer des voix avec une grande fidélité, supporte des dialogues longs, plusieurs intervenants et plusieurs langues, marquant ainsi une nouvelle étape dans la simulation des conversations naturelles par l'intelligence artificielle.

Le point fort principal de SoulX-Podcast réside dans sa haute fidélité et sa stabilité. Il est capable de générer continuellement plus de 90 minutes de contenu dialogué sans aucune dégradation de stabilité, garantissant ainsi un déroulement fluide et naturel. Cette capacité est particulièrement adaptée aux podcasts longs, aux entretiens ou aux récits narratifs, permettant à la voix générée par l'intelligence artificielle de passer d'une démonstration courte à une application pratique.

Prise en charge multilingue et dialectes : bilingue chinois-anglais + dialectes intégrés

Le modèle se distingue par sa performance dans le traitement des langues, en soutenant les dialogues multiples en mandarin, en anglais et en divers dialectes du chinois. Les utilisateurs peuvent facilement basculer entre le chinois et l'anglais, ou intégrer des éléments de dialectes locaux, créant ainsi une ambiance de podcast plus spécifique à une région. De plus, il dispose d'une fonction de contrôle des éléments non verbaux, comme les rires, les soupirs, les pauses, permettant une simulation précise des expressions émotionnelles, ce qui améliore davantage la vivacité et l'immersion de la voix.

Il convient de noter l'innovation de SoulX-Podcast concernant la création de voix sans échantillon et son transfert. Cette fonction permet au modèle de copier directement une voix et un ton spécifiques sans entraînement supplémentaire, offrant ainsi une personnalisation de la voix personnalisée. Cela réduit non seulement les barrières techniques, mais offre également aux créateurs de contenus un espace infini pour l'innovation, par exemple pour reproduire rapidement le style d'un entretien célèbre ou imiter le ton unique d'un animateur virtuel.

Impact sur l'industrie : l'ère des podcasts intelligents artificiels s'accélère

Cette publication va inévitablement accélérer l'utilisation généralisée des voix intelligentes artificielles dans les domaines médiatiques, ludiques et éducatifs. Selon des experts, l'apparition de SoulX-Podcast va remettre en question le modèle traditionnel des studios d'enregistrement, permettant à des petites équipes de produire efficacement du contenu de qualité pour leurs podcasts. À l'avenir, avec les itérations du modèle, on prévoit qu'il s'étendra davantage vers l'interaction en temps réel et l'intégration multiplateforme.

Lien du projet : https://github.com/Soul-AILab/SoulX-Podcast

SoulX-Podcast VoixIA Interactionmultilingue Voixhautefidélité

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Qingyun lance le premier podcast d'IA interactif en Chine, les utilisateurs peuvent poser des questions à tout moment

Tencent Hunyuan lance le premier podcast IA interactif en Chine, permettant aux utilisateurs de poser des questions en temps réel par voix ou texte, améliorant l'interactivité et l'efficacité.....

Oct 29, 2025

Journal de l'IA : Douyin lance un système de doublage automatique pour plusieurs personnes ; Adobe Firefly Image 5 se voit fortement amélioré ; Soul présente le modèle vocal SoulX-Podcast

Doubao lance un système IA de livres audio multi-voix automatisé, générant directement des dialogues à partir de textes avec 98% de précision, égalant les productions professionnelles. Une innovation majeure pour la création de contenu audio.....

Oct 29, 2025

Journal AI : Xiaohongshu lance un modèle de synthèse de dialogue FireRedTTS-2 ; le nouveau modèle de Baidu Wenshi grimpe en tête du Hugging Face ; xAI va licencier 500 personnes

Bienvenue dans l'émission 【Journal AI】 ! C'est votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les sujets d'actualité dans le domaine de l'IA, en mettant l'accent sur les développeurs, afin que vous puissiez comprendre les tendances technologiques et découvrir des applications innovantes de produits d'IA. Découvrez les nouveaux produits d'IA en cliquant ici : https://app.aibase.com/zh1. Xiaohongshu lance son nouveau modèle de synthèse de dialogue FireRedTTS-2, qui aide à la réalisation de podcasts d'IA. FireRedTTS-2 est le nouveau modèle développé par l'équipe audio intelligente de Xiaohongshu.

Sep 15, 2025

140

WeChat Toutiao lance un nouveau modèle de synthèse de dialogue FireRedTTS-2 pour aider à la création d'émissions de podcast en IA

L'équipe audio de Xiaohongshu lance FireRedTTS-2, un nouveau modèle de synthèse vocale améliorant flexibilité, prononciation et fluidité des conversations.....

Sep 15, 2025

Journal de l'IA : DingTalk célèbre son dixième anniversaire avec la version 8.0 ; WeChat lance discrètement un podcast intelligent ; Alibaba ouvre le code de Mobile-Agent 3

Le « Quotidien AI » couvre les tendances tech pour les développeurs. DingTalk 10e anniversaire lance v8.0 avec « DingTalk ONE », une IA de bureau interactive par dialogue naturel.....

Aug 25, 2025

Le podcast d'IA de WeChat débute avec brio ! Informations diffusées en conversation entre deux personnes, les animateurs traditionnels vont-ils perdre leur emploi ?

WeChat teste une fonctionnalité de podcast AI. Les utilisateurs peuvent y accéder via 'Actualités' ou des comptes officiels, en cliquant sur 'Écouter les actualités'. Cela pourrait changer la consommation d'infos.....

Aug 25, 2025

110

Un ingénieur d'OpenAI affirme que les employés chargés de l'ajustement des modèles d'IA sont les plus recherchés, mais leur nom ne peut pas être révélé

Des personnalités clés d'OpenAI ont accidentellement révélé lors d'une émission de podcast la haute confidentialité des informations relatives aux talents au sein de l'entreprise, suscitant une attention dans le secteur. Lorsqu'ils discutaient de l'importance de l'ajustement des modèles d'IA, le chercheur Sidor a mentionné que l'entreprise recrute actuellement de talents exceptionnels pour cet ajustement, mais a été interrompu par un collègue qui lui a dit de ne pas divulguer le nom. Ce moment a été supprimé sur certaines plateformes. Cela reflète la vive concurrence pour les talents dans le secteur de l'IA. Il y a eu précédemment des cas où Meta avait embauché plusieurs personnalités clés d'OpenAI avec des salaires très élevés, et Google s'efforce également de recruter des experts en IA. Avec le développement des technologies d'IA, les ingénieurs spécialisés dans l'ajustement deviennent une ressource rare.

Aug 5, 2025

MOSS-TTSD révolutionne le code source : un IA podcast qui devient le roi grâce à un entraînement de plusieurs millions d'heures

Tsinghua & partenaires ouvrent MOSS-TTSD, modèle vocal bilingue basé sur Qwen3-1.7B. XY-Tokenizer permet 1kbps avec qualité préservée, clonage vocal et contrôle d'événements sonores. Performances supérieures en chinois, jusqu'à 960s. Poids, API et démo disponibles.....

Aug 1, 2025

Bilibili lance un outil de création nommé HAI, se concentre pleinement sur les vidéos podcast

B站 lance 'code H', un outil IA transformant l'audio en vidéo en 6 min, avec support de flux, studio gratuit et outils IA. Objectif : 3 min.....

Jul 7, 2025

Lancement de la fonctionnalité Podcast IA sur la version bureau et web de Dou Bao

Aujourd’hui, la version bureau et web de Dou Bao lancent la nouvelle fonctionnalité « Podcast IA », offrant une révolution dans les modes de traitement et de réception d'informations pour les utilisateurs. Il suffit aux utilisateurs de se rendre sur doubao.com, de sélectionner la fonction « Podcast IA » sur la page, puis d’uploader un fichier PDF ou un lien web pour générer rapidement du contenu de podcast sous forme de dialogue à deux voix. Cette fonctionnalité innovante dispense les utilisateurs des travaux de montage complexes traditionnels, leur permettant d’écouter facilement des longs articles partout et à tout moment. En termes d’effet vocal, le podcast Dou Bao est excellent. Les voix générées sont extrêmement naturelles, pouvant

Jun 17, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Deployment Calculator

AI Dataset Collection

Intelligent Document Recognition