Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

Tools

GEO Brand Visibility

All-in-One GEO Brand Insights Platform

AI Brand Monitoring Tool

Analyze & Track How AI Models Cite Your Brand

AI Search Visibility Checker

Detect brand's visibility on AI platforms

GEO Promotion Link Detection

Quickly evaluate the citation of promotion articles on AI platforms

Service

GEO Ranking Optimization System

Own your own GEO system and become a professional GEO optimization service provider.

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

AI Tutorial

WeChat Toutiao lance un nouveau modèle de synthèse de dialogue FireRedTTS-2 pour aider à la création d'émissions de podcast en IA

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Sep 15, 2025

Le groupe de technologie audio de l'Intelligence créative de Xiaohongshu a récemment lancé un nouveau modèle de synthèse vocale dialoguée FireRedTTS-2, marquant une avancée importante dans la technologie de génération de dialogues. Ce modèle vise à résoudre certains problèmes existants dans les solutions actuelles de synthèse vocale dialoguée, tels que la faible flexibilité, les erreurs de prononciation fréquentes, les changements de locuteur instables et le manque de naturel dans le rythme.

FireRedTTS-2 a amélioré ses modules principaux, en particulier le encodeur de parole discret et le modèle de synthèse texte-voix, pour améliorer globalement la qualité de la synthèse. Dans diverses évaluations subjectives et objectives, FireRedTTS-2 montre un niveau exceptionnel au sein de l'industrie, offrant ainsi une solution optimale pour la synthèse de dialogues à plusieurs locuteurs. Son rapport technique a été publié sur arXiv et peut être expérimenté via un démo spécifique et un lien vers le code.

Un point fort notable de FireRedTTS-2 est sa nature naturelle. Le modèle peut saisir précisément des détails tels que l'accent, l'émotion et les pauses, offrant une qualité sonore naturelle et fluide. Par rapport aux modèles de génération de dialogues fermés, FireRedTTS-2 peut non seulement produire des audios de podcasts de haute qualité, mais aussi supporter la fonction de clonage de voix. En fournissant simplement un exemple de parole par locuteur, le modèle peut imiter sa voix et son style de parole, générant automatiquement tout le dialogue. Cette fonction lui confère une forte compétitivité dans le domaine de la génération de dialogues ouverts.

Lors de l'entraînement, FireRedTTS-2 prend en charge plusieurs langues (y compris le chinois, l'anglais, le japonais, le coréen et le français), et utilise un encodeur de parole discret à faible taux d'échantillonnage pour améliorer la vitesse et la stabilité de la synthèse. De plus, l'architecture du modèle utilisant deux Transformers permet une synthèse plus naturelle et plus cohérente. En outre, FireRedTTS-2 peut personnaliser la voix avec peu de données, s'adaptant rapidement à différents scénarios d'application.

Le lancement de FireRedTTS-2 offre non seulement une solution industrielle pour les podcasts d'IA et les applications de synthèse de dialogues, mais ouvre également de nouvelles possibilités pour l'innovation à l'intérieur et à l'extérieur de l'industrie. À l'avenir, l'équipe continuera d'optimiser ce modèle, d'ajouter le nombre de locuteurs et de langues pris en charge, et d'explorer davantage de fonctions d'insertion d'effets sonores contrôlables, afin de répondre aux besoins croissants du marché.

Lien vers le code : https://github.com/FireRedTeam/FireRedTTS2

Points clés :
🎤 FireRedTTS-2 est un nouveau modèle de synthèse vocale dialoguée développé par le groupe de technologie audio de l'Intelligence créative de Xiaohongshu, visant à améliorer la qualité et la naturel de la synthèse.
🗣️ Le modèle possède la capacité de cloner la voix, pouvant générer des dialogues naturels à plusieurs locuteurs avec peu d'exemples.
🌐 Il prend en charge plusieurs langues et un encodeur de parole discret à faible taux d'échantillonnage, améliorant ainsi la vitesse et la stabilité de la synthèse, adaptant ainsi divers scénarios d'application.

FireRedTTS-2 Modèledesynthèsevocaleconversationnelle NéologismeIA ÉquipetechnologiqueaudiodeXiaohongshuZhichuang

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

L'étude d'Aalto révèle que l'IA peut amplifier l'effet Dunning-Kruger : les moins compétents surestiment leurs capacités cognitives après son utilisation.....

Oct 29, 2025

Le PDG d'OpenAI annonce : un chercheur en IA autonome en 2028

OpenAI prévoit un assistant de recherche autonome d'ici 2026 et un chercheur IA légal automatisé pour 2028, marquant l'évolution de l'IA d'outil à acteur indépendant de la recherche.....

Oct 29, 2025

Rothschild investit dans les outils d'IA de Rogo Technologies, qui pourraient transformer le rôle du banquier de premier plan

Sequoia investit dans Rogo Technologies, valorisée à 750M$. La startup new-yorkaise développe une IA pour améliorer l'efficacité des banquiers d'investissement.....

Oct 28, 2025

320

Anthropic lance une version améliorée de Claude pour les analystes financiers, équipée d'une extension Excel et d'une connexion aux données en temps réel

Anthropic lance des outils financiers pour Claude : plug-in Excel, connecteurs de données et compétences d'agent IA, visant à optimiser les processus financiers.....

Oct 28, 2025

110

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

L'IA devient un soutien psychologique informel mondial, avec des millions d'utilisateurs partageant leurs détresses, dont 0,15% évoquent des tendances suicidaires, soulevant des questions sur sa capacité à assumer cette confiance.....

Oct 28, 2025

ChatGPT devient un assistant de vie polyvalent ! Connectez-vous en un clic à Spotify, Booking, Canva et huit autres plateformes

OpenAI améliore ChatGPT en agent intelligent avec 8 applications intégrées (voyage, design...). Mentionnez une app pour l'utiliser directement, comme créer des playlists Spotify sur commande.....

Oct 27, 2025

Google Earth intègre un grand modèle Gemini pour identifier les risques de tempêtes et de sécheresse

Google intègre Gemini à Earth pour permettre des requêtes en langage naturel, comme l'analyse des risques météorologiques et de sécheresse, via des données satellitaires et démographiques.....

Oct 27, 2025

Modèle M2 open source de MiniMax : l'IA hautement performante qui soutient la programmation et les agents, au coût équivalent à 8 % de la concurrence

MiniMax M2, modèle open source 2025 optimisé pour flux de travail agents et codage, architecture MoE. Coût réduit à 8% de Claude Sonnet, vitesse doublée.....

Oct 27, 2025

120

Avancées en édition d'images par l'IA ! Bytedance et l'Université de Hong Kong ainsi que d'autres institutions ont lancé en open source DreamOmni2, qui résout le problème de compréhension des concepts abstraits par l'IA

ByteDance et trois universités de Hong Kong ont open-sourcé DreamOmni2, un système révolutionnaire d'édition et génération d'images IA. Il comprend les instructions multimodales, traite simultanément texte et images, améliore les tâches abstraites et fait progresser la technologie de génération d'images.....

Oct 27, 2025

110

Meituan lance le modèle de génération vidéo LongCat-Video, prenant en charge nativement la sortie continue de 5 minutes

MeiTuan lance LongCat-Video, un modèle de génération vidéo basé sur DiT. Il simule les lois physiques et génère des vidéos à partir de texte, favorisant la recherche sur les modèles mondiaux en IA.....

Oct 27, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

WeChat Toutiao lance un nouveau modèle de synthèse de dialogue FireRedTTS-2 pour aider à la création d'émissions de podcast en IA

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

Le PDG d'OpenAI annonce : un chercheur en IA autonome en 2028

Rothschild investit dans les outils d'IA de Rogo Technologies, qui pourraient transformer le rôle du banquier de premier plan

Anthropic lance une version améliorée de Claude pour les analystes financiers, équipée d'une extension Excel et d'une connexion aux données en temps réel

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

ChatGPT devient un assistant de vie polyvalent ! Connectez-vous en un clic à Spotify, Booking, Canva et huit autres plateformes

Google Earth intègre un grand modèle Gemini pour identifier les risques de tempêtes et de sécheresse

Modèle M2 open source de MiniMax : l'IA hautement performante qui soutient la programmation et les agents, au coût équivalent à 8 % de la concurrence

Avancées en édition d'images par l'IA ! Bytedance et l'Université de Hong Kong ainsi que d'autres institutions ont lancé en open source DreamOmni2, qui résout le problème de compréhension des concepts abstraits par l'IA

Meituan lance le modèle de génération vidéo LongCat-Video, prenant en charge nativement la sortie continue de 5 minutes

Recommandations d'actualités IA connexes

L'étude révèle que l'utilisation de l'IA nous fait surestimer nos capacités cognitives

Le PDG d'OpenAI annonce : un chercheur en IA autonome en 2028

Rothschild investit dans les outils d'IA de Rogo Technologies, qui pourraient transformer le rôle du banquier de premier plan

Anthropic lance une version améliorée de Claude pour les analystes financiers, équipée d'une extension Excel et d'une connexion aux données en temps réel

Des millions d'utilisateurs par semaine confient à ChatGPT leur pensée suicidaire, OpenAI met à jour d'urgence les mesures de sécurité de GPT-5 pour faire face aux crises psychologiques

ChatGPT devient un assistant de vie polyvalent ! Connectez-vous en un clic à Spotify, Booking, Canva et huit autres plateformes

Google Earth intègre un grand modèle Gemini pour identifier les risques de tempêtes et de sécheresse

Modèle M2 open source de MiniMax : l'IA hautement performante qui soutient la programmation et les agents, au coût équivalent à 8 % de la concurrence

Avancées en édition d'images par l'IA ! Bytedance et l'Université de Hong Kong ainsi que d'autres institutions ont lancé en open source DreamOmni2, qui résout le problème de compréhension des concepts abstraits par l'IA

Meituan lance le modèle de génération vidéo LongCat-Video, prenant en charge nativement la sortie continue de 5 minutes

GEO Services