Kunlun Wanzhi lança modelo de música AI Mureka V7.5 e apresenta o modelo de voz MoE-TTS

AIbase基地

Publicado emNotícias e Informações de IA · 8 minutos de leitura · Aug 15, 2025

20.5k

Em 15 de agosto de 2025, o Grupo Kunlun Wanjie anunciou oficialmente a lançamento da versão 7.5 do modelo Mureka, trazendo uma nova ruptura para o campo da criação musical com IA. Essa notícia marca o encerramento bem-sucedido da semana de lançamento das tecnologias SkyWork AI da Kunlun Wanjie. Durante o período de cinco dias do lançamento, a Kunlun Wanjie lançou diariamente um novo modelo, abrangendo tecnologias de ponta em cenários centrais multimodais, incluindo os modelos SkyReels-A3, Matrix-Game2.0, Matrix-3D, Skywork UniPic2.0 e Skywork Deep Research Agent.

A lançamento do Mureka V7.5 foi a peça principal da semana de lançamento tecnológico. Ele demonstrou capacidades notáveis na criação de músicas em chinês. O modelo não apenas alcançou melhorias significativas na timbre e nas técnicas de execução, mas também fez progressos notáveis no diction e na expressão emocional. Com uma compreensão profunda dos estilos musicais chineses e dos elementos relacionados, o Mureka V7.5 pode transmitir com precisão a essência artística e as nuances emocionais da música chinesa. Ele abrange diversos estilos, desde canções folclóricas tradicionais, óperas, clássicos populares da música mandarim até músicas folclóricas contemporâneas, mostrando a diversidade e as características culturais da música chinesa.

Para aprimorar ainda mais a autenticidade e a profundidade emocional das vozes humanas, o Mureka V7.5 otimizou a tecnologia de reconhecimento automático de voz (ASR). Essa tecnologia atua no nível microscópico da interpretação, identificando com precisão as palavras cantadas e analisando o uso de respiração, oscilações emocionais e detalhes técnicos nas interpretações reais. Ao dividir inteligentemente as frases musicais e determinar posições naturais de respiração e pausas, o Mureka V7.5 aumentou significativamente a clareza das frases geradas e a sensação realista da estrutura. Esses detalhes capturados e devolvidos ao modelo gerador aumentaram enormemente a naturalidade da voz humana, a sensação de respiração e a autenticidade da expressão emocional, reduzindo efetivamente o aspecto mecânico e tornando as músicas interpretadas pela IA mais próximas da voz humana, especialmente na manipulação das particularidades rítmicas e de respiração das músicas chinesas.

微信截图_20250815094600.png

Em paralelo, a equipe de voz da Kunlun Wanjie também lançou o MoE-TTS — o primeiro framework de síntese de voz baseado em Mixture of Experts (MoE) que permite descrições de personagens. Como um trabalho de pesquisa voltado para cenários de descrição aberta, o MoE-TTS permite que os usuários controlem com precisão as características e o estilo da voz por meio de descrições em linguagem natural. Mesmo usando dados abertos, essa tecnologia pode se comparar ou superar produtos comerciais fechados. O lançamento do MoE-TTS tem o potencial de resolver problemas persistentes no campo da síntese de voz descritiva, como quando as falas geradas desviam-se das expectativas dos usuários ao lidar com metáforas, comparações e outras figuras de linguagem complexas. Esse framework combina a capacidade textual do modelo de linguagem grande pré-treinado (LLM) com módulos especializados em voz, garantindo que cada modalidade seja otimizada independentemente sem interferências, obtendo assim uma capacidade de compreensão geral sem perda de conhecimento. Em conjuntos de testes que abrangem descrições dentro e fora do domínio, o MoE-TTS apresentou excelentes resultados em termos de aderência à expressão de estilo e aderência geral, demonstrando vantagens em sua capacidade de correspondência com descrições complexas.

O lançamento do MoE-TTS não só fornece uma solução de TTS descritiva aberta replicável para a comunidade acadêmica, mas também demonstra o grande potencial da abordagem de "desacoplamento de modos + transferência de congelamento de conhecimento" na síntese de voz. Essa inovação pode impulsionar a indústria a adotar uma nova perspectiva, passando de um controle baseado em etiquetas fechadas para um controle livre baseado em linguagem natural, acelerando a melhoria da experiência em pessoas digitais, assistentes virtuais e criação de conteúdo imersivo. Atualmente, o MoE-TTS está em evolução, e seu plano futuro é integrá-lo à plataforma Mureka-Speech como modelo base para dublagem de personagens, oferecendo aos desenvolvedores e criadores globais capacidades de síntese de voz descritiva aberta, eficiente e personalizável.

O Grupo Kunlun Wanjie, por meio do lançamento do Mureka V7.5 e do MoE-TTS, demonstrou sua forte capacidade e inovação no campo da criação musical com IA e síntese de voz. Essas tecnologias não apenas trazem novas possibilidades para a criação musical e síntese de voz, mas também oferecem novas ideias e direções para pesquisas e desenvolvimentos nesses campos. Os usuários globais podem acessar www.mureka.ai para experimentar a nova versão 7.5 e explorar as infinitas possibilidades da criação musical.

O produto de vídeo de inteligência artificial da Kunlun Wanyi, SkyReels, lançará uma nova versão no início de novembro

O produto de vídeo de inteligência artificial da Kunlun Wanyi, SkyReels, anunciou que a nova versão estará oficialmente disponível no início de novembro. Sob o suporte da estratégia de inteligência artificial da Kunlun Wanyi, esse produto deve continuar a consolidar a posição de liderança da empresa no setor global de vídeos de inteligência artificial e acelerar a realização da visão da indústria de 'toda pessoa pode participar da criação profissional de vídeos'. Atualmente, usuários em todo o mundo podem se inscrever na lista de testes do site oficial do SkyReels para experimentar as funcionalidades do modelo.

Kunlun AI lança e abre o código-fonte do novo modelo de raciocínio MindLink

A Kunlun AI oficialmente lançou e abriu o código-fonte de seu novo modelo de raciocínio Skywork MindLink, além de divulgar os pesos do modelo de 72B, relatório técnico e links para repositórios de código, gerando amplo interesse da indústria. Esse modelo utiliza um framework inovador de raciocínio para selecionar dinamicamente caminhos, combinando flexivelmente os modos de geração com e sem raciocínio de acordo com a complexidade da tarefa, reduzindo assim os custos computacionais enquanto melhora a transparência e a eficiência das respostas.

O modelo de pré-treinamento multimodal unificado Skywork UniPic da Kunlun Vision integra capacidades de geração e compreensão de imagens

A Kunlun Wanwei abre o modelo multimodal Skywork UniPic, com funções de compreensão, geração e edição de imagens. O modelo leve de 1,5B parâmetros tem desempenho próximo a modelos grandes, suportando tarefas multimodais como geração de texto para imagem e transferência de estilo. Documentação e código disponíveis para desenvolvedores.....

Kunlun Wanzhi lança oficialmente Skywork UniPic: Modelo de pré-treinamento multimodal abre uma nova era na IA!

Kunlun Wanzhi lança o modelo de pré-treinamento multimodal aberto Skywork UniPic, integrando três funções principais: compreensão de imagens, geração de imagens a partir de textos e edição de imagens. Esse modelo utiliza um método de treinamento autoregressivo, treinado com grandes quantidades de dados de alta qualidade, apresentando boa generalidade e capacidade de transferência. Sua característica de código aberto facilita a inovação secundária pelos desenvolvedores e pode ser amplamente aplicado na criação de conteúdo e em cenários industriais. Isso representa uma importante estratégia da Kunlun Wanzhi no campo da IA, que impulsionará o desenvolvimento e a difusão da tecnologia multimodal.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Kunlun Wanzhi lança modelo de música AI Mureka V7.5 e apresenta o modelo de voz MoE-TTS

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

O produto de vídeo de inteligência artificial da Kunlun Wanyi, SkyReels, lançará uma nova versão no início de novembro

MiniMax Music 1.5 é lançado, aumentando o tempo da música gerada para 4 minutos

Lançamento mundial! Mureka V7.5 música digital 'Digital Heartbeat' chega com força

Kunlun Tech lança Skywork Deep Research Agent v2

Jornal AI: Bilibili testa ferramenta de vídeo de IA, Peanuts AI; Tencent lança modelo multimodal Large-Vision; Kunlun Wanjing abre código do Skywork UniPic 2.0

Kunlun Wanshi abre o modelo 'Skywork UniPic 2.0'

Diário de IA: Kunlun Wanzhi lança modelo SkyReels-A3; o Google Search para desktop está oficialmente disponível com busca de IA; modelo de IA Grok 4 oferecido gratuitamente permanentemente

Kunlun AI lança e abre o código-fonte do novo modelo de raciocínio MindLink

O modelo de pré-treinamento multimodal unificado Skywork UniPic da Kunlun Vision integra capacidades de geração e compreensão de imagens

Kunlun Wanzhi lança oficialmente Skywork UniPic: Modelo de pré-treinamento multimodal abre uma nova era na IA!

Notícias de IA Relacionadas Recomendadas

O produto de vídeo de inteligência artificial da Kunlun Wanyi, SkyReels, lançará uma nova versão no início de novembro

MiniMax Music 1.5 é lançado, aumentando o tempo da música gerada para 4 minutos

Lançamento mundial! Mureka V7.5 música digital 'Digital Heartbeat' chega com força

Kunlun Tech lança Skywork Deep Research Agent v2

Jornal AI: Bilibili testa ferramenta de vídeo de IA, Peanuts AI; Tencent lança modelo multimodal Large-Vision; Kunlun Wanjing abre código do Skywork UniPic 2.0

Kunlun Wanshi abre o modelo 'Skywork UniPic 2.0'

Diário de IA: Kunlun Wanzhi lança modelo SkyReels-A3; o Google Search para desktop está oficialmente disponível com busca de IA; modelo de IA Grok 4 oferecido gratuitamente permanentemente

Kunlun AI lança e abre o código-fonte do novo modelo de raciocínio MindLink

O modelo de pré-treinamento multimodal unificado Skywork UniPic da Kunlun Vision integra capacidades de geração e compreensão de imagens

Kunlun Wanzhi lança oficialmente Skywork UniPic: Modelo de pré-treinamento multimodal abre uma nova era na IA!

GEO Services