MiniMax发布新一代AI音乐生成模型Music 2.6,实现从底层引擎到创作工具的全维度升级。核心优化包括大幅降低生成延迟、提升音乐结构连贯性、改善音质与听感,并新增“音乐续写”等创作功能。此次更新旨在为创作者提供更精准、流畅的音乐生成体验,拓宽AI音乐交互边界。
全球顶级唱片公司与AI音乐初创企业Suno就AI生成音乐的版权许可谈判陷入僵局,双方在保护艺术家权益方面存在分歧,目前尚无明确解决方案。
ElevenLabs发布iOS应用ElevenMusic,进军AI音乐创作与社交领域。用户可通过自然语言提示生成定制音乐,调整曲目长度、歌词和艺术风格。应用还整合流媒体社交功能,提供实时电台、预设专辑和基于喜好的音乐发现,与Suno、Udio等平台展开竞争。
谷歌DeepMind推出增强版音乐创作大模型Lyria 3 Pro,标志着生成式AI在音频领域从生成短乐句迈向全曲创作。该模型音质显著提升,核心突破在于具备“结构意识”,能生成逻辑完整的长音频,实现从“碎片”到“篇章”的进化。
AIGPTS集成顶尖AI模型,可快速创建视频、图像、音频等AI内容。
免费AI音乐生成器,秒速将文字变歌曲,免版税、无音乐技能要求
最强大的本地音乐生成模型,超越大多数商业替代品。
使用我们的 AI 音乐视频生成器,快速制作惊艳的音乐视频。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
ACE-Step
一个混合说唱声线模型,专注于提升中文说唱/嘻哈音乐的生成质量
calcuis
ACE-Step-v1-3.5B是一个文本转音频模型,支持高质量音频生成,适用于音乐和声音效果创作。
walterheart
Bark是由Suno创建的基于Transformer的文本转音频模型,可生成高度逼真的多语言语音、音乐、背景噪音和音效。
HKUSTAudio
AudioX是一个统一的扩散变压器模型,可实现任意内容到音频及音乐的生成。它能生成高质量通用音频与音乐作品,提供灵活的自然语言控制,并能无缝处理多种模态输入。
m-a-p
YuE 是一系列开源基础模型,专为音乐生成设计,特别是将歌词转化为完整的歌曲(lyrics2song)。
awsaf49
用于端到端合成歌曲检测的先进模型,能够识别AI生成的完整歌曲(包括人声、音乐、歌词和风格)
Alissonerdx
YuE是一个开创性的开源基础模型系列,专为音乐生成设计,特别是将歌词转化为完整歌曲(lyrics2song)。
Doctor-Shotgun
基于m-a-p/YuE-s1-7B-anneal-en-cot模型使用Exllamav2量化的版本,适用于文本生成任务,特别在音乐相关领域表现良好。
YuE是一系列开源基础模型,专为音乐生成设计,特别是将歌词转化为完整歌曲(lyrics2song)。
FunAudioLLM
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,通过音频分词与自回归变换器及基于流匹配模型相结合,支持高质量长篇幅音频生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,通过音频标记化技术整合自回归变换器与基于流匹配模型,支持高质量长音频生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一工具包,支持高音质和长篇幅音乐生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,支持高音质和长篇幅音乐生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一工具包,具有高音频质量和长篇幅音乐生成能力。
jadechoghari
QAMDT是一种面向文本生成音乐的质量感知扩散模型,通过创新训练技术提升音频保真度和音乐表现力。
WizWhite
这是一个用于生成迷幻风格图像的LoRA模型,融合了迷幻艺术、低俗插画、音乐会海报等多种艺术元素,能创造出独特且有趣的图像效果。
nvidia
BigVGAN 是一款由 NVIDIA 开发的大规模训练的通用神经声码器。它通过对抗性生成网络(GAN)架构,将梅尔频谱图等声学特征转换为高质量、高保真的音频波形。该模型在多种音频类型(如语音、环境声、音乐)上进行了大规模训练,支持多种采样率和配置,以其卓越的音频质量和通用性在语音合成领域表现出色。
ylacombe
基于facebook/musicgen-melody微调的LoRA模型,专注于生成朋克风格音乐
nagayama0706
这是一个通过合并文本生成模型和音乐生成模型创建的混合模型,能够处理文本生成和音乐生成任务。
开源短视频自动生成工具,整合文本转语音、自动字幕、背景视频和音乐,从简单文本输入创建专业短视频。
MIDI MCP服务器是一个通过文本数据生成MIDI音乐文件的工具
一个生产就绪的MCP服务器,通过Strudel.cc实现AI驱动的音乐生成,提供完整的浏览器自动化控制、实时音频分析和模式生成功能
一个基于Python的MCP服务器项目,能与Claude等AI助手协作,根据用户心情或主题生成.m3u格式的本地音乐播放列表,并保存到指定目录。
MusicMCP.AI的官方MCP服务器,通过自然语言指令让AI助手(如Claude)调用先进的AI音乐生成平台,支持灵感模式和自定义模式生成歌曲,并提供余额查询和健康检查功能。
一个基于FastMCP的MIDI服务器,允许LLM通过虚拟MIDI端口向支持MIDI输入的软件发送音符和控制信号。
Emotion Playlist MCP是一个基于MCP的工具,根据用户情绪状态生成Spotify播放列表。它利用Brave搜索和Spotify集成,自动创建符合心情的音乐播放列表。
一个基于MiniMax Music API的MCP服务器实现,用于AI驱动的音乐生成,支持与Claude Desktop无缝集成。
Shorts Video Maker是一个开源工具,用于自动化生成短视频。它结合了文本转语音、自动字幕、背景视频和音乐技术,通过简单文本输入创建吸引人的短视频内容。支持REST API和MCP协议,适用于内容创作者和开发者。