快手可灵AI发布数字人模型Avatar2.0,用户仅需提供一张照片和一段音乐,即可生成长达5分钟的唱歌视频。该模型显著提升了数字人的表现力,使其能够自然展现表情和肢体动作,告别僵硬“对口型”模式。这标志着AI内容创作从静态向动态叙事的重大进步。
昆仑万维发布Mureka V7.6和O2模型,推动AI音乐创作发展。新模型优化用户体验和生成效果,引发全球关注。自3月底O1和V6模型上线后,平台新增近700万用户,覆盖超100个国家。持续迭代的V7系列进一步提升了服务能力。
巨人网络AI Lab联合清华大学、西北工业大学发布三项音视频多模态生成技术:YingVideo-MV(音乐驱动视频生成)、YingMusic-SVC(零样本歌声转换)和YingMusic-Singer(歌声合成)。这些技术将开源,其中YingVideo-MV仅需音乐和人物图像即可生成视频。
华纳音乐与AI公司Udio达成和解并签署许可协议,计划2026年推出AI音乐创作平台。该平台将使用授权音乐训练的生成式AI模型,旨在为艺术家和创作者提供新收入来源,同时保障版权。
GPTunneL提供多模型AI服务,可生成文本、图像等,支持多方式支付。
Aivvid AI是一体化AI创意平台,可生成视频、图像、音乐和配音。
免费AI生成器中心,50+模型在线创作图像、视频和音乐
MusicArt AI免费音乐生成器,可创作情感原创歌曲,融合创意与智能。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
ACE-Step
一个混合说唱声线模型,专注于提升中文说唱/嘻哈音乐的生成质量
calcuis
ACE-Step-v1-3.5B是一个文本转音频模型,支持高质量音频生成,适用于音乐和声音效果创作。
walterheart
Bark是由Suno创建的基于Transformer的文本转音频模型,可生成高度逼真的多语言语音、音乐、背景噪音和音效。
HKUSTAudio
AudioX是一个统一的扩散变压器模型,可实现任意内容到音频及音乐的生成。它能生成高质量通用音频与音乐作品,提供灵活的自然语言控制,并能无缝处理多种模态输入。
m-a-p
YuE 是一系列开源基础模型,专为音乐生成设计,特别是将歌词转化为完整的歌曲(lyrics2song)。
awsaf49
用于端到端合成歌曲检测的先进模型,能够识别AI生成的完整歌曲(包括人声、音乐、歌词和风格)
Alissonerdx
YuE是一个开创性的开源基础模型系列,专为音乐生成设计,特别是将歌词转化为完整歌曲(lyrics2song)。
Doctor-Shotgun
基于m-a-p/YuE-s1-7B-anneal-en-cot模型使用Exllamav2量化的版本,适用于文本生成任务,特别在音乐相关领域表现良好。
YuE是一系列开源基础模型,专为音乐生成设计,特别是将歌词转化为完整歌曲(lyrics2song)。
FunAudioLLM
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,通过音频分词与自回归变换器及基于流匹配模型相结合,支持高质量长篇幅音频生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,通过音频标记化技术整合自回归变换器与基于流匹配模型,支持高质量长音频生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一工具包,支持高音质和长篇幅音乐生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一框架,支持高音质和长篇幅音乐生成。
InspireMusic是一个专注于音乐生成、歌曲生成和音频生成的统一工具包,具有高音频质量和长篇幅音乐生成能力。
jadechoghari
QAMDT是一种面向文本生成音乐的质量感知扩散模型,通过创新训练技术提升音频保真度和音乐表现力。
WizWhite
这是一个用于生成迷幻风格图像的LoRA模型,融合了迷幻艺术、低俗插画、音乐会海报等多种艺术元素,能创造出独特且有趣的图像效果。
ylacombe
基于facebook/musicgen-melody微调的LoRA模型,专注于生成朋克风格音乐
nagayama0706
这是一个通过合并文本生成模型和音乐生成模型创建的混合模型,能够处理文本生成和音乐生成任务。
nateraw
基于musicgen-stereo-melody-large微调的文本转音频模型,专为音乐制作人设计,可生成32kHz立体声音频的歌曲创意
开源短视频自动生成工具,整合文本转语音、自动字幕、背景视频和音乐,从简单文本输入创建专业短视频。
MIDI MCP服务器是一个通过文本数据生成MIDI音乐文件的工具
一个生产就绪的MCP服务器,通过Strudel.cc实现AI驱动的音乐生成,提供完整的浏览器自动化控制、实时音频分析和模式生成功能
一个基于Python的MCP服务器项目,能与Claude等AI助手协作,根据用户心情或主题生成.m3u格式的本地音乐播放列表,并保存到指定目录。
MusicMCP.AI的官方MCP服务器,通过自然语言指令让AI助手(如Claude)调用先进的AI音乐生成平台,支持灵感模式和自定义模式生成歌曲,并提供余额查询和健康检查功能。
一个基于FastMCP的MIDI服务器,允许LLM通过虚拟MIDI端口向支持MIDI输入的软件发送音符和控制信号。
Emotion Playlist MCP是一个基于MCP的工具,根据用户情绪状态生成Spotify播放列表。它利用Brave搜索和Spotify集成,自动创建符合心情的音乐播放列表。
一个基于MiniMax Music API的MCP服务器实现,用于AI驱动的音乐生成,支持与Claude Desktop无缝集成。
Shorts Video Maker是一个开源工具,用于自动化生成短视频。它结合了文本转语音、自动字幕、背景视频和音乐技术,通过简单文本输入创建吸引人的短视频内容。支持REST API和MCP协议,适用于内容创作者和开发者。