苹果CarPlay第三方应用扩展,新增全音频应用Uno,用户无需专业知识,输入文字提示即可生成完整音乐。界面分“库”和“探索区”,前者管理个人生成音乐,后者发现他人创建的播放列表和曲目。
全球顶级唱片公司与AI音乐初创企业Suno就AI生成音乐的版权许可谈判陷入僵局,双方在保护艺术家权益方面存在分歧,目前尚无明确解决方案。
ElevenLabs发布iOS应用ElevenMusic,进军AI音乐创作与社交领域。用户可通过自然语言提示生成定制音乐,调整曲目长度、歌词和艺术风格。应用还整合流媒体社交功能,提供实时电台、预设专辑和基于喜好的音乐发现,与Suno、Udio等平台展开竞争。
Suno发布v5.5版本,核心转向增强用户控制权,推出“声音”、“自定义模型”和“我的品味”三大功能,推动AI音乐创作向深度个性化定制迈进。
21种AI音乐工具集于一体,免费开启,由Suno V5驱动,创作各类音乐。
Suno AI可免费快速创建多风格、独特的高品质AI歌曲和音乐。
Suno V5 AI是先进音乐生成平台,可生成8分钟内专业级歌曲,精准识别曲风。
基于Suno V5功能,风格与歌词联动,极速生成高质量音乐,支持免费试用。
walterheart
Bark是由Suno创建的基于Transformer的文本转音频模型,可生成高度逼真的多语言语音、音乐、背景噪音和音效。
Felguk
该模型用于将音频片段分类为'Suno'音乐或'People'音乐。
nvidia
由NVIDIA NeMo和Suno.ai联合开发的英语语音识别模型,支持标点符号和大小写转换,采用FastConformer-TDT-CTC架构
Parakeet TDT-CTC 1.1B 是一个自动语音识别模型,能够转录带有标点和大小写的英文语音,由NVIDIA NeMo和Suno.ai联合开发。
Parakeet TDT 1.1B是由NVIDIA NeMo和Suno.ai联合开发的自动语音识别(ASR)模型,能够将语音转录为小写英文字母。
Parakeet CTC 0.6B是由NVIDIA NeMo和Suno.ai联合开发的自动语音识别模型,基于FastConformer架构,拥有约6亿参数,支持英语语音转录。
Parakeet RNNT 0.6B 是由 NVIDIA NeMo 和 Suno.ai 联合开发的自动语音识别模型,基于 FastConformer 架构,拥有约 6 亿参数,专门用于将英语语音转录为文本。
Parakeet CTC 1.1B是由NVIDIA NeMo和Suno.ai联合开发的自动语音识别模型,基于FastConformer架构,拥有约11亿参数,支持英语语音转录。
Parakeet RNNT 1.1B是由NVIDIA NeMo和Suno.ai联合开发的自动语音识别模型,基于FastConformer Transducer架构,参数约11亿,支持英语语音转录。
suno
Bark是由Suno开发的基于Transformer的多语言文本转音频模型,能生成逼真语音、音乐及非语言声音
ylacombe
Bark是由Suno创建的基于Transformer的文本转音频模型,能生成高度逼真的多语言语音、音乐、背景噪音和简单音效。