Stability AI开源音频生成模型Stable Audio Open:可生成47秒的立体声音频
Stability AI近推出开源音频生成模型Stable Audio Open,能生成最长47秒,采样率44.1kHz,采用开放权重设计,允许用户查阅、修改和扩展,推动科研及开发者创新。使用Creative Commons许可音频训练确保数据合法和道德性。模型技术架构先进,支持高质量立体声生成,多样性和高保真度得到验证,与顶尖模型表现相当。这一工具对研究者、艺术家和开发者极具价值,标志着音频生成领域的重要进展。