Stability AI開源音頻生成模型Stable Audio Open:可生成47秒的立體聲音頻
Stability AI近推出開源音頻生成模型Stable Audio Open,能生成最長47秒,採樣率44.1kHz,採用開放權重設計,允許用戶查閱、修改和擴展,推動科研及開發者創新。使用Creative Commons許可音頻訓練確保數據合法和道德性。模型技術架構先進,支持高質量立體聲生成,多樣性和高保真度得到驗證,與頂尖模型表現相當。這一工具對研究者、藝術家和開發者極具價值,標誌着音頻生成領域的重要進展。