新開源語音識別模型Moonshine:速度比OpenAI Whisper快五倍
美國初創公司 Useful Sensors 推出了一款名爲 Moonshine 的開源語音識別模型。Moonshine 的設計旨在更高效地處理音頻數據,相比於 OpenAI 的 Whisper,它在計算資源的使用上更爲經濟,處理速度快五倍。這一新模型專爲在資源有限的硬件上實現實時應用而打造,具有靈活的架構。與 Whisper 將音頻分爲固定的30秒片段處理不同,Moonshine 根據實際音頻長度調整處理時間。這使得它在處理較短音頻片段時表現出色,減少了由於零填充而產生的處理開銷。Moonshine 有兩個版本:小型的 Tiny 版本參數量爲2710萬,