ElevenLabs 發佈 Scribe 語音轉文本模型,準確率創新高、英語達 96.7%
ElevenLabs 是一家備受矚目的人工智能語音克隆與生成初創公司,近日推出了其最新的語音轉文本模型 ——Scribe v1。該模型聲稱在多種語言中都達到了最高的準確性,用戶可以通過其官網進行體驗。根據 ElevenLabs 的基準測試,Scribe 在將口語準確轉換爲文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低錯誤率。該公司表示,Scribe 支持99種語言的高精度轉錄,其中包括在以前被忽視的語言,如塞爾維亞語、粵語和馬拉雅拉姆語。ElevenLabs 的首席研究員 Fla