AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

aiOla推超高速开源语音识别模型Whisper-Medusa,比OpenAI的Whisper快50%

以色列AI初创公司aiOla发布了一款名为Whisper-Medusa的开源语音识别模型,比OpenAI的Whisper快50%。该模型基于Whisper构建,采用了创新的“多头注意力”架构,能一次预测更多代币,速度提升显著而准确性不变。Whisper-Medusa已在Hugging Face上以麻省理工学院许可发布,允许研究和商业使用。aiOla通过弱监督机器学习方法训练模型,冻结了Whisper的主要组件,并使用模型生成的音频转录作为标签来训练额外的token预测模块。该模型在真实企业数据用例上测试过,能在实际场景准确运行,有望在语音应用中加快响应速度,提升效率和降低成本。

14.5k 11-07
aiOla推超高速开源语音识别模型Whisper-Medusa,比OpenAI的Whisper快50%
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图