不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
发现与 Voice Recognition 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Silero VAD:预训练的企业级语音活动检测器
一个接近实时的OpenAI Whisper模型实现。
STT:一款基于深度学习的语音转文本工具包。训练和部署语音转文本模型从未如此简单。
用于自动语音识别 (ASR)、文本转语音 (TTS) 和其他语音技术的可访问语音语料库列表
该项目使用了多种先进的声纹识别模型,例如ECapa-TDNN、ResNetSE、ERes2Net、CAM++等,未来还可能支持更多模型。同时,该项目也支持Mel谱图和普通谱图这两种数据预处理方法。
一款轻量级、易于使用的基于循环神经网络 (RNN) 的唤醒词监听器
将ChatGPT语音聊天功能作为你的设备语音助手
一套易于使用的本地部署AI语音工具箱,支持语音识别、语音转录、语音转换等功能。
语音转文本基准测试框架
基于深度学习的设备内置语音助手平台
适用于 Node.js 的离线语音唤醒关键词检测语音转文本 (STT) 功能
本视频将教你如何使用Alan AI构建一个基于React框架、支持语音对话控制的新闻应用。Alan AI是一款革命性的语音识别软件,能为你的应用添加语音功能。
基于深度学习的设备端语音转文字引擎
我的博客文章“在iOS上开始使用TensorFlow”的源代码
VOSK语音识别工具包
一个Home Assistant自定义组件,能让你的几乎任何摄像头和扬声器都变成本地语音助手
Mantella 是一款适用于《上古卷轴5:天际》和《辐射4》的MOD,它允许你利用语音识别(Whisper)、大型语言模型(LLM,文本生成)和语音合成器(Piper/xVASynth/XTTS)与游戏NPC进行自然对话。
就像与ChatGPT进行语音对话一样,但完全离线、私密且保护商业机密,使用本地AI模型,例如Llama 2和Whisper。
自动语音识别 (ASR) 的训练模型。一个快速构建需要语音转文本转换应用的库。
该技术能够复制 YouTube 视频中说话人的声音,并用不同的语言重新创作该视频。