探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
企业级监测平台,全域追踪品牌在 12+ AI 平台的表现
输入品牌生成综合健康度得分,快速定位整体位置与短板
单次提问,立刻看到品牌在多个 AI 平台回答中的排名
批量问题 × 定频GEO排名查询 长期追踪排名变化曲线
挖出用户会问 AI 的高热度问题,决定做哪些内容
追踪投放的推广链接,评估哪些渠道真正被 AI 引用
拥有属于自己的GEO系统,助您成为专业GEO优化服务商
通过AI搜索优化服务,让品牌在AI中实现霸屏
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
国内外主流大模型的统一API接入与调用服务
涵盖各类AI模型,满足你的开发与研究需求
寻找优质模型提供商,获取可靠模型支持
热门AI大模型性能、热度、年/月/日排行
帮助检测挑选可以放心使用的大模型中转站
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Kaldi 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Kaldi语音识别工具的官方项目地址是kaldi-asr/kaldi。
适用于Android、iOS、树莓派和服务器的离线语音识别API,支持Python、Java、C#和Node.js。
端到端语音处理工具包
离线语音识别、语音合成、说话人分隔、语音增强和语音活动检测,基于下一代Kaldi和ONNX Runtime实现,无需网络连接。支持嵌入式系统、Android、iOS、鸿蒙OS、树莓派、RISC-V、x86_64服务器以及WebSocket服务器/客户端,并支持11种编程语言。
PyTorch-Kaldi项目致力于开发最先进的DNN/RNN混合语音识别系统。其中,深度神经网络(DNN)部分由PyTorch管理,而特征提取、标签计算和解码则由Kaldi工具包完成。
无需网络连接,使用新一代Kaldi和ncnn实现实时语音识别和语音活动检测(VAD)。支持iOS、Android、Linux、macOS、Windows、树莓派、VisionFive2、LicheePi4A等多种平台。
基于Ubuntu的Linux发行版的开源虚拟助手
基于Vosk和Kaldi库的WebSocket、gRPC和WebRTC语音识别服务器
机器学习项目中用于处理语音数据的工具
基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器
使用Vosk库进行安卓离线语音识别
Espresso:一款快速端到端神经网络语音识别工具包
语音处理中的中文文本规范化
语音识别的理论基础、相关研究论文以及演示文稿
一个基于 WebAssembly 构建的 Vosk 语音识别库,可在浏览器中运行。
开放用于无云自动语音识别的工具和数据
集成在Kaldi语音识别系统中的语音增强工具
语音对齐器是一种工具,它可以根据人类语音及其对应的文字转录,生成音素级别的语音时间对齐标注。
基于Kaldi的韩国语自动语音识别(ASR)开源项目
在解码时,动态启用/禁用语法的Python Kaldi语音识别