不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
WhisperX 自动语音识别 Dockerfile:包含单词级时间戳和说话人分段功能(包含 Dockerfile、持续集成镜像构建和测试)
WhisperX:带单词级时间戳(和说话人识别)的自动语音识别
一个可扩展的生成式AI框架,专为从事大型语言模型、多模态和语音AI(自动语音识别和文本转语音)研究和开发的科研人员和开发者而设计。
一个并发、缓存高效且与Dockerfile无关的构建工具包
悟空机器人是一个简单易用、功能灵活、设计优雅的中文语音对话机器人/智能音箱项目。它支持与ChatGPT进行多轮对话,并且可能是首个支持脑机交互的开源智能音箱项目。
几秒钟内即可设置和定制深度学习环境。
本仓库已被存档,并迁移至新的仓库:https://github.com/dragonflyoss/Dragonfly2
离线语音识别、语音合成、说话人分隔、语音增强和语音活动检测,基于下一代Kaldi和ONNX Runtime实现,无需网络连接。支持嵌入式系统、Android、iOS、鸿蒙OS、树莓派、RISC-V、x86_64服务器以及WebSocket服务器/客户端,并支持11种编程语言。
多语言语音理解模型
Nexa SDK是一个全面的工具包,支持GGML和ONNX模型。它支持文本生成、图像生成、视觉语言模型(VLM)、音频语言模型、自动语音识别(ASR)和文本转语音(TTS)功能。
端到端语音识别工具包:首发版及生产就绪版