docker-whisperX

Public

WhisperX 自动语音识别 Dockerfile：包含单词级时间戳和说话人分段功能（包含 Dockerfile、持续集成镜像构建和测试）

asr docker-image dockerfile speech speech-recognition speech-to-text whisper

创建时间：2023-08-26T19:59:17

更新时间：2025-04-27T15:36:32

270

Stars

Stars Increase

相关项目

WhisperX

asr

WhisperX：带单词级时间戳（和说话人识别）的自动语音识别

15212

3周前

+47today

NeMo

asr

一个可扩展的生成式AI框架，专为从事大型语言模型、多模态和语音AI（自动语音识别和文本转语音）研究和开发的科研人员和开发者而设计。

13742

2年前

+26today

Buildkit

builder

一个并发、缓存高效且与Dockerfile无关的构建工具包

8675

4周前

+5today

Wukong Robot

悟空机器人是一个简单易用、功能灵活、设计优雅的中文语音对话机器人/智能音箱项目。它支持与ChatGPT进行多轮对话，并且可能是首个支持脑机交互的开源智能音箱项目。

6806

3周前

+4today

Deepo

caffe

几秒钟内即可设置和定制深度学习环境。

6298

1个月前

Dragonfly Archived

cloud-native

本仓库已被存档，并迁移至新的仓库：https://github.com/dragonflyoss/Dragonfly2

5975

1个月前

Sherpa Onnx

aarch64

离线语音识别、语音合成、说话人分隔、语音增强和语音活动检测，基于下一代Kaldi和ONNX Runtime实现，无需网络连接。支持嵌入式系统、Android、iOS、鸿蒙OS、树莓派、RISC-V、x86_64服务器以及WebSocket服务器/客户端，并支持11种编程语言。

5770

3周前

+30today

SenseVoice

多语言语音理解模型

5478

1个月前

+26today

Nexa Sdk

asr

Nexa SDK是一个全面的工具包，支持GGML和ONNX模型。它支持文本生成、图像生成、视觉语言模型（VLM）、音频语言模型、自动语音识别（ASR）和文本转语音（TTS）功能。

4519

3周前

+8today

Wenet

端到端语音识别工具包：首发版及生产就绪版

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

docker-whisperX

相关项目

WhisperX

NeMo

Buildkit

Wukong Robot

Deepo

Dragonfly Archived

Sherpa Onnx

SenseVoice

Nexa Sdk

Wenet