不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
发现与 Faster Whisper 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
OpenAI Whisper 模型的 C/C++ 端口
开放式MMLab目标检测工具箱和基准测试
使用CTranslate2加速Whisper语音转录
WhisperX:带单词级时间戳(和说话人识别)的自动语音识别
Buzz可以在你的个人电脑上离线转录和翻译音频,它由OpenAI的Whisper技术驱动。
基于PaddlePaddle的目标检测工具包。它支持目标检测、实例分割、多目标跟踪和实时多人关键点检测。
简单易用的语音工具包,包含自监督学习模型、具有标点符号的先进/流式语音识别、带文本前端的流式语音合成、说话人识别系统、端到端语音翻译和关键词识别功能。荣获NAACL2022最佳演示奖。
一个基础的端到端语音识别工具包和开源的SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。
OpenAI 的 ChatGPT、GPT-3、GPT-4、DALL·E 以及 Whisper API 的 Go 语言封装库
TensorFlow 2.x 版本的教程和示例,涵盖卷积神经网络 (CNN)、循环神经网络 (RNN)、生成对抗网络 (GAN)、自动编码器、Faster R-CNN、GPT 和 BERT 等模型的示例代码及实战教程。
One UI界面完全由ChatGPT网页版、Midjourney、GPTs、Suno、Luma、Runway、Viggle、Flux、Ideogram、Realtime、Pika和Udio等工具制作完成;同时支持网页端、PWA、Linux、Windows和MacOS平台。
飞书结合GPT-4、GPT-4V、DALL·E 3和Whisper,带来飞一般的办公体验!你可以体验语音对话、角色扮演、多主题讨论、图片创作、表格分析和文档导出等功能。
苹果硅芯片上的设备语音识别
基于OpenAI Whisper的带说话人分段的自动语音识别
端到端语音识别工具包:首发版及生产就绪版
在TPU上,使用JAX实现的OpenAI Whisper模型,速度提升可达70倍。
Nexa SDK是一个全面的工具包,支持GGML和ONNX模型。它支持文本生成、图像生成、视觉语言模型(VLM)、音频语言模型、自动语音识别(ASR)和文本转语音(TTS)功能。
一个基于Whisper模型反向构建的开源文本转语音系统。
面向创作者和开发者的 Gradio 可视化界面,集成了关键的文本转语音技术(Edge-TTS、kokoro)和零样本语音克隆功能(E2E、F5-TTS、CosyVoice),并包含 Whisper 音频处理、RVC 变声器、YouTube 下载、UVR5 人声分离以及多语言翻译功能。
AI 赋能的 Mac 应用,助你攻克技术面试