不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
发现与 Transcription 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
人工智能可穿戴设备。戴上它,说话,转录,自动完成。
面向创作者和开发者的 Gradio 可视化界面,集成了关键的文本转语音技术(Edge-TTS、kokoro)和零样本语音克隆功能(E2E、F5-TTS、CosyVoice),并包含 Whisper 音频处理、RVC 变声器、YouTube 下载、UVR5 人声分离以及多语言翻译功能。
使用网页界面,完全本地化地将任何音频转录成文本,翻译和编辑字幕。由 Whisper 模型驱动!
Rust语言开发的,可即时控制、本地部署的预训练AI模型
一款用于朗读音频的编辑器,具有自动转录功能
Whisper开源语音识别系统优秀资源列表——来自OpenAI
这是一款图形界面工具,能够将视频音频转换成字幕,并生成 SRT 文件。无需使用第三方 API,它利用基于 Transformer 的视频字幕生成框架,在本地完成音频转文本的过程。
可自行托管的离线转录和说话人分段服务,并支持大语言模型摘要
一款开源的 iOS 应用,让高质量语音转录在移动设备上更容易实现。
几秒钟内即可从视频中生成字幕、摘要和章节
自托管AI语音转录
提供用户友好的界面,利用Open AI的Whisper技术生成音频和视频内容的字幕,并自动翻译,同时集成yt-dlp实现视频自动下载。
尖端的AI技术,实现音频自动转录。拥有友好的图形界面,整合了OpenAI的Whisper模型(语音转文字)和pyannote库(说话人识别)
精确的自动语音识别,具有改进的词级别时间戳和填充词检测
Swift音频转录最简单的方法
轻松为您的视频添加 AI 生成的字幕
macOS 系统的命令行语音识别和转录功能
基于深度学习的设备端语音转文字引擎
基于OpenAI Whisper和TensorFlow Lite的安卓离线语音识别
语音人工智能工具包