探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
寻找优质模型提供商,获取可靠模型支持
提交模型信息和服务,精准推广和触达用户
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
通过AI搜索优化服务,让品牌在AI中实现霸屏
发现与 Hubert 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
用于语音转换的HuBERT内容编码器:离散和软语音单元的比较
本项目比较了三种不同的预训练自监督模型:Wav2vec(2019, 2020)、HuBERT(2021)和WavLM(2022),它们都基于英语语音语料库进行预训练。我们将利用这些模型,结合连接时序分类 (CTC) 算法训练的神经网络,对不同语言进行音素识别。
Fast-HuBERT 的官方实现:一种高效的自监督语音表征学习训练框架
一个小型、简单、快速的端到端自动语音识别工具包。
IEEE SLT 2024论文“基于说话人分离HuBERT的自我监督音节发现”的官方代码库
由SoftVC VITS技术支持的翻唱歌曲
使用 Google Colab 测试 SoftVC VITS 歌声转换,这是一个能够在音乐文件中改变歌手的 AI 工具。
无监督口语表达评分
基于Wav2Vec模型的语音关键词检测
这段代码使用了Kaggle上常见的知名数据集,例如多伦多数据集,来创建一个基于人类语音的情感分析模型。这个模型基于Bert模型,被称为Hubert。
Functionality for speech data processing including time alignment, encoding with speech encoders (tokenizers) and data preprocessing of common datasets
基于HuBERT模型,使用PyTorch和HuggingFace框架,并针对RAVDESS数据集进行微调训练的一种语音情感识别实现方案。
用于音频分类的声学Transformer模型
语音克隆Bark HuBERT:通过将模型输出处理成与文本转语音系统兼容的语义标记,实现基于个性化音频样本的语音克隆。
这个项目开发了SynthAVSR,这是第一个针对西班牙语和加泰罗尼亚语的视听语音识别 (AVSR) 系统。SynthAVSR 基于 AV-HuBERT(视听隐藏单元 BERT)模型,利用合成视听数据来弥补这些语言语音识别技术的不足。