发现与 Noise Suppression 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
视频、图片和GIF的超分辨率放大(超清重建)以及视频帧率插值。技术基于Waifu2x、Real-ESRGAN、Real-CUGAN、RTX Video Super Resolution VSR、SRMD、RealSR、Anime4K、RIFE、IFRNet、CAIN、DAIN和ACNet等算法。
用于音频降噪的循环神经网络
基于深度滤波的降噪
QualityScaler - 一款AI图像/视频超分辨率应用
一些流行且可复现的图像去噪方法的集合。
一份包含95多个语音和声音计算开源数据集的完整列表。
《图2vec:学习图的分布式表示》的并行实现(MLGWorkshop 2017)
基于卷积神经网络的音频分割工具包。可以检测语音、音乐、噪声和说话人性别。专为基于性别语音时长的大规模性别平等研究而设计。
基于TensorFlow 2.x 的实时语音降噪模型DTLN 的实现,支持TF-Lite、ONNX和实时音频处理。
基于PyTorch的“FullSubNet:一种用于实时单通道语音增强的全频带和子频带融合模型”的实现
Deep Xi:一种基于TensorFlow 2/Keras实现的深度学习先验信噪比估计方法,用于语音增强和鲁棒性语音识别。
用于 YOLO 小目标检测和实例分割的 Python 库
深度学习框架中的可复现性
RealScaler - 一款基于AI的图像/视频超分辨率应用 (Real-ESRGAN)
实验代码:语音文件预处理,优化 Whisper 转录,避免出现幻听文本
面向近似噪声中尺度量子计算时代的基于张量网络的量子软件框架
如何用R-CNN算法实现目标检测
本文档是INTERSPEECH 2021会议论文“无需干净训练数据进行语音降噪:一种Noise2Noise方法”的源代码。该论文解决了深度学习语音降噪方法严重依赖干净语音数据的难题,证明了仅使用噪声语音样本即可训练深度语音降噪网络。
基于批归一化深度卷积神经网络的图像去噪(神经网络,2020)
基于极值区域 (ER) 的场景文本检测与识别