信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

服务

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

Fidelity Speech Synthesis 相关的热门 GitHub AI项目仓库

发现与 Fidelity Speech Synthesis 相关的最受欢迎的开源项目和工具，了解最新的开发趋势和创新。

Transformers

Hot

bert

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

153615

2年前

+136today

GPT SoVITS

Hot

text-to-speech

仅仅1分钟的语音数据就能训练出一个不错的语音合成模型！（少量样本语音克隆）

52892

5天前

+87today

Whisper.Cpp

Hot

inference

OpenAI Whisper 模型的 C/C++ 端口

44989

5天前

+81today

TTS

Hot

deep-learning

??：一个用于语音合成的深度学习工具包，经过研究和生产环境的实战检验

43779

2个月前

+69today

ChatTTS

一个用于日常对话的生成式语音模型。

MockingBird

只需5秒钟，AI就能克隆你的声音，并实时生成任何你想要的语音内容。

36799

6天前

+3today

OpenVoice

text-to-speech

麻省理工学院和MyShell公司研发的即时语音克隆技术，基于音频基础模型。

35599

5天前

+21today

So Vits Svc

软VC VITS歌声转换

27844

5天前

+9today

DeepSpeech

deep-learning

DeepSpeech是一个开源的嵌入式（离线，设备端）语音转文本引擎，它可以在从树莓派4到高性能GPU服务器等各种设备上实时运行。

26674

1年前

+6today

Datasets

computer-vision

最大的机器学习模型即用型数据集中心，提供快速、易用且高效的数据处理工具

20962

3周前

+19today

WhisperX

asr

WhisperX：带单词级时间戳（和说话人识别）的自动语音识别

19085

5天前

+35today

CosyVoice

Hot

audio-generation

支持多语言的大型语音生成模型，具备推理、训练和部署的全栈能力。

17548

5天前

+55today

Grounded Segment Anything

3d-whole-body-pose-estimation

落地SAM：融合DINO、Segment Anything、Stable Diffusion和Recognize Anything，实现自动检测、分割和生成任何物体

17209

5天前

+8today

Leon

Leon 是一款开源的个人助理。

16827

5天前

-1today

NeMo

asr

一个可扩展的生成式AI框架，专为从事大型语言模型、多模态和语音AI（自动语音识别和文本转语音）研究和开发的科研人员和开发者而设计。

16245

2年前

+18today

Pyvideotrans

speech-to-text

把视频从一种语言翻译成另一种语言，并配上配音。这个过程包括语音识别转录、语音合成和字幕翻译。

15485

5天前

+44today

Kaldi

c-plus-plus

Kaldi语音识别工具的官方项目地址是kaldi-asr/kaldi。

15257

5天前