论文《一种用于文本转图和图转文本的多任务半监督框架》的数据集
Stable Diffusion 的网页版界面
Lobe Chat是一个开源的、采用现代设计的AI聊天框架。支持多种AI提供商(OpenAI/Claude 3/Gemini/Ollama/DeepSeek/Qwen),知识库(文件上传/知识管理/检索增强生成),多模态(插件/构件)和思维链。只需一键即可免费部署您自己的私有ChatGPT/Claude/DeepSeek应用。
一个超高速的搜索引擎API,将人工智能驱动的混合搜索功能带到您的网站和应用程序中。
仅仅1分钟的语音数据就能训练出一个不错的语音合成模型!(少量样本语音克隆)
OpenAI Whisper 模型的 C/C++ 端口
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
一个注重隐私、开源的知识管理和协作平台。下载链接:http://github.com/logseq/logseq/releases 路线图:http://trello.com/b/8txSM12G/roadmap
一个用于日常对话的生成式语音模型。
只需5秒钟,AI就能克隆你的声音,并实时生成任何你想要的语音内容。
一款注重隐私、自托管、完全开源的个人知识管理软件,使用TypeScript和Go语言编写。