发现与 Multi Modal Knowledge Graph 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
Lobe Chat是一个开源的、采用现代设计的AI聊天框架。支持多种AI提供商(OpenAI/Claude 3/Gemini/Ollama/DeepSeek/Qwen),知识库(文件上传/知识管理/检索增强生成),多模态(插件/构件)和思维链。只需一键即可免费部署您自己的私有ChatGPT/Claude/DeepSeek应用。
多智能体框架:首家AI软件公司,迈向自然语言编程
LlamaIndex 是一个领先的框架,用于基于你的数据构建强大的、由大型语言模型 (LLM) 驱动的智能体。
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
Langchain-Chatchat(原Langchain-ChatGLM)是一个基于Langchain框架,结合ChatGLM、Qwen、Llama等大型语言模型,实现基于检索增强生成(RAG)和智能体(Agent)应用的本地知识库系统。
OpenPose:一个实时多人关键点检测库,可用于人体、面部、手部和脚部姿态估计。
适用于直播和流媒体的跨平台、可定制机器学习解决方案
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
PyTorch 图神经网络库
MiniCPM-o 2.6:一款可在手机上运行的、达到GPT-4o水平的视觉、语音和多模态直播大型语言模型
多模态大型语言模型的最新进展
支持多语言的大型语音生成模型,具备推理、训练和部署的全栈能力。
一个基于现有深度学习框架构建的Python软件包,用于简化图上的深度学习。
CAMEL:寻找智能体的规模定律。首屈一指的、最佳的多智能体框架。 https://www.camel-ai.org
基于PaddlePaddle的目标检测工具包。它支持目标检测、实例分割、多目标跟踪和实时多人关键点检测。
基于CLIP的图像和句子可扩展嵌入、推理和排序
沉浸在深度学习、强化学习、机器学习、计算机视觉和自然语言处理的世界中,通过这些精彩的讲座学习吧!
CLIP 的开源实现
FinRL:金融强化学习
This repository delivers end-to-end, code-first tutorials covering every layer of production-grade GenAI agents, guiding you from spark to scale with proven patterns and reusable blueprints for real-world launches.