发现与 Multi Armed Bandit 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
多智能体框架:首家AI软件公司,迈向自然语言编程
LlamaIndex 是一个领先的框架,用于基于你的数据构建强大的、由大型语言模型 (LLM) 驱动的智能体。
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
OpenPose:一个实时多人关键点检测库,可用于人体、面部、手部和脚部姿态估计。
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
MiniCPM-o 2.6:一款可在手机上运行的、达到GPT-4o水平的视觉、语音和多模态直播大型语言模型
多模态大型语言模型的最新进展
支持多语言的大型语音生成模型,具备推理、训练和部署的全栈能力。
CAMEL:寻找智能体的规模定律。首屈一指的、最佳的多智能体框架。 https://www.camel-ai.org
基于PaddlePaddle的目标检测工具包。它支持目标检测、实例分割、多目标跟踪和实时多人关键点检测。
基于CLIP的图像和句子可扩展嵌入、推理和排序
CLIP 的开源实现
FinRL:金融强化学习
This repository delivers end-to-end, code-first tutorials covering every layer of production-grade GenAI agents, guiding you from spark to scale with proven patterns and reusable blueprints for real-world launches.
AI 数据库。存储向量、图像、文本、视频等。与大型语言模型 (LLM)/LangChain 配合使用。存储、查询、版本控制和可视化任何 AI 数据。实时将数据流传输到 PyTorch/TensorFlow。https://activeloop.ai
CVPR 2024录用(口头报告)InternVL家族:GPT-4o的开创性开源替代方案,性能逼近GPT-4o的多模态对话模型
精选机器学习、自然语言处理、计算机视觉和推荐系统项目创意列表
ModelScope:让模型即服务(Model-as-a-Service)成为现实。
EmotiVoice:一款支持多音色和提示控制的文本转语音引擎
BoxMOT:适用于分割、目标检测和姿态估计模型的先进可插拔跟踪模块