不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
发现与 Multi Modal Ner 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
多智能体框架:首家AI软件公司,迈向自然语言编程
LlamaIndex 是一个领先的框架,用于基于你的数据构建强大的、由大型语言模型 (LLM) 驱动的智能体。
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
OpenPose:一个实时多人关键点检测库,可用于人体、面部、手部和脚部姿态估计。
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
MiniCPM-o 2.6:一款可在手机上运行的、达到GPT-4o水平的视觉、语音和多模态直播大型语言模型
多模态大型语言模型的最新进展
支持多语言的大型语音生成模型,具备推理、训练和部署的全栈能力。
基于PaddlePaddle的目标检测工具包。它支持目标检测、实例分割、多目标跟踪和实时多人关键点检测。
CAMEL:寻找智能体的规模定律。首屈一指的、最佳的多智能体框架。 https://www.camel-ai.org
基于CLIP的图像和句子可扩展嵌入、推理和排序
CLIP 的开源实现
FinRL:金融强化学习
AI 数据库。存储向量、图像、文本、视频等。与大型语言模型 (LLM)/LangChain 配合使用。存储、查询、版本控制和可视化任何 AI 数据。实时将数据流传输到 PyTorch/TensorFlow。https://activeloop.ai
CVPR 2024录用(口头报告)InternVL家族:GPT-4o的开创性开源替代方案,性能逼近GPT-4o的多模态对话模型
精选机器学习、自然语言处理、计算机视觉和推荐系统项目创意列表
EmotiVoice:一款支持多音色和提示控制的文本转语音引擎
ModelScope:让模型即服务(Model-as-a-Service)成为现实。
BoxMOT:适用于分割、目标检测和姿态估计模型的先进可插拔跟踪模块
一个最先进的开放式视觉语言模型