IJCAI 2021会议论文“Audio2Head:基于音频的单次自然头部运动谈话头像生成”的代码
Dear ImGui:一款轻量级、无膨胀的C++图形用户界面库,依赖项极少
多智能体框架:首家AI软件公司,迈向自然语言编程
LlamaIndex 是一个领先的框架,用于基于你的数据构建强大的、由大型语言模型 (LLM) 驱动的智能体。
??:一个用于语音合成的深度学习工具包,经过研究和生产环境的实战检验
自动化构建和发布 iOS 和 Android 应用最简单的方法
OpenPose:一个实时多人关键点检测库,可用于人体、面部、手部和脚部姿态估计。
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
2025年计算机视觉与模式识别会议(CVPR 2025)论文及开源项目集锦
MiniCPM-o 2.6:一款可在手机上运行的、达到GPT-4o水平的视觉、语音和多模态直播大型语言模型
专为 Kubernetes 多云、数据中心和边缘管理定制的容器平台