发现与 Acm Mm 2023 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调(LLaVA)模型,其能力已达到甚至超越了GPT-4V的水平。
2025年计算机视觉与模式识别会议(CVPR 2025)论文及开源项目集锦
快速将数据和人工智能算法转化为可投入生产的 Web 应用程序。
CVPR 2023论文《SadTalker:学习用于风格化音频驱动单图像说话人动画的真实3D运动系数》
文本和图像到视频生成:CogVideoX(2024)和CogVideo(ICLR 2023)
CodeGeeX:一种开放的多语言代码生成模型(KDD 2023)
这是CVPR 2023会议上排名靠前的论文(前10%)中,作者官方发布的基于PyTorch的代码实现,用于“基于潜在代码优化的属性保持人脸数据集匿名化”。
【NeurIPS 2023】思维树:大型语言模型的深思熟虑问题解决
CVPR 2023 论文《Neuralangelo:高保真神经表面重建》的官方实现
开源大型语言模型可观测性平台,只需一行代码即可监控、评估和实验(Y Combinator 2023 年冬季批次项目)
获得CVPR 2023最佳论文奖的:面向规划的自动驾驶
LightGlue:光速局部特征匹配(ICCV 2023)
SiamMask:快速在线目标跟踪与分割框架(CVPR 2019 / TPAMI 2023)
[CVPR 2023] DepGraph: Towards Any Structural Pruning; LLMs, Vision Foundation Models, etc.
【EMNLP 2023 演示】Video-LLaMA:一款针对视频理解的指令微调视听语言模型
【亚洲SIGGRAPH 2023】重新渲染视频:零样本文本引导的视频到视频转换
阿姆斯特丹大学(人工智能硕士)2023年秋季学期深度学习课程的Jupyter Notebook教程资料库
零样本一张图像到三维物体 (ICCV 2023)
【ICLR 2023】ReAct:语言模型中推理与行动的协同作用
按工具分类整理的数据与人工智能笔记本模板目录,采用输入-模型-输出 (IMO) 框架,方便用户使用和查找。