发现与 Ijcai 2024 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
统一高效微调100多个大型语言模型和视觉语言模型 (ACL 2024)
2025年计算机视觉与模式识别会议(CVPR 2025)论文及开源项目集锦
SWE-agent 能够利用 GPT-4 或你选择的语言模型,自动修复 GitHub 上的代码问题。它还可以用于具有攻击性的网络安全或编程竞赛挑战。(NeurIPS 2024)
极市团队整理的CVPR 2017-2024论文、代码、解读和直播合集
文本和图像到视频生成:CogVideoX(2024)和CogVideo(ICLR 2023)
CVPR 2024录用(口头报告)InternVL家族:GPT-4o的开创性开源替代方案,性能逼近GPT-4o的多模态对话模型
【ECCV 2024】论文《Grounding DINO:将DINO与基于语义理解的预训练相结合用于开集目标检测》的官方实现代码
NeurIPS 2024最佳论文候选![GPT超越扩散模型?][视觉生成中的缩放规律?] 这是论文“视觉自回归建模:基于下一尺度预测的可扩展图像生成”的官方实现代码。这是一个*极其简单、用户友好且达到最先进水平*的自回归图像生成代码库!
面向数据和机器学习团队的无服务器 AI 工作流
开放智能体:一个面向真实世界的开放式语言智能体平台(COLM 2024)
【ECCV 2024】DiffBIR 代码:基于生成扩散先验的盲图像恢复方法
【EMNLP 2024?】Video-LLaVA:基于投影前对齐学习统一视觉表示
CVPR 2024 亮点:视频理解版 ChatGPT!支持更多大型语言模型,例如 miniGPT4、StableLM 和 MOSS。
《IEEE模式分析与机器智能汇刊(T-PAMI)2024》论文:端到端自动驾驶所需的一切
精选的大型语言模型、Text2SQL、Text2DSL、Text2API、Text2Vis 等技术的教程和资源。
DreamCraft3D(ICLR 2024):基于自举扩散先验的分层三维生成模型的官方实现
【CVPR 2024】基于四维高斯 splatting 的实时动态场景渲染
【CVPR 2024 口头报告,最佳论文候选】Marigold:将基于扩散的图像生成器重新用于单目深度估计
CVPR 2024论文《SuGaR:用于高效三维网格重建和高质量网格渲染的表面对齐高斯散射》的官方PyTorch实现
LongLoRA和LongAlpaca的代码和论文(ICLR 2024 口头报告)