AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航 MCP

Vision Language Model 相关的热门 GitHub AI项目仓库

发现与 Vision Language Model 相关的最受欢迎的开源项目和工具，了解最新的开发趋势和创新。

LLaVA

chatbot

在NeurIPS 2023大会上以口头报告形式发表的视觉指令微调（LLaVA）模型，其能力已达到甚至超越了GPT-4V的水平。

22335

3个月前

+21today

InternVL

Hot

gpt

CVPR 2024录用（口头报告）InternVL家族：GPT-4o的开创性开源替代方案，性能逼近GPT-4o的多模态对话模型

7918

1个月前

+52today

DeepSeek VL

foundation-models

DeepSeek-VL：迈向真实的视觉语言理解

3804

1个月前

+4today

Align Anything

万物皆可对齐：基于反馈训练全模态模型

MGM

generation

「Mini-Gemini：挖掘多模态视觉语言模型的潜力」项目的官方代码库

3270

2年前

InternLM XComposer

chatgpt

InternLM-XComposer2.5-OmniLive：一个用于长期流式视频和音频交互的综合多模态系统

2818

1个月前

+1today

VLM_survey

超棒的视觉语言模型合集，用于视觉任务

Colpali

colpali

用于训练和运行 ColVision 模型（例如 ColPali、ColQwen2 和 ColSmol）的代码。

1776

1个月前

+7today

Prismer

image-captioning

「Prismer：一种具有多任务专家的视觉语言模型」的实现

1310

2个月前

Mlx Vlm

apple-silicon

MLX-VLM 是一个软件包，允许您在 Mac 上使用 MLX 来进行视觉语言模型 (VLM) 的推理和微调。

1215

1个月前

+9today

ShowUI

agent

【CVPR 2025】开源端到端视觉-语言-动作模型，用于图形用户界面代理和计算机使用。

1210

1个月前

+3today

Chat UniVi

image-understanding

【CVPR 2024 亮点？】Chat-UniVi：统一的视觉表征赋能大型语言模型进行图像和视频理解

934

1个月前

+1today

Ovis

chatbot

一种新颖的多模态大型语言模型 (MLLM) 架构，旨在结构化地对齐视觉和文本嵌入。

898

1个月前

+1today

GroundingLMM

foundation-models

【CVPR 2024？】大型多模态模型接地（GLaMM）是首个能够生成与目标分割掩码无缝集成的自然语言响应的模型。

867

1个月前

+1today

AlphaCLIP

deep-learning

CVPR 2024论文：Alpha-CLIP：一种专注于你想要目标区域的CLIP模型

810

1个月前

+1today

Awesome Vlm Architectures

著名的视觉语言模型及其架构

Describe Anything

Hot

describe-anything

任意内容描述的实现：详细的本地化图像和视频字幕

710

1个月前

+162today

VisRAG

document-retrieval

无需解析的，由大型语言模型支持的检索增强生成

687

1个月前

+3today

VoxPoser

embodied-ai

VoxPoser：用于机器人操作的组合式3D值图和语言模型

679

1个月前

+3today

Qwen2 VL Finetune

chatbot

阿里云开源的Qwen2-VL和Qwen2.5-VL系列模型微调实现方案。

676

1个月前

+11today

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

Vision Language Model 相关的热门 GitHub AI项目仓库

LLaVA

InternVL

DeepSeek VL

Align Anything

MGM

InternLM XComposer

VLM_survey

Colpali

Prismer

Mlx Vlm

ShowUI

Chat UniVi

Ovis

GroundingLMM

AlphaCLIP

Awesome Vlm Architectures

Describe Anything

VisRAG

VoxPoser

Qwen2 VL Finetune