最好的Video-LLaVA AI工具模型_精选Video-LLaVA资讯 - AIBase

AI产品

Video-LLaVA

Video-LLaVA

学习联合视觉表示通过对齐前投影

模型

Video Llava

AnasMohamed

基于Vision Transformer架构的大规模视觉语言模型，支持图像与文本的跨模态理解

Gguf

Video LLaVA 7B Hf

LanguageBind

Video-LLaVA是一个开源的多模态模型，通过在多模态指令跟随数据上微调大语言模型进行训练，能够生成交错的图像和视频。

Transformers

Video LLaVA 7B

LanguageBind

Video-LLaVA是一个通过投影前对齐学习统一视觉表征的多模态模型，能够同时处理图像和视频的视觉推理任务。

Transformers

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图