AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI產品

查看更多
Video-LLaVA

Video-LLaVA

學習聯合視覺表示通過對齊前投影

AI視頻搜索
10.7k

模型

查看更多

Video Llava

AnasMohamed

V

基於Vision Transformer架構的大規模視覺語言模型,支持圖像與文本的跨模態理解

多模態GgufGguf
AnasMohamed
194
0

Video LLaVA 7B Hf

LanguageBind

V

Video-LLaVA是一個開源的多模態模型,通過在多模態指令跟隨數據上微調大語言模型進行訓練,能夠生成交錯的圖像和視頻。

多模態TransformersTransformers
LanguageBind
13.2k
42

Video LLaVA 7B

LanguageBind

V

Video-LLaVA是一個通過投影前對齊學習統一視覺表徵的多模態模型,能夠同時處理圖像和視頻的視覺推理任務。

多模態TransformersTransformers
LanguageBind
2.1k
85
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖