最好的Video-LLaVA AI工具模型_精選Video-LLaVA資訊 - AIBase

AI產品

Video-LLaVA

Video-LLaVA

學習聯合視覺表示通過對齊前投影

模型

Video Llava

AnasMohamed

基於Vision Transformer架構的大規模視覺語言模型，支持圖像與文本的跨模態理解

Gguf

Video LLaVA 7B Hf

LanguageBind

Video-LLaVA是一個開源的多模態模型，通過在多模態指令跟隨數據上微調大語言模型進行訓練，能夠生成交錯的圖像和視頻。

Transformers

Video LLaVA 7B

LanguageBind

Video-LLaVA是一個通過投影前對齊學習統一視覺表徵的多模態模型，能夠同時處理圖像和視頻的視覺推理任務。

Transformers

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖