最高のVideo-LLaVA AIツールモデル_厳選Video-LLaVA情報 - AIBase

AI製品

もっと見る

Video-LLaVA

Video-LLaVA

先行投影アライメントによる、統合視覚表現学習

AIビデオ検索

モデル

もっと見る

Video Llava

AnasMohamed

Vision Transformerアーキテクチャに基づく大規模視覚言語モデルで、画像とテキストのクロスモーダル理解をサポート

マルチモーダル

Gguf

Video LLaVA 7B Hf

LanguageBind

Video-LLaVAはオープンソースのマルチモーダルモデルで、マルチモーダル指令追従データで大規模言語モデルを微調整することで訓練され、交互する画像とビデオを生成することができます。

マルチモーダル

Transformers

Video LLaVA 7B

LanguageBind

Video-LLaVAは投影前アライメント学習により視覚表現を統一するマルチモーダルモデルで、画像と動画の視覚推論タスクを同時に処理できます。

マルチモーダル

Transformers

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ