LongVA
भाषा से दृश्य तक लंबे संदर्भ रूपांतरण मॉडल
सामान्य उत्पादछविलंबा संदर्भदृश्य मॉडल
LongVA एक ऐसा लंबा संदर्भ रूपांतरण मॉडल है जो 2000 से अधिक फ़्रेम या 200K से अधिक दृश्य टैग को संभाल सकता है। Video-MME में इसका प्रदर्शन 7B मॉडल में अग्रणी है। इस मॉडल का परीक्षण CUDA 11.8 और A100-SXM-80G पर किया गया है, और इसे Hugging Face प्लेटफ़ॉर्म के माध्यम से तेज़ी से लॉन्च और उपयोग किया जा सकता है।
LongVA नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
485459945
बाउंस दर
35.86%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:25