Video-LLaVA
Apprentissage d'une représentation visuelle conjointe par alignement de projections préalables
Produit OrdinaireVidéoMachine LearningCompréhension visuelle
Video-LLaVA est un modèle conçu pour apprendre une représentation visuelle conjointe, entraîné par alignement de projections préalables. Il permet d'aligner les représentations vidéo et image, améliorant ainsi la compréhension visuelle. Ce modèle offre une vitesse d'apprentissage et d'inférence élevée, le rendant adapté au traitement vidéo et aux tâches de vision par ordinateur.
Video-LLaVA Dernière situation du trafic
Nombre total de visites mensuelles
5521824
Taux de rebond
50.41%
Nombre moyen de pages par visite
4.0
Durée moyenne de la visite
00:03:54