Le nouveau modèle IA haute résolution Griffon v2 combine des indices textuels et visuels, offrant une référence d'objet flexible. L'équipe a amélioré les capacités de perception multimodale grâce à un projecteur de sous-échantillonnage. Ce modèle excelle dans les tâches de génération d'expressions de référence, de localisation de phrases et de compréhension d'expressions de référence, surpassant même les modèles experts. Doté d'une structure de co-référence visuelle et linguistique, il affiche une supériorité en matière de détection d'objets et de comptage d'objets.
Modèle IA haute résolution Griffon v2 : références texte et visuelles flexibles

站长之家
Cet article provient d'AIbase Daily
Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.