नवीनतम उच्च-रिज़ॉल्यूशन AI मॉडल Griffon v2 पाठ और दृश्य संकेतों को जोड़ता है, लचीले ऑब्जेक्ट संदर्भ प्रदान करता है। टीम ने मल्टी-मोडल संवेदन क्षमता को बढ़ाने के लिए डाउनसैंपलिंग प्रोजेक्टर का उपयोग किया है। यह मॉडल संदर्भ अभिव्यक्ति उत्पन्न करने, वाक्यांश स्थान निर्धारण और संदर्भ अभिव्यक्ति समझने के कार्यों में उत्कृष्ट प्रदर्शन करता है, विशेषज्ञ मॉडल से बेहतर है। इसमें दृश्य-भाषा सहसंबंध संरचना है, जो लक्ष्य पहचान और वस्तु गणना के मामले में श्रेष्ठता प्रदर्शित करता है।