आया विजन 32B कोहरे फॉर एआई द्वारा विकसित एक उन्नत दृश्य भाषा मॉडल है, जिसमें 320 अरब पैरामीटर हैं, जो 23 भाषाओं, जिनमें अंग्रेजी, चीनी, अरबी आदि शामिल हैं, का समर्थन करता है। यह मॉडल नवीनतम बहुभाषी भाषा मॉडल आया एक्सपेंस 32B और सिगएलआईपी2 विज़ुअल एन्कोडर को जोड़ता है, जो बहु-मोडल एडेप्टर के माध्यम से दृश्य और भाषा समझ को जोड़ता है। यह दृश्य भाषा क्षेत्र में उत्कृष्ट प्रदर्शन करता है, और जटिल छवि और पाठ कार्यों, जैसे OCR, छवि वर्णन, दृश्य तर्क आदि को संभाल सकता है। इस मॉडल का प्रकाशन बहु-मोडल अनुसंधान के प्रसार को बढ़ावा देने के उद्देश्य से है, और इसका ओपन-सोर्स वेट वैश्विक शोधकर्ताओं को एक शक्तिशाली उपकरण प्रदान करता है। यह मॉडल CC-BY-NC लाइसेंस का पालन करता है और कोहरे फॉर एआई की उचित उपयोग नीति का पालन करना होगा।