मेग्रेज़-3B-ओमनी, बिना किसी सवाल के शिनकुंग द्वारा विकसित एक एंड-टू-एंड बहु-विधा समझ मॉडल है, जो बड़े भाषा मॉडल मेग्रेज़-3B-इंस्ट्रक्ट पर आधारित है, जिसमें चित्र, पाठ और ऑडियो तीन प्रकार के मोडल डेटा की समझ और विश्लेषण क्षमता है। यह मॉडल छवि समझ, भाषा समझ और आवाज़ समझ में सर्वोत्तम सटीकता प्राप्त करता है, चीनी और अंग्रेजी भाषा के आवाज़ इनपुट और बहु-चरण बातचीत का समर्थन करता है, इनपुट छवियों के लिए आवाज़ से प्रश्न पूछने का समर्थन करता है, आवाज़ निर्देशों के अनुसार सीधे पाठ का जवाब देता है, और कई बेंचमार्क कार्यों में अग्रणी परिणाम प्राप्त करता है।