मानवीय बुद्धि के विकास के साथ, लार्ज लैंग्वेज मॉडल्स (LLM) का उपयोग विभिन्न क्षेत्रों में अधिक व्यापक हो रहा है। हालाँकि, वर्तमान समय में इनके अनुमान लगाने का प्रकार अभी भी कई सीमाओं का सामना कर रहा है। परंपरागत स्व-परिवर्ती उत्पादन तरीका एक-एक करके टोकन का उत्पादन करता है, जिससे कि कार्यक्षमता कम होती है और आधुनिक सॉफ़्टवेयर और हार्डवेयर के समानांतर कम्प्यूटेशनल क्षमता का पूरा लाभ नहीं उठा पाता है। इस समस्या को हल करने के लिए, कार्नेगी मेलन विश्वविद्यालय (CMU) और नीविडिया के अनुसंधान टीम ने एक नामक Multiverse नाम के नये प्रकार के उत्पादन मॉडल को पेश किया है, जो मूल्यों के समानांतर उत्पादन की क्षमता प्रदान करके, LLM परिणाम के अनुमान करने के प्रकार को बदलने की ओर ले जाने का लक्ष्य रखता है।

इसके अलावा, Multiverse मॉडल बस तेज़ी से उत्पादन करने के लिए नहीं है, बल्कि मॉडल के आर्किटेक्चर को फिर से सोचने पर ध्यान केंद्रित करता है। अनुसंधानकर्ताओं ने पाया है कि वर्तमान में प्रमुख लार्ज लैंग्वेज मॉडल्स के उत्पादन प्रक्रिया में एक प्रकार की समानांतरता छिपी हुई है। इस खोज के बाद, Multiverse फ़्रेमवर्क ने MapReduce के समान एक संरचना का उपयोग किया है, जिससे प्रक्रिया तीन चरणों में विभाजित होती है: ताकत का स्व-अनुकूलन विभाजन, उप-कार्यों का समानांतर कार्यान्वयन और अपरिवर्तित परिणामों का संयोजन। ऐसा डिज़ाइन ने कम्प्यूटेशनल संसाधनों की क्षमता का पूरा लाभ उठाने में मदद की है, जिससे अधिक कुशल परिणाम का अनुमान लगाया जा सका है।

प्रयोगशाला के डेटा द्वारा प्रदर्शित किए गए अनुभवों के अनुसार, Multiverse-32B मॉडल एक ही संदर्भ लंबाई के साथ, स्व-परिवर्ती मॉडल की तुलना में लगभग 2% अधिक कार्यक्षमता दर्ज की है। यह बताता है कि Multiverse न केवल गति में महत्वपूर्ण सुधार लाए है, बल्कि विस्तार के क्षेत्र में भी बेहतर प्रदर्शन करता है, जो विभिन्न बैच आकारों पर अधिकतम दोगुनी गति का उपयोग कर सकता है। इस परिणाम को अधिक सार्वजनिक उपयोग करने के लिए, अनुसंधान टीम ने Multiverse व्यवस्था पूरी तरह से खुला कर दिया है, जिसमें डेटा, मॉडल वेट और प्रशिक्षण के विवरण शामिल हैं, जिससे अन्य अनुसंधानकर्ताओं को आगे की खोज करने की सुविधा हो।
वास्तविक जीवन के अनुप्रयोगों में, Multiverse कुछ उत्पादन आवश्यकताओं के अनुसार फ्लेक्सिबल रूप से सुधार कर सकता है, और अनुक्रमित और समानांतर उत्पादन के गतिशील बदलाव को एक विशेष नियंत्रण लेबल के माध्यम से प्राप्त करता है, जिससे उत्पादित सामग्री की तार्तिकता और तर्कशीलता सुनिश्चित होती है। इस तकनीक के पेश करने से नेचरल लैंग्वेज प्रोसेसिंग क्षेत्र में नई ऊर्जा आई है, और हम इसके वास्तविक अनुप्रयोगों में प्रदर्शन को उम्मीद करते हैं।