15 जुलाई 2023 को, गूगल ने सुबह 1 बजे पहला जीमीनी एम्बेडिंग मॉडल लॉन्च किया, जो MTEB (मल्टी-टेक्स्ट एम्बेडिंग बेंचमार्क प्लेटफॉर्म) पर 68.37 के उच्च स्कोर के साथ पहला स्थान हासिल करता है, जो ओपनएआई के 58.93 स्कोर को पार कर गया। यह सफलता गूगल के एम्बेडिंग तकनीक में नेतृत्व को दर्शाती है और स्वतंत्र रचकर्ता और स्वतंत्र कार्यकर्ताओं के लिए अधिक आर्थिक विकल्प प्रदान करती है: जीमीनी एम्बेडिंग मॉडल का उपयोग प्रति 10 लाख टोकन 0.15 डॉलर होता है।

image.png

जीमीनी एम्बेडिंग मॉडल की शक्ति

परीक्षण परिणामों के अनुसार, जीमीनी एम्बेडिंग मॉडल द्विभाषी खोज, वर्गीकरण, क्लस्टरिंग, निर्देश खोज, बहु-लेबल वर्गीकरण, जोड़ा वर्गीकरण, री-रैंकिंग, खोज और अर्थपूर्ण पाठ समानता जैसे कई कार्यों में उत्कृष्ट प्रदर्शन करता है और वर्तमान में सबसे शक्तिशाली एम्बेडिंग मॉडल बन गया है। इसकी बहुभाषी क्षमता इसके वैश्विक अनुप्रयोग में अधिक संभावना प्रदान करती है, विशेष रूप से बहुत सारे अंग्रेजी भाषी नहीं होने वाले उपयोगकर्ताओं में।

मॉडल आर्किटेक्चर और नवाचार

जीमीनी एम्बेडिंग मॉडल द्विदिश ट्रांसफॉर्मर संकोड़क आर्किटेक्चर पर आधारित है, जो जीमीनी मॉडल के द्विदिश ध्यान तकनीक को बरकरार रखता है, जो इसकी पूर्व-प्रशिक्षित भाषा समझ क्षमता का अधिकतम उपयोग करता है। इस मॉडल में नीचे के 32 लेयर ट्रांसफॉर्मर पर एक पूलिंग लेयर जोड़ा गया है, जो इनपुट अनुक्रम के प्रत्येक टोकन एम्बेडिंग के एक साथ संग्रहण के लिए उपयोग किया जाता है, एक एकल एम्बेडिंग वेक्टर बनाने के लिए। उपयोग की गई औसत पूलिंग रणनीति सरल और प्रभावी है, मॉडल की अनुकूलता में वृद्धि करती है।

शिक्षा विधि और डेटा गुणवत्ता नियंत्रण

शिक्षा के दौरान, जीमीनी एम्बेडिंग मॉडल ने बहु-चरण शिक्षा रणनीति का उपयोग किया, जिसे पूर्व-समायोजन और समायोजन के दो चरणों में विभाजित किया गया था। पूर्व-समायोजन चरण में, मॉडल बड़े वेब कॉर्पस में डेटा के साथ शिक्षा करता है, जिसका मुख्य उद्देश्य अपने पैरामीटर को स्व-प्रवाह उत्पादन कार्य से संकोड़क कार्य में अनुकूलित करना है। समायोजन चरण में, विशिष्ट कार्यों के डेटा के साथ अधिक सूक्ष्म शिक्षा की जाती है, ताकि मॉडल खोज, वर्गीकरण, क्लस्टरिंग आदि में उच्च कार्यक्षमता प्रदर्शित कर सके।

डेटा गुणवत्ता में सुधार के लिए, अनुसंधान टीम ने संश्लेषित डेटा जनन रणनीति डिज़ाइन की और शिक्षा डेटा के लिए जीमीनी का उपयोग किया, निम्न गुणवत्ता नमूनों को हटाकर मॉडल के शिक्षा में प्रभावीता सुनिश्चित करता है।

जीमीनी एम्बेडिंग मॉडल के लॉन्च ने गूगल के एम्बेडिंग तकनीक में महत्वपूर्ण प्रगति को चिह्नित किया, जो कि कृत्रिम बुद्धिमत्ता के क्षेत्र में उसकी प्रतिस्पर्धा क्षमता को बढ़ाता है। इस मॉडल के विस्तार के साथ, खोज, व्यक्तिगत सुझाव आदि के विकास की अपेक्षा है।

अनुभव करें: https://aistudio.google.com/prompts/new_chat