हाल ही में, गूगल AI टीम ने MLE-STAR (मशीन लर्निंग इंजीनियरिंग बाय सर्च एंड टारगेटेड ओप्टिमाइजेशन), एक उन्नत एजेंट सिस्टम जारी किया, जो जटिल मशीन लर्निंग प्रक्रियाओं के डिज़ाइन और अनुकूलन को स्वचालित करने के लिए बनाया गया है। MLE-STAR बड़े पैमाने पर नेटवर्क सर्च, लक्षित कोड अनुकूलन और शक्तिशाली जांच मॉड्यूल के संयोजन में आए, जो विभिन्न मशीन लर्निंग इंजीनियरिंग कार्यों पर अच्छा प्रदर्शन करते हैं, जो पूर्व के स्वायत्त मशीन लर्निंग एजेंट और मानव बेंचमार्क विधियों के ऊपर आते हैं।

वर्तमान में, यद्यपि बड़े भाषा मॉडल (LLMs) कोड जनरेशन और कार्य प्रवाह स्वचालन में कुछ प्रगति हुई है, लेकिन वर्तमान मशीन लर्निंग इंजीनियरिंग एजेंट अभी भी कई चुनौतियों का सामना कर रहे हैं। उदाहरण के लिए, वे LLM के याददाश्त के अधिक आधार पर होते हैं, जो आमतौर पर "सामान्य" मॉडल का उपयोग करते हैं और उन उन्नत, टास्क-विशिष्ट विधियों के लिए ध्यान नहीं देते हैं; फिर, पहले के एजेंट कोड के संशोधन के समय आमतौर पर "एक ही बार सभी बदलाव" के तरीके का उपयोग करते हैं, जो डेटा पूर्व प्रसंस्करण, लक्षण इंजीनियरिंग आदि पाइपलाइन घटकों के गहरे अन्वेषण की कमी के कारण होता है। इसके अलावा, उत्पादित कोड भी त्रुटियों, डेटा लीकेज आदि के लिए अक्सर बन जाता है।

MLE-STAR इन समस्याओं के खिलाफ एक श्रृंखला के मुख्य नवाचार पेश करता है। पहले, MLE-STAR अपने आंतरिक "याददाश्त" के बजाय नेटवर्क सर्च के माध्यम से मॉडल और कोड खंड चुनता है, जिससे प्रारंभिक समाधान वर्तमान सबसे अच्छी प्रथा के आधार पर सुनिश्चित होता है। दूसरे, यह दो-चक्र अनुकूलन प्रक्रिया का उपयोग करता है: बाहरी चक्र प्रभावित करने वाले महत्वपूर्ण घटकों की पहचान करता है, जबकि आंतरिक चक्र इन घटकों के लिए गहरे अन्वेषण करता है। साथ ही, MLE-STAR नए एकीकरण विधियों के प्रस्ताव और कार्यान्वयन कर सकता है, जो विभिन्न उम्मीदवार समाधानों के संयोजन के माध्यम से समग्र प्रदर्शन में सुधार करता है।

कोड की गुणवत्ता सुनिश्चित करने के लिए, MLE-STAR ने कई विशेष एजेंट भी शामिल किए, जैसे कि पायथन त्रुटियों को स्वचालित रूप से पकड़ने और ठीक करने वाले डिबगिंग एजेंट, डेटा लीकेज की जांच करने वाले एजेंट और सभी डेटा फाइलों के उचित उपयोग की जांच करने वाले एजेंट। इन उपायों के माध्यम से, MLE-STAR विभिन्न बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है, विशेष रूप से Kaggle प्रतियोगिता में, जहां इसे उच्च गोल्ड मेडल और उत्कृष्ट कार्य प्राप्त करने में सफलता मिली।
MLE-STAR के ओपन सोर्स कोड लाइब्रेरी अनुसंधानकर्ताओं और मशीन लर्निंग पेशेवरों को अपने परियोजनाओं में इन उन्नत क्षमताओं के एकीकरण की अनुमति देती है, जिससे उत्पादकता और नवाचार की प्रक्रिया तेज हो जाती है।
परियोजना: https://github.com/nv-tlabs/cosmos1-diffusion-renderer
मुख्य बातें:
💡 MLE-STAR गूगल द्वारा पेश किया गया एक उन्नत मशीन लर्निंग इंजीनियरिंग एजेंट है, जो जटिल कार्यों के स्वचालन के लिए बनाया गया है।
🔍 नेटवर्क सर्च, लक्षित अनुकूलन और विभिन्न जांच तंत्र के उपयोग के माध्यम से, MLE-STAR मशीन लर्निंग इंजीनियरिंग की दक्षता और गुणवत्ता में निश्चित रूप से सुधार करता है।
🏆 Kaggle प्रतियोगिता में, MLE-STAR अच्छा प्रदर्शन करता है और अधिक गोल्ड मेडल और उत्कृष्ट कार्य प्राप्त करता है।