मेटा ने हाल ही में अपने तकनीकी रूप से सबसे बड़े AI आधारित रासायनिक खोज-मंच OMol25 को जारी किया, और उसी समय एक सामान्य आर्टिफिशियल इंटेलिजेंस मॉडल UMA (Universal Atom Model) भी जारी की। ये दोनों नवीनताएं दवा विकास, बैटरी सामग्रि विकास और कैटलिस्ट शोध के प्रमुख क्षेत्रों में तेजी से शोध को बढ़ाने के लिए डिज़ाइन की गई हैं।

मेटा के अनुसार, OMol25 डेटासेट में अधिक than 100 मिलियन उच्च-सटीक मोलेक्यूलर कम्प्यूटेशन डेटा शामिल हैं, जो पहले किसी भी सार्वजनिक रूप से उपलब्ध डेटासेट से बहुत बड़ा है। इस विशाल संसाधन को बनाने के लिए मेटा ने 6 अरब घंटे से अधिक की कम्प्यूटेशनल समय लगाई है। OMol25 विभिन्न प्रकार के मोलेक्यूलों को शामिल करता है, जिसमें छोटे अणुओं, जैविक अणु (जैसे प्रोटीन और DNA टुकड़े), धातु यौगिक और विद्युत-शोधक शामिल हैं। इस डेटासेट में मोलेक्यूल के आवेशित, स्पिनित की अवस्थाओं, विभिन्न अंतर्निहित स्थानीय रूपों (कॉन्फ़ोर्मेशन) और रासायनिक अभिक्रियाओं के बारे में भी जानकारी शामिल है, और इसमें ऊर्जा, बल, आवेश वितरण और कक्ष की विस्तृत रासायनिक गुणवत्ता डेटा भी मौजूद है। वर्तमान में, OMol25 डेटासेट हगिंग फेस प्लेटफार्म पर प्रस्तुत है।

चिप तकनीक (1)

OMol25 के साथ जारी किए गए UMA मॉडल, मेटा द्वारा OMol25 और अन्य डेटासेटों पर प्रशिक्षित एक नया AI मॉडल है। UMA का विशेष बिंदु यह है कि यह परमाणु स्तर पर रासायनिक गुणधर्मों का पूर्वानुमान लगा सकता है और पारंपरिक गणितीय विधियों की तुलना में बहुत तेजी से काम करता है। विशेष उद्देश्य के लिए अलग-अलग मॉडल बनाने की परंपरा के बजाय, UMA सामान्य है और दवा खोज में मोलेक्यूल सिमुलेशन से लेकर सामग्रि और कैटलिस्ट शोध तक के विभिन्न अनुप्रयोग क्षेत्रों का प्रबंधन कर सकता है। UMA उनावरणीय ग्राफ न्यूरल नेटवर्क के आधार पर बनाया गया है और "मिश्रित लाइनर एक्स्पर्ट" आर्किटेक्चर का उपयोग करता है, जो गणना की गति और पूर्वानुमान की सटीकता के बीच संतुलन प्राप्त करता है। बेंचमार्क टेस्ट में, UMA उन स्तर तक पहुंच गया है जो पहले केवल विशेष रूप से अनुकूलित मॉडलों के लिए ही उपलब्ध थे।

मेटा का उल्लेख है कि UMA के साथ, पहले दिनों में कई दिन लगने वाले मोलेक्यूल सिमुलेशन और कम्प्यूटेशन अब केवल कई सेकंड में पूरे हो जाते हैं, जो शोधकर्ताओं को प्रयोगशाला में तैयार करने से पहले हजारों नई मोलेक्यूलों का त्वरित चयन करने की क्षमता प्रदान करता है। UMA मॉडल भी हगिंग फेस पर उपलब्ध है।

विशेष रूप से महत्वपूर्ण है, मेटा ने "अनुलंबित नमूनांकन" नामक नई AI मोलेक्यूल सिमुलेशन विधि को भी जारी किया है। अनुलंबित नमूनांकन के अनुसार, अनुमानित नए मोलेक्यूल संरचनाओं की शुरुआत करने के लिए पारंपरिक AI मॉडलों के पास बड़े पैमाने पर वास्तविक जीवन-वास्तविक डेटा की आवश्यकता होती है, लेकिन इस विधि में, यह वास्तविक नमूनों की कमी के बावजूद भी नए मोलेक्यूल संरचनाओं का सीखना और प्रस्तुत करना संभव होता है। यह तकनीक यांत्रिक नियंत्रण सिद्धांत और फैज़ी प्रक्रियाओं की अवधारणाओं पर आधारित है, और मेटा टीम का मानना है कि फैज़ी प्रक्रिया मोलेक्यूलों को सिमुलेट करने के लिए विशेष रूप से उपयुक्त है। प्रयोगों के अनुसार, अनुलंबित नमूनांकन छोटे प्राप्त गणना में विभिन्न मोलेक्यूल संरचना विकल्पों की तेजी से खोज करता है और उत्पन्न मोलेक्यूल कंफ़ोर्मेशन परंपरिक सॉफ्टवेयर के परिणामों के समान होते हैं, और बहुत अधिक स्ट्रक्चर के लिए बेहतर भी होते हैं। संबंधित मॉडल, कोड और अधिक जानकारी हगिंग फेस और गिट हब पर उपलब्ध हैं।

हालांकि महत्वपूर्ण प्रगति की हुई है, मेटा ने भी कुछ चुनौतियों का उल्लेख किया है। उदाहरण के लिए, पोलीमर, कुछ धातु या जटिल प्रोटोनाइड की अवस्थाओं जैसी रासायनिक क्षेत्रों में डेटा की कवरेज अभी भी पूर्ण नहीं है। इसके अलावा, AI मॉडल आवेश, स्पिन और लंबी दूरी के प्रभावों जैसी गुणधर्मों का पूर्वानुमान करने में भी बेहतरी की आवश्यकता है।