मेटा ने हाल ही में अपने तकनीकी रूप से सबसे बड़े AI आधारित रासायनिक खोज-मंच OMol25 को जारी किया, और उसी समय एक सामान्य आर्टिफिशियल इंटेलिजेंस मॉडल UMA (Universal Atom Model) भी जारी की। ये दोनों नवीनताएं दवा विकास, बैटरी सामग्रि विकास और कैटलिस्ट शोध के प्रमुख क्षेत्रों में तेजी से शोध को बढ़ाने के लिए डिज़ाइन की गई हैं।
मेटा के अनुसार, OMol25 डेटासेट में अधिक than 100 मिलियन उच्च-सटीक मोलेक्यूलर कम्प्यूटेशन डेटा शामिल हैं, जो पहले किसी भी सार्वजनिक रूप से उपलब्ध डेटासेट से बहुत बड़ा है। इस विशाल संसाधन को बनाने के लिए मेटा ने 6 अरब घंटे से अधिक की कम्प्यूटेशनल समय लगाई है। OMol25 विभिन्न प्रकार के मोलेक्यूलों को शामिल करता है, जिसमें छोटे अणुओं, जैविक अणु (जैसे प्रोटीन और DNA टुकड़े), धातु यौगिक और विद्युत-शोधक शामिल हैं। इस डेटासेट में मोलेक्यूल के आवेशित, स्पिनित की अवस्थाओं, विभिन्न अंतर्निहित स्थानीय रूपों (कॉन्फ़ोर्मेशन) और रासायनिक अभिक्रियाओं के बारे में भी जानकारी शामिल है, और इसमें ऊर्जा, बल, आवेश वितरण और कक्ष की विस्तृत रासायनिक गुणवत्ता डेटा भी मौजूद है। वर्तमान में, OMol25 डेटासेट हगिंग फेस प्लेटफार्म पर प्रस्तुत है।
OMol25 के साथ जारी किए गए UMA मॉडल, मेटा द्वारा OMol25 और अन्य डेटासेटों पर प्रशिक्षित एक नया AI मॉडल है। UMA का विशेष बिंदु यह है कि यह परमाणु स्तर पर रासायनिक गुणधर्मों का पूर्वानुमान लगा सकता है और पारंपरिक गणितीय विधियों की तुलना में बहुत तेजी से काम करता है। विशेष उद्देश्य के लिए अलग-अलग मॉडल बनाने की परंपरा के बजाय, UMA सामान्य है और दवा खोज में मोलेक्यूल सिमुलेशन से लेकर सामग्रि और कैटलिस्ट शोध तक के विभिन्न अनुप्रयोग क्षेत्रों का प्रबंधन कर सकता है। UMA उनावरणीय ग्राफ न्यूरल नेटवर्क के आधार पर बनाया गया है और "मिश्रित लाइनर एक्स्पर्ट" आर्किटेक्चर का उपयोग करता है, जो गणना की गति और पूर्वानुमान की सटीकता के बीच संतुलन प्राप्त करता है। बेंचमार्क टेस्ट में, UMA उन स्तर तक पहुंच गया है जो पहले केवल विशेष रूप से अनुकूलित मॉडलों के लिए ही उपलब्ध थे।
मेटा का उल्लेख है कि UMA के साथ, पहले दिनों में कई दिन लगने वाले मोलेक्यूल सिमुलेशन और कम्प्यूटेशन अब केवल कई सेकंड में पूरे हो जाते हैं, जो शोधकर्ताओं को प्रयोगशाला में तैयार करने से पहले हजारों नई मोलेक्यूलों का त्वरित चयन करने की क्षमता प्रदान करता है। UMA मॉडल भी हगिंग फेस पर उपलब्ध है।
विशेष रूप से महत्वपूर्ण है, मेटा ने "अनुलंबित नमूनांकन" नामक नई AI मोलेक्यूल सिमुलेशन विधि को भी जारी किया है। अनुलंबित नमूनांकन के अनुसार, अनुमानित नए मोलेक्यूल संरचनाओं की शुरुआत करने के लिए पारंपरिक AI मॉडलों के पास बड़े पैमाने पर वास्तविक जीवन-वास्तविक डेटा की आवश्यकता होती है, लेकिन इस विधि में, यह वास्तविक नमूनों की कमी के बावजूद भी नए मोलेक्यूल संरचनाओं का सीखना और प्रस्तुत करना संभव होता है। यह तकनीक यांत्रिक नियंत्रण सिद्धांत और फैज़ी प्रक्रियाओं की अवधारणाओं पर आधारित है, और मेटा टीम का मानना है कि फैज़ी प्रक्रिया मोलेक्यूलों को सिमुलेट करने के लिए विशेष रूप से उपयुक्त है। प्रयोगों के अनुसार, अनुलंबित नमूनांकन छोटे प्राप्त गणना में विभिन्न मोलेक्यूल संरचना विकल्पों की तेजी से खोज करता है और उत्पन्न मोलेक्यूल कंफ़ोर्मेशन परंपरिक सॉफ्टवेयर के परिणामों के समान होते हैं, और बहुत अधिक स्ट्रक्चर के लिए बेहतर भी होते हैं। संबंधित मॉडल, कोड और अधिक जानकारी हगिंग फेस और गिट हब पर उपलब्ध हैं।
हालांकि महत्वपूर्ण प्रगति की हुई है, मेटा ने भी कुछ चुनौतियों का उल्लेख किया है। उदाहरण के लिए, पोलीमर, कुछ धातु या जटिल प्रोटोनाइड की अवस्थाओं जैसी रासायनिक क्षेत्रों में डेटा की कवरेज अभी भी पूर्ण नहीं है। इसके अलावा, AI मॉडल आवेश, स्पिन और लंबी दूरी के प्रभावों जैसी गुणधर्मों का पूर्वानुमान करने में भी बेहतरी की आवश्यकता है।