बायोटेक के क्षेत्र में, आर्टिफिशियल इंटेलिजेंस का उपयोग प्रोटीन की खोज और डिज़ाइन को तेज़ी से आगे बढ़ा रहा है। हाल ही में, कैलिफ़ोर्निया विश्वविद्यालय, बर्कले (UC Berkeley) और कैलिफ़ोर्निया इंस्टिट्यूट ऑफ़ टेक्नोलॉजी (Caltech) की शोध टीम ने मिलकर ProteinDT नामक एक नए मल्टीमॉडल फ़्रेमवर्क का विकास किया है, जिसका उद्देश्य प्रोटीन डिज़ाइन में मदद करने के लिए टेक्स्ट विवरण का उपयोग करना है। यह अभिनव तरीका न केवल प्रोटीन की क्रम और संरचना की जानकारी को जोड़ता है, बल्कि बड़ी मात्रा में टेक्स्ट के रूप में मौजूद जैविक ज्ञान को भी एकीकृत करता है, जिससे प्रोटीन डिज़ाइन का एक नया अध्याय शुरू होता है।
ProteinDT की कार्यप्रणाली तीन मुख्य चरणों में विभाजित है। सबसे पहले, शोध दल ने "तुलनात्मक भाषा - प्रोटीन प्रीट्रेनिंग" (ProteinCLAP) विधि का उपयोग करके टेक्स्ट विवरण को प्रोटीन क्रम के साथ संरेखित किया। यह प्रक्रिया UniProt डेटाबेस से 41.1 लाख टेक्स्ट-प्रोटीन जोड़ों की मदद से, तुलनात्मक शिक्षण तकनीक का उपयोग करके, विभिन्न मोड के बीच प्रभावी संलयन सुनिश्चित करती है।
चित्र विवरण: यह चित्र AI द्वारा बनाया गया है, चित्र अधिकार सेवा प्रदाता Midjourney है।
इसके बाद, ProteinDT का "सुगमकर्ता" मॉडल टेक्स्ट से प्रोटीन क्रम का प्रतिनिधित्व उत्पन्न करता है, सटीक पीढ़ी के लिए गॉसियन वितरण का अनुमान लगाकर सशर्त वितरण। और अंतिम चरण डिकोडर है, जो एक सशर्त पीढ़ी मॉडल के रूप में, पिछले चरण की प्रतिनिधित्व जानकारी के आधार पर अंतिम प्रोटीन क्रम उत्पन्न करता है।
इस ढांचे की प्रभावशीलता को सत्यापित करने के लिए, शोध दल ने तीन डाउनस्ट्रीम कार्य डिज़ाइन किए। सबसे पहले टेक्स्ट से प्रोटीन उत्पन्न करने का कार्य है, लक्षित प्रोटीन की विशेषताओं के टेक्स्ट विवरण को इनपुट करके, ProteinDT संबंधित प्रोटीन क्रम उत्पन्न कर सकता है, जिसकी सटीकता 90% से अधिक है। दूसरा शून्य-शॉट टेक्स्ट-निर्देशित प्रोटीन संपादन कार्य है, मौजूदा क्रम को दो तरीकों से संपादित करके, चाहे वह संभावित स्थान अंतःक्षेप विधि हो या संभावित अनुकूलन विधि, टेक्स्ट जानकारी को प्रभावी ढंग से इंजेक्ट किया जा सकता है, जिससे प्रोटीन पीढ़ी की गुणवत्ता में सुधार होता है। अंत में, टीम ने ProteinCLAP के सीखने के प्रतिनिधित्व की स्थिरता और सामान्यीकरण क्षमता का भी मूल्यांकन किया, अन्य छह अत्याधुनिक विधियों की तुलना में, ProteinDT कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है।
यह शोध न केवल प्रोटीन डिज़ाइन के लिए नए विचार खोलता है, बल्कि टेक्स्ट डेटा और जैविक अणु डिज़ाइन के संयोजन की विशाल क्षमता को भी दर्शाता है, भविष्य में जैव चिकित्सा और दवा विकास की प्रगति को और आगे बढ़ाने की उम्मीद है।