MDT छवियों में ऑब्जेक्ट भागों के बीच संबंधों को सीखने की क्षमता को स्पष्ट रूप से बढ़ाने के लिए मास्क्ड पोटेंशियल मॉडल योजना को शामिल करके प्रसार संभाव्यता मॉडल (DPMs) को बढ़ाता है। MDT प्रशिक्षण के दौरान पोटेंशियल स्पेस में काम करता है, कुछ टोकन को मास्क करता है, और फिर अनमास्क्ड टोकन से मास्क्ड टोकन की भविष्यवाणी करने के लिए एक विषम प्रसार ट्रांसफॉर्मर डिज़ाइन करता है, साथ ही प्रसार उत्पादन प्रक्रिया को बनाए रखता है। MDTv2 आगे MDT के प्रदर्शन को और अधिक कुशल मैक्रो-नेटवर्क संरचना और प्रशिक्षण रणनीति के माध्यम से बेहतर बनाता है।