PARTNR मेटा FAIR द्वारा जारी एक बड़ा बेंचमार्क है जिसमें 100,000 प्राकृतिक भाषा कार्य शामिल हैं, जिसका उद्देश्य बहु-एजेंट अनुमान और योजना का अध्ययन करना है। PARTNR बड़े भाषा मॉडल (LLM) का उपयोग कार्यों को उत्पन्न करने के लिए करता है और त्रुटियों को कम करने के लिए सिमुलेटेड लूप का उपयोग करता है। यह वास्तविक मानव भागीदारों के साथ AI एजेंटों के मूल्यांकन का भी समर्थन करता है, जो मानव-इन-द-लूप अवसंरचना के माध्यम से होता है। PARTNR मौजूदा LLM-आधारित योजनाकारों में कार्य समन्वय, ट्रैकिंग और त्रुटियों से उबरने में उल्लेखनीय सीमाओं को उजागर करता है, मानव 93% कार्यों को हल कर सकते हैं, जबकि LLM केवल 30% ही हल कर पाते हैं।