C-Eval एक व्यापक मानक है जो चीनी मूल मॉडल की उन्नत ज्ञान और तर्क क्षमताओं का मूल्यांकन करता है। इसमें चार कठिनाई स्तरों के बहुविकल्पीय प्रश्न शामिल हैं, जो 52 विभिन्न विषय क्षेत्रों को कवर करते हैं। परीक्षण उदाहरणों का संग्रह इंटरनेट पर模拟 परीक्षा से लिया गया है। C-Eval सूची ओपन-सोर्स मॉडल के इस मूल्यांकन में प्रदर्शन को प्रदर्शित करती है। यह मानक प्राकृतिक भाषा प्रसंस्करण क्षेत्र के लिए उपयुक्त बड़े मॉडलों का चयन करने में मदद करता है, जिससे एआई अनुप्रयोगों के विकास को बढ़ावा मिलता है।
C-Eval मूल्यांकन चीनी मूलभूत मॉडलों के उच्च ज्ञान और तर्कात्मक क्षमताओं का

机器之心
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।