C-Eval est une vaste référence pour évaluer les capacités de raisonnement et les connaissances avancées des grands modèles linguistiques chinois. Il comprend des questions à choix multiples à quatre niveaux de difficulté, couvrant 52 domaines disciplinaires différents. Les exemples de tests proviennent de simulations d'examens trouvées sur internet. Le classement C-Eval présente les performances des modèles open source sur ce benchmark. Ce référentiel aide à sélectionner les grands modèles adaptés au traitement du langage naturel et favorise le développement des applications d'IA.
C-Eval : Évaluation des capacités de connaissance et de raisonnement de niveau avancé des modèles linguistiques de base chinois

机器之心
Cet article provient d'AIbase Daily
Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.