Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

Tools

AI Brand Monitoring Tool

Analyze & Track How AI Models Cite Your Brand

AI Search Visibility Checker

Detect brand's visibility on AI platforms

Service

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

AI Deployment Calculator

Enter Your Large Model Computing Requirements for Instant GPU, Memory & Server Configuration Recommendations

AI Tutorial

L'Institut de la technologie de la communication chinoise publie le test de référence du modèle d'intelligence artificielle Fangsheng 3.0

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Oct 9, 2025

Récemment, l'Institut de la technologie de l'information et des communications de Chine (CAICT) a officiellement lancé le système d'évaluation « Fangsheng » version 3.0, marquant une autre avancée majeure dans l'évaluation des technologies de l'intelligence artificielle (IA) en Chine. Cette nouvelle version est une amélioration globale par rapport aux versions précédentes, ajoutant non seulement des tests sur les propriétés fondamentales des modèles, mais aussi une évaluation systématique des caractéristiques de base telles que la taille des paramètres et l'efficacité de la réflexion. De plus, ce système intègre des tests avancés pour l'avenir, se concentrant sur dix compétences supérieures telles que la compréhension multimodale, la mémoire à long terme et l'apprentissage autonome, offrant ainsi une évaluation plus approfondie pour des secteurs clés tels que la fabrication industrielle, les sciences fondamentales et la finance.

Pour mieux mettre en œuvre la version 3.0 de « Fangsheng », le CAICT renforce la construction des infrastructures d'évaluation dans plusieurs domaines. Premièrement, il prévoit d'élargir les ressources de données de test de haute qualité, ajoutant 3 millions de nouvelles données pour répondre aux besoins d'évaluation des modèles dans différentes langues, tâches et scénarios. Ensuite, le CAICT étudiera et appliquera des méthodes de test avancées de manière systématique, en se concentrant sur la résolution de problèmes techniques clés liés aux grands modèles, tels que la synthèse et l'évaluation de la qualité des données de test de haute qualité. En outre, le CAICT construira une plateforme d'évaluation intelligente de nouvelle génération, ajoutant un environnement de simulation de test avec une interaction multientités et une perception de l'environnement, afin de répondre aux besoins d'évaluation de l'interaction collaborative entre entités intelligentes et de l'adaptation dynamique à l'environnement complexe.

Dès 2024, le CAICT organisera une activité de test de référence pour les grands modèles toutes les deux mois. Dans la dernière série de tests, 141 grands modèles et 7 entités intelligentes ont été évalués, couvrant les compétences fondamentales, la capacité de raisonnement, l'application du code et la compréhension multimodale. Les résultats montrent que GPT-5 d'OpenAI continue de dominer en termes de compétence globale, tandis que Qwen3-Max-Preview d'Alibaba et Kimi K2 de Moonshot AI ont également démontré des performances solides. Dans les tests des modèles multimodaux, la capacité de compréhension visuelle a connu des progrès, mais reste insuffisante dans les tâches complexes de raisonnement logique.

Les résultats des tests concernant la capacité d'application du code montrent également que, bien qu'ils soient performants dans les tâches simples au niveau des fonctions, ils présentent encore des lacunes dans les développements de projets réels. Cela signifie que la concurrence technologique entre le monde extérieur et la Chine reste intense, et que les entités intelligentes doivent encore progresser dans la compréhension multimodale et le traitement d'informations complexes.

Le CAICT continuera à renforcer la recherche et le développement des technologies d'évaluation des grands modèles, améliorant ainsi la crédibilité et l'autorité des évaluations, afin de soutenir l'innovation aux frontières de l'intelligence artificielle et le développement de l'industrie moderne.

Fangsheng nouveaux termes d'IA Institut de la technologie de la communication chinoise système de tests de référence

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

L'Institut de la technologie de la communication chinoise publie le test de référence du modèle d'intelligence artificielle Fangsheng 3.0

AIbase基地

Cet article provient d'AIbase Daily

GEO Services