Avec le développement fulgurant des grands modèles linguistiques (LLM), les agents uniques montrent de nombreuses limites lorsqu'ils doivent faire face à des tâches réelles complexes. Pour répondre à ce problème, une nouvelle approche de cadre multi-agents appelé Workforce a été introduite par l'Université de Hong Kong et d'autres institutions telles que camel-ai. Ce cadre est accompagné d'une méthode d'entraînement appelée OWL (Optimized Workforce Learning). Récemment, cette innovation a obtenu 69,70 % de précision sur le test de référence GAIA, battant non seulement les records des systèmes open source, mais aussi surpassant plusieurs systèmes commerciaux comme ceux d'OpenAI Deep Research.

Tous les codes de cette recherche ont été publiés sur GitHub et ont actuellement reçu plus de 17 000 étoiles, ce qui marque la reconnaissance de la communauté pour cette innovation.

image.png

Comment le cadre Workforce surmonte-t-il les limites des systèmes multi-agents ? Son cœur repose sur une conception innovante appelée "dissociation". Le système entier est décomposé en trois composants clés : un planificateur indépendant du domaine (Agent Planificateur), un coordinateur intelligent (Agent Coordinateur) et des nœuds de travail spécialisés (Worker Nodes). Cette conception améliore la flexibilité du système tout en réduisant considérablement la complexité de migration interdomaines. En particulier, lorsque de nouveaux domaines doivent être adaptés, l'utilisateur n'a besoin de remplacer ou d'ajouter que les nœuds de travail sans modifier le système principal.

image.png

Méthode d'entraînement OWL, une autre grande caractéristique de ce cadre. Cette méthode adopte une stratégie d'entraînement en deux étapes : la première étape consiste en un micro-apprentissage supervisé à travers les données de démonstration d'experts pour former initialement le planificateur ; la deuxième étape utilise un apprentissage par renforcement via l'algorithme d'optimisation des préférences directes (DPO) pour améliorer les capacités de prise de décision. Cette série d'optimisations garantit que le planificateur peut traiter diverses tâches dans le monde réel.

Sur le test de référence GAIA, le cadre Workforce a montré ses avantages significatifs, notamment dans la déduction multi-agents, atteignant 69,70 % de précision, bien au-delà des systèmes open source précédents. En même temps, la méthode d'entraînement OWL a également obtenu des résultats significatifs dans les tests, améliorant les performances du modèle Qwen2.5-32B-Instruct. Cette percée permet aux systèmes multi-agents de ne plus être limités par les idées de conception traditionnelles, en montrant une capacité puissante d'autocorrection et d'évolution.

L'introduction du cadre Workforce n'améliore pas seulement les performances globales des systèmes multi-agents, mais indique également la direction future des assistants intelligents.