La société de démarrage spécialisée dans le matériel d'intelligence artificielle, Groq, a publié deux modèles linguistiques open source qui surpassent les géants de la technologie en termes de capacité d'utilisation d'outils spécialisés. Le nouveau modèle Llama-3-Groq-70B-Tool-Use a déjà atteint la première place du classement Berkeley Function Call Leaderboard (BFCL), dépassant les produits propriétaires d'OpenAI, Google et Anthropic.
Rick Lamers, responsable de projet chez Groq, a annoncé cette percée dans un article sur X.com. Il a déclaré : « Je suis fier d'annoncer les modèles Llama3Groq Tool Use 8B et 70B. Il s'agit d'une version entièrement affinée pour l'utilisation d'outils open source de Llama3, qui a atteint la première place du BFCL, surpassant tous les autres modèles, y compris les modèles propriétaires tels que Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o et Gemini 1.5 Pro. »

Données synthétiques et IA éthique : un nouveau paradigme dans l'entraînement des modèles
La version 70B paramètres, plus grande, a atteint une précision globale de 90,76 % au BFCL, tandis que le modèle 8B plus petit a obtenu un score de 89,06 %, se classant troisième au classement général. Ces résultats montrent que les modèles open source peuvent égaler, voire surpasser, les performances des alternatives propriétaires pour des tâches spécifiques.
Groq a collaboré avec la société de recherche en intelligence artificielle Glaive pour développer ces modèles, en utilisant l'optimisation directe des préférences (DPO) et un réglage fin complet sur le modèle de base Llama-3 de Meta. L'équipe souligne qu'elle n'a utilisé que des données synthétiques générées de manière éthique pour l'entraînement, ce qui répond aux préoccupations courantes concernant la confidentialité des données et le surapprentissage.
Ces modèles sont désormais disponibles via l'API Groq et la plateforme Hugging Face. Cette accessibilité peut accélérer l'innovation dans les domaines nécessitant l'utilisation d'outils complexes et d'appels de fonctions, tels que le codage automatique, l'analyse de données et les assistants d'IA interactifs.
Groq a également lancé une démonstration publique sur Hugging Face Spaces, permettant aux utilisateurs d'interagir avec les modèles et de tester par eux-mêmes leurs capacités d'utilisation d'outils. Comme Gradio, acquis par Hugging Face en décembre 2021, de nombreuses démonstrations sur Hugging Face Spaces sont réalisées de cette manière. La communauté de l'IA a réagi positivement, de nombreux chercheurs et développeurs étant impatients d'explorer les capacités de ces modèles.
Points clés :
⭐ Les modèles d'IA open source publiés par Groq surpassent les modèles propriétaires des géants de la technologie pour des tâches spécifiques.
⭐ En utilisant des données synthétiques pour l'entraînement, Groq remet en question les problèmes courants de confidentialité des données et de surapprentissage dans le développement de modèles d'IA.
⭐ Le lancement de modèles open source pourrait changer le cours du développement dans le domaine de l'IA, favorisant une accessibilité plus large à l'IA et la création d'un écosystème d'innovation.




