Le modèle Llama IA open source de Groq arrive en tête du classement, surpassant GPT-4o et Claude en matière d'appels de fonctions

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Jul 19, 2024

270

La société de démarrage spécialisée dans le matériel d'intelligence artificielle, Groq, a publié deux modèles linguistiques open source qui surpassent les géants de la technologie en termes de capacité d'utilisation d'outils spécialisés. Le nouveau modèle Llama-3-Groq-70B-Tool-Use a déjà atteint la première place du classement Berkeley Function Call Leaderboard (BFCL), dépassant les produits propriétaires d'OpenAI, Google et Anthropic.

Rick Lamers, responsable de projet chez Groq, a annoncé cette percée dans un article sur X.com. Il a déclaré : « Je suis fier d'annoncer les modèles Llama3Groq Tool Use 8B et 70B. Il s'agit d'une version entièrement affinée pour l'utilisation d'outils open source de Llama3, qui a atteint la première place du BFCL, surpassant tous les autres modèles, y compris les modèles propriétaires tels que Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o et Gemini 1.5 Pro. »

Données synthétiques et IA éthique : un nouveau paradigme dans l'entraînement des modèles

La version 70B paramètres, plus grande, a atteint une précision globale de 90,76 % au BFCL, tandis que le modèle 8B plus petit a obtenu un score de 89,06 %, se classant troisième au classement général. Ces résultats montrent que les modèles open source peuvent égaler, voire surpasser, les performances des alternatives propriétaires pour des tâches spécifiques.

Groq a collaboré avec la société de recherche en intelligence artificielle Glaive pour développer ces modèles, en utilisant l'optimisation directe des préférences (DPO) et un réglage fin complet sur le modèle de base Llama-3 de Meta. L'équipe souligne qu'elle n'a utilisé que des données synthétiques générées de manière éthique pour l'entraînement, ce qui répond aux préoccupations courantes concernant la confidentialité des données et le surapprentissage.

Ces modèles sont désormais disponibles via l'API Groq et la plateforme Hugging Face. Cette accessibilité peut accélérer l'innovation dans les domaines nécessitant l'utilisation d'outils complexes et d'appels de fonctions, tels que le codage automatique, l'analyse de données et les assistants d'IA interactifs.

Groq a également lancé une démonstration publique sur Hugging Face Spaces, permettant aux utilisateurs d'interagir avec les modèles et de tester par eux-mêmes leurs capacités d'utilisation d'outils. Comme Gradio, acquis par Hugging Face en décembre 2021, de nombreuses démonstrations sur Hugging Face Spaces sont réalisées de cette manière. La communauté de l'IA a réagi positivement, de nombreux chercheurs et développeurs étant impatients d'explorer les capacités de ces modèles.

Points clés :
⭐ Les modèles d'IA open source publiés par Groq surpassent les modèles propriétaires des géants de la technologie pour des tâches spécifiques.
⭐ En utilisant des données synthétiques pour l'entraînement, Groq remet en question les problèmes courants de confidentialité des données et de surapprentissage dans le développement de modèles d'IA.
⭐ Le lancement de modèles open source pourrait changer le cours du développement dans le domaine de l'IA, favorisant une accessibilité plus large à l'IA et la création d'un écosystème d'innovation.

Actualités IA

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

La société norvégienne de robots 1X lance son premier robot humanoïde destiné aux ménages, le Neo, au prix de 20 000 dollars, avec un abonnement mensuel de 499 dollars. Ce robot de 1,68 mètre est spécialement conçu pour des tâches ménagères comme laver la vaisselle ou ranger, et utilise un mode de collaboration entre l'IA et une assistance humaine à distance pour accomplir des tâches complexes.

Oct 29, 2025

520

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

La technologie IA connaît un développement rapide, le secteur du jeu vidéo est en pleine transformation. L'IA générative apporte de nouvelles opportunités et défis, Microsoft, Amazon et d'autres entreprises réorientent leurs ressources vers les applications de l'IA. Les développeurs de jeux ont des avis divergents sur ce sujet, et le futur de l'industrie reste incertain.

Oct 29, 2025

330

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Lors de la conférence GTC 2025, NVIDIA a présenté le « projet de conception Omniverse DSX », destiné spécifiquement aux centres de données AI de plusieurs milliards de watts. Ce projet est appelé l'« usine IA ». Cette solution repose sur le cadre Omniverse et prend en charge des configurations allant d'un à dix milliards de watts. Elle vise à former et à exécuter efficacement des modèles AI de grande taille, répondant ainsi à la croissance continue des besoins en calcul IA, représentant une avancée majeure dans les infrastructures d'intelligence artificielle.

Oct 29, 2025

480

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, a fondé la société 'Contexte extrême', spécialisée dans le développement d'un Agent multimodal de marketing. Grâce à son expérience approfondie dans le domaine de l'AIGC, il a rapidement obtenu un financement initial de plusieurs millions de dollars. Liao Qian a travaillé chez Tencent et Bytedance, et s'est spécialisé dans les technologies AIGC depuis 2019, attirant ainsi l'attention de l'industrie.

Oct 29, 2025

320

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

SoulX-Podcast, modèle vocal dédié aux podcasts, génère une voix haute fidélité. Supporte longs dialogues multilingues et multiclocuteurs avec stabilité sur 90+ minutes.....

Oct 29, 2025

400

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Google Labs et DeepMind ont lancé ensemble l'outil d'IA Pomelli, en test public aux États-Unis, au Canada, en Australie et en Nouvelle-Zélande. Cet outil est destiné aux petites et moyennes entreprises, qui analyse intelligemment le contenu du site web pour créer rapidement des campagnes de marketing sur les réseaux sociaux conformes à l'identité de la marque, réduisant ainsi les barrières du marketing et permettant une création professionnelle de contenus. La fonction principale consiste en trois étapes pour construire l'ADN commercial.

Oct 29, 2025

410

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le PDG de Nvidia, Huang Renxun, a rejeté lors du congrès GTC à Washington la thèse d'une bulle sur le marché de l'intelligence artificielle. Il prévoit que les nouvelles puces Blackwell et Rubin généreront 500 milliards de dollars de revenus au cours des prochains trimestres, poussant l'entreprise dans une période de croissance sans précédent. C'est la première fois que Nvidia organise cet événement dans la capitale américaine.

Oct 29, 2025

260

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

OpenAI passe du non lucratif au commercial, cherchant activement des investissements pour accélérer sa croissance. Cette réorganisation renforce sa compétitivité sur le marché et a eu un impact significatif sur son partenaire Microsoft, qui a vu sa valeur boursière dépasser 4 000 milliards de dollars. L'utilisation généralisée des technologies comme ChatGPT est un facteur clé de cette poussée.

Oct 29, 2025

270

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Adobe lance le modèle de génération d'images IA professionnel Firefly Image5, marquant une transformation qualitative du ''suffisant'' vers le niveau professionnel. Les nouvelles fonctions comprennent une sortie native de 4 millions de pixels, un éditeur de commandes par couches, des modèles personnalisés de style artistique et une génération de musique d'accompagnement audio IA, fermant ainsi le cercle de la création artistique en IA pour les images, les vidéos et les audios, redéfinissant ainsi le flux de travail créatif.

Oct 29, 2025

400

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes

La société Cartesia lance le moteur d'IA vocale Sonic-3, prétendant être le modèle de conversation en temps réel le plus rapide et le plus naturel au monde. Il permet des interactions presque sans retard grâce à une nouvelle architecture de modèle à espace d'état, et est capable de simuler les émotions, le ton et les rires humains, améliorant ainsi significativement l'authenticité de la communication.

Oct 29, 2025

450

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Le modèle Llama IA open source de Groq arrive en tête du classement, surpassant GPT-4o et Claude en matière d'appels de fonctions

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le père de DayZ compare sa peur actuelle envers l'IA à la panique précédente face à Google et Wikipedia

NVIDIA présente un design révolutionnaire pour centres de données AI, favorisant le calcul à haute performance

Liao Qian, ancien responsable du produit AI de Jiansheng de Bytedance, lance son entreprise et lance un Agent multimodal de marketing

Le modèle vocal SoulX-Podcast est officiellement lancé : une génération de podcasts sans interruption pendant 90 minutes, une révolution du vocal IA en phase d'upgrade

Google lance un outil de marketing automatique par IA appelé Pomelli, qui génère du contenu de marketing en entrant l'URL d'un site web

Nvidia's Huang Renxun rejette la thèse de la bulle de l'IA, les nouvelles puces Nvidia devraient générer 500 milliards de dollars de chiffre d'affaires

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

Adobe Firefly Image 5 : une mise à jour majeure : génération native de 4 millions de pixels, piste audio IA + modèles personnalisés, les créateurs entrent dans l'ère de la création artistique complète avec l'IA

Retard révolutionnaire ! Cartesia lance le moteur d'IA vocale Sonic-3 : une communication extrêmement réaliste avec un retard inférieur à 100 millisecondes