【Report d'AIbase】IBM a annoncé une collaboration stratégique avec la jeune entreprise de semi-conducteurs Groq, intégrant sa technologie d'inférence de haut niveau à la plateforme watsonx, afin d'offrir aux clients entreprises des solutions d'intelligence artificielle plus rapides et plus économiques. Cette collaboration marque un pas clé pour IBM dans le domaine de l'accélération de l'IA au niveau entreprise.

Avec cette collaboration, les utilisateurs IBM peuvent accéder directement au service GroqCloud via Watsonx Orchestrate. Groq est connue pour son architecture de processeur de traitement linguistique (LPU) développée en interne, et affirme que ses performances sont cinq fois supérieures à celles des systèmes GPU traditionnels sur certaines tâches d'inférence d'IA, tout en réduisant significativement la consommation d'énergie et les coûts.

IBM

IBM déclare que l'intégration technique entre les deux parties sera prioritairement appliquée aux secteurs de la santé et du commerce de détail. Par exemple, dans le domaine médical, le système peut répondre efficacement à des milliers de requêtes de patients simultanément ; dans le secteur du commerce de détail, il peut être utilisé pour l'automatisation intelligente des ressources humaines et des chaînes d'approvisionnement. De plus, IBM et Groq prévoient de combiner la technologie vLLM open source de Red Hat avec l'hardware LPU de Groq, afin d'améliorer la flexibilité du déploiement des modèles et de permettre à GroqCloud de prendre en charge le modèle Granite développé par IBM. Actuellement, les clients IBM peuvent déjà utiliser les fonctions principales de GroqCloud.