Récemment, AMD et Qualcomm ont annoncé conjointement que leur matériel était officiellement compatible avec la série de modèles d'inférence ouverte gpt-oss lancée par OpenAI, marquant ainsi une importante étape dans l'intégration de l'informatique aux bords et de l'intelligence artificielle. La nouvelle série gpt-oss lancée par OpenAI comprend deux modèles : le gpt-oss-20b, qui possède moins de paramètres, et le gpt-oss-120b plus complexe. Le premier peut fonctionner en douceur sur un appareil équipé de 16 Go de mémoire, tandis que le second peut être exécuté efficacement sur une seule carte graphique de 80 Go.

AMD est fier d'annoncer que le processeur Ryzen AI Max+395 est le premier processeur de PC à intelligence artificielle grand public capable de faire tourner le modèle gpt-oss-120b. Pour s'adapter à ce modèle puissant, AMD a adopté le cadre GGML et le format MXFP4, permettant au gpt-oss-120b de fonctionner sans accroc en utilisant environ 61 Go de mémoire vidéo. De plus, la plateforme "Strix Halo" dispose d'un mémoire uniformisé de 128 Go, pouvant allouer 96 Go au GPU pour répondre aux besoins d'exécution.

image.png

En termes de performance, le Ryzen AI Max+395 peut produire 30 tokens par seconde lors de l'exécution du gpt-oss-120b, et prend en charge le protocole de contexte MCP pour les modèles. Cela signifie que les utilisateurs peuvent bénéficier d'une vitesse de réponse plus rapide et d'une plus grande efficacité lors du traitement de tâches complexes.

Qualcomm a déclaré que, lors des tests préliminaires, le modèle gpt-oss-20b a démontré d'excellentes capacités de raisonnement en chaîne de pensée sur sa plateforme Snapdragon. Les développeurs peuvent facilement accéder à ce modèle sur les appareils équipés de puces Snapdragon via des plateformes connues comme Hugging Face et Ollama, afin d'exploiter pleinement ses grandes capacités.

image.png

Cette collaboration illustre non seulement la vision prospective d'AMD et de Qualcomm dans le domaine de l'intelligence artificielle, mais elle pave également la voie pour l'avenir de l'informatique aux bords et de l'intelligence artificielle. Avec l'application large du modèle gpt-oss, nous pouvons attendre des appareils plus intelligents et des scénarios d'applications d'intelligence artificielle plus flexibles.