OpenAI lance un projet open source majeur ! Le modèle GPT-OSS est divulgué, son architecture MoE de 11,6 milliards de paramètres est révélée, l'ère nouvelle de l'IA arrive-t-elle ?

Récemment, des informations importantes ont circulé sur Internet selon lesquelles OpenAI allait lancer une série de modèles open source intitulée « GPT-OSS » (GPT Open Source Software), suscitant une grande attention dans le secteur. Selon les fichiers de configuration divulgués, cette série de modèles d'architecture système présente des paramètres variant de 2 milliards à 12 milliards, utilisant une architecture avancée MoE (Mélange d'Experts), combinée à une extension de contexte longue et à un mécanisme d'attention efficace, démontrant ainsi un fort potentiel de performance. L'équipe d'édition d'AIbase a analysé en profondeur les points techniques du GPT-OSS et son impact potentiel sur le secteur de l'IA.

Breakthroughs dans l'architecture MoE : un moteur puissant avec 11,6 milliards de paramètres rares. La série de modèles GPT-OSS utilise une architecture MoE Transformer, comprenant 36 couches, 128 experts et un mécanisme de routage Top-4, avec un total de 11,6 milliards de paramètres rares, dont environ 510 millions actifs. Cette conception réduit considérablement la consommation de ressources informatiques en répartissant les tâches entre plusieurs modules d'experts, tout en maintenant une haute performance. Comparé aux modèles traditionnels densément connectés, l'architecture MoE permet au GPT-OSS de fonctionner sur une plus grande variété d'environnements matériels, offrant plus de flexibilité à la communauté open source et aux développeurs.

Grande taille des paramètres : 11,6 milliards de paramètres rares au total, seulement 510 millions actifs, assurant un équilibre entre calcul efficace et performance puissante.

Déploiement flexible : l'architecture MoE réduit la dépendance aux clusters GPU à haut rendement, permettant aux équipes moyennes et petites d'utiliser ce modèle pour le développement.

Extension de contexte longue : capacité impressionnante de 131 000 Tokens. Le GPT-OSS a réalisé un grand progrès dans sa capacité à traiter le contexte. Sa longueur initiale de contexte est de 4 096 Tokens, étendue à environ 131 000 Tokens grâce à la technologie RoPE (Embedding de position rotatoire). Cette capacité à gérer un long contexte permet au modèle de traiter des documents très longs et des scénarios de dialogue complexes, s'appliquant notamment à la recherche académique, à l'analyse juridique et à la génération de code volumineux.

De plus, le modèle utilise un mécanisme d'attention à fenêtre glissante (Sliding Window Attention) avec une taille de fenêtre de 128 Tokens, combiné à la technologie GQA (Grouped Query Attention), ce qui entraîne une occupation de cache KV d'environ 72 Ko par Token et par couche. Ce design réduit significativement l'utilisation de mémoire tout en maintenant une capacité de traitement parallèle efficace, garantissant ainsi une excellente performance pour le traitement de documents longs. Optimisation des mécanismes d'attention : 64 têtes GQA et performance élevée. L'architecture d'attention du GPT-OSS est également remarquable.

Le modèle dispose de 64 têtes d'attention, chacune ayant une dimension de 64, combinée à la technologie GQA pour optimiser davantage l'efficacité du calcul. Par rapport à l'attention multi-tête traditionnelle, la GQA réduit la complexité du calcul en regroupant les requêtes, tout en augmentant la capacité du modèle grâce à une projection d'attention plus large (plus large que la dimension cachée). Ce design convient particulièrement aux scénarios nécessitant un haut débit et une faible latence, tels que la traduction en temps réel, la complétion du code et la génération de documents longs.

Avantages de performance : combinaison de GQA et de fenêtre glissante : réduction significative de l'utilisation de mémoire du cache KV, amélioration de l'efficacité de décodage.

Soutien NTK RoPE : grâce à une extension non uniforme de RoPE, la stabilité du codage de position est assurée dans les scénarios de long contexte.

Optimisation de haut débit : le modèle présente une excellente gestion des coûts de cache KV et des caractéristiques de parallélisme du côté du décodage, adapté aux environnements de production à grande échelle.

Stratégie d'open source : retour à l'esprit initial d'OpenAI ? L'annonce de l'ouverture du GPT-OSS par OpenAI est perçue comme un changement majeur dans sa stratégie. En tant qu'entreprise qui a progressivement renforcé la fermeture de ses modèles ces dernières années, cette initiative d'OpenAI pourrait être une réponse aux attentes prolongées de la communauté open source, tout en s'opposant à la forte présence de concurrents comme Meta et Mistral dans le domaine de l'IA open source. Selon les informations divulguées, la série GPT-OSS comprend plusieurs versions (comme les modèles de 2 milliards et 12 milliards de paramètres), montrant que OpenAI souhaite créer une famille de modèles couvrant différents besoins, offrant plus de choix aux développeurs.

Cependant, les fichiers de configuration divulgués ont également soulevé des controverses. Certains développeurs soulignent que bien que le modèle MoE de 11,6 milliards de paramètres soit puissant théoriquement, son exécution réelle pourrait nécessiter un matériel performant. Par exemple, exécuter un modèle de 12 milliards de paramètres pourrait nécessiter jusqu'à 1,5 To de mémoire, ce qui reste un défi pour les développeurs ordinaires. OpenAI n'a pas encore confirmé officiellement la véracité de ces informations divulguées, mais l'industrie considère généralement que la publication du GPT-OSS open source aura un impact profond sur l'écosystème de l'IA.

Avis d'AIbase :

Impact et défis potentiels du GPT-OSS. Les informations divulguées sur le GPT-OSS révèlent une nouvelle tentative d'OpenAI dans le domaine de l'open source, avec son architecture MoE, son extension de contexte longue et ses mécanismes d'attention efficaces, illustrant ainsi les tendances technologiques des prochains modèles d'IA. En réduisant les seuils de calcul et en optimisant l'utilisation de la mémoire, le GPT-OSS devrait offrir davantage d'opportunités d'innovation aux développeurs et aux institutions de recherche de petite et moyenne taille. Cependant, les exigences élevées en matière de matériel et les détails d'entraînement non entièrement divulgués pourraient limiter sa popularité. À l'avenir, comment OpenAI parviendra-t-il à équilibrer sa stratégie d'open source et de commercialisation, ainsi que comment optimisera-t-elle l'effet pratique de déploiement du modèle, seront des sujets d'attention majeurs.

Conclusion

Les informations divulguées sur le GPT-OSS d'OpenAI nous ont permis d'apercevoir les mystères des prochains modèles d'IA, avec son architecture MoE puissante et sa capacité à gérer un long contexte, annonçant ainsi une nouvelle ère dans les technologies d'IA. AIbase continuera à suivre les développements ultérieurs de cet événement, vous apportant les dernières actualités technologiques. Restez à l'écoute de la sortie officielle du GPT-OSS et de la manière dont il revitalisera l'écosystème de l'IA open source !

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

Website AI Friendliness Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

OpenAI lance un projet open source majeur ! Le modèle GPT-OSS est divulgué, son architecture MoE de 11,6 milliards de paramètres est révélée, l'ère nouvelle de l'IA arrive-t-elle ?

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

20 000 dollars pour un double de ménage ? Le robot humanoïde 1X Neo soutenu par OpenAI commence à être vendu en pré-commande, il entrera dans les foyers américains en 2024

Le redressement d'OpenAI pousse la valeur boursière de Microsoft à dépasser 4 000 milliards de dollars

OpenAI et PayPal collaborent pour permettre des paiements et achats commerciaux directs dans ChatGPT

PayPal et OpenAI font une collaboration, ChatGPT devient la première plateforme de paiement intégrée !

Microsoft et OpenAI redéfinissent leur alliance : le contrat de 25 milliards de dollars d'Azure permet à OpenAI d'acquérir une liberté cloud

OpenAI a achevé sa restructuration : du non lucratif au lucratif, l'avenir de l'intelligence artificielle est plus prometteur

OpenAI déclare officiellement son plan d'IPO ! Ogata : un investissement de 1,4 trillion de dollars dans les infrastructures, une capacité de calcul supplémentaire de 1 gigawatt par semaine, les géants de l'IA se rapprochent de la bourse

Le PDG d'OpenAI annonce : un chercheur en IA autonome en 2028

OpenAI prévoit d'investir 1 trillion de dollars par an pour promouvoir la construction d'infrastructures

La technologie de deepfake réapparaît avec des problèmes, l'outil nouvellement lancé par OpenAI, Sora, attire l'attention