Récemment, IBM a lancé quatre nouveaux modèles Granite4.0Nano, dont la taille des paramètres varie de 3,5 millions à 1,5 milliard, démontrant l'importance qu'accorde l'entreprise à l'efficacité et à l'accessibilité dans le domaine de l'intelligence artificielle. Contrairement aux grands modèles du secteur qui reposent généralement sur le cloud, les modèles Granite4.0Nano peuvent fonctionner sur un ordinateur portable ordinaire, voire même dans un navigateur web. Cela permet aux développeurs de créer des applications adaptées aux appareils grand public ou aux dispositifs de périphérie sans dépendre des services cloud.

image.png

Tous les modèles Granite4.0Nano sont publiés sous licence Apache 2.0, ce qui les rend adaptés aux chercheurs, aux entreprises et aux développeurs indépendants, et autorise leur utilisation commerciale. Ces modèles sont compatibles avec divers outils tels que llama.cpp, vLLM et MLX, et ont obtenu la certification ISO 42001 pour le développement d'IA responsable.

La famille Granite4.0Nano comprend quatre modèles : Granite-4.0-H-1B (environ 150 millions de paramètres), Granite-4.0-H-350M (environ 3,5 millions de paramètres), Granite-4.0-1B (une variante avec environ 200 millions de paramètres) et Granite-4.0-350M (une variante). Les modèles de la série H utilisent une architecture hybride à espace d'état, adaptée aux environnements de périphérie à faible latence, tandis que les modèles de type transformer classiques offrent une compatibilité plus large.

Même si le marché compte déjà de nombreux petits modèles linguistiques, la famille Nano d'IBM se distingue par ses performances exceptionnelles. Les derniers tests de référence montrent que les modèles Granite4.0 surpassent leurs concurrents dans plusieurs domaines. L'équipe de recherche d'IBM affirme que ces modèles se distinguent particulièrement dans les tâches de suivi d'instructions et d'appel de fonctions, tout en présentant un avantage en termes de demande de mémoire et de vitesse d'exécution, permettant ainsi une exécution fluide sur des appareils mobiles ou des processeurs centraux (CPU).

image.png

Il convient de noter que non seulement IBM a publié ces modèles, mais elle interagit activement avec la communauté des développeurs, recueille des retours et discute des projets futurs. L'équipe Granite s'engage sur Reddit avec les utilisateurs, montrant ainsi les efforts de l'entreprise pour promouvoir le développement d'IA open source.

huggingface:https://huggingface.co/blog/ibm-granite/granite-4-nano

Points clés :

🌟 IBM a lancé les modèles Granite4.0Nano, qui peuvent fonctionner sur des matériels ordinaires, améliorant ainsi l'accessibilité des petits modèles d'IA.

🛠️ Tous les modèles sont publiés sous licence Apache 2.0, adaptés aux usages de recherche et commerciaux, assurant ainsi l'ouverture et la compatibilité.

📈 Les derniers tests de référence montrent que les modèles Granite4.0 surpassent les produits concurrents en performance, démontrant une capacité de traitement efficace.