Avec le développement rapide des technologies d'intelligence artificielle à l'échelle mondiale, Moore Threads a connu un nouveau progrès ! Son architecture de calcul parallèle universelle MUSA (Meta-computing Unified System Architecture), développée en interne, a récemment annoncé une compatibilité réussie avec le cadre d'inférence open source llama.cpp. Cette réalisation illustre non seulement l'expansion continue de Moore Threads dans l'écosystème de l'IA, mais offre également aux développeurs des outils d'inférence plus performants.

llama.cpp est un cadre d'inférence pour les modèles de langage à grande échelle, implémenté uniquement en C/C++. Il est très apprécié pour son déploiement léger et sa compatibilité avec divers matériels. Il prend en charge non seulement les modèles populaires tels que LLaMA et Mistral, mais peut également être utilisé dans plusieurs scénarios multimodaux. Cette compatibilité signifie que les utilisateurs peuvent effectuer efficacement des tâches d'inférence IA sur les séries GPU MTT S80, S3000 et S4000 de Moore Threads, grâce aux images conteneurs officielles, ce qui améliore considérablement l'expérience utilisateur.

Il convient de noter que, en avril de cette année, la version 4.0.1 du SDK MUSA a déjà été étendue aux processeurs Intel ainsi qu'à la plateforme nationale Hygon. Cette collaboration avec llama.cpp réduit encore davantage les barrières à l'implémentation des grands modèles. Les développeurs n'ont qu'à configurer simplement quelques paramètres pour exécuter facilement diverses tâches d'inférence complexes sur les matériels IA locaux, apportant ainsi une nouvelle vitalité à l'écosystème des matériels IA nationaux.

Avec l'évolution constante des technologies d'intelligence artificielle, Moore Threads continue d'avancer dans l'industrie grâce à ses compétences technologiques innovantes, accélérant ainsi la diffusion et l'application des cadres d'inférence IA. On peut s'attendre à ce que, grâce à Moore Threads, l'intelligence artificielle montre un potentiel d'application plus large dans divers domaines, offrant aux utilisateurs davantage de commodités et de possibilités.