Exo Labs fait son apparition ! Exécutez des modèles d'IA open source puissants en local sur les Mac M4

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Nov 14, 2024

1.9k

Dans le domaine de l'intelligence artificielle générative, les efforts d'Apple semblent principalement concentrés sur les appareils mobiles, notamment le dernier système iOS 18. Cependant, la nouvelle puce Apple M4, intégrée aux derniers Mac Mini et Macbook Pro, affiche des performances exceptionnelles, permettant l'exécution efficace des modèles linguistiques de base (LLM) open source les plus puissants du moment, tels que Llama-3.1405B de Meta, Nemotron70B de Nvidia et Qwen2.5Coder-32B.

Exo Labs, une startup créée en mars 2024, se consacre à la « démocratisation de l'accès à l'intelligence artificielle ». Son co-fondateur, Alex Cheema, a réussi à construire un cluster de calcul local en utilisant plusieurs appareils M4.

Il a connecté quatre Mac Mini M4 (599 $ chacun) à un Macbook Pro M4 Max (1599 $), utilisant le logiciel open source d'Exo pour exécuter Qwen2.5Coder-32B d'Alibaba. Le coût total du cluster est d'environ 5000 $, ce qui représente un excellent rapport qualité-prix par rapport à un GPU Nvidia H100, dont le prix se situe entre 25 000 et 30 000 $.

Les avantages d'un cluster de calcul local par rapport aux services en ligne sont évidents. L'exécution des modèles d'IA sur des appareils contrôlés par l'utilisateur ou l'entreprise permet de réduire les coûts, tout en améliorant la confidentialité et la sécurité. Cheema a déclaré qu'Exo Labs améliore constamment son logiciel d'entreprise, et que plusieurs entreprises l'utilisent déjà pour l'inférence IA locale. Cette tendance devrait s'étendre progressivement aux particuliers et aux entreprises.

Le succès récent d'Exo Labs est dû aux performances exceptionnelles de la puce M4, qualifiée de « cœur de GPU le plus rapide au monde ».

Cheema a révélé que le cluster Mac Mini M4 d'Exo Labs peut exécuter Qwen2.5Coder32B à une vitesse de 18 jetons par seconde et Nemotron-70B à 8 jetons par seconde. Cela montre que les utilisateurs peuvent traiter efficacement les tâches d'entraînement et d'inférence de l'IA sans dépendre des infrastructures cloud, rendant ainsi l'IA plus accessible aux consommateurs et aux entreprises soucieux de la confidentialité et des coûts.

Pour soutenir davantage cette vague d'innovation en matière d'IA locale, Exo Labs prévoit de lancer un site web de benchmark gratuit, afin de fournir des comparaisons détaillées de configurations matérielles et d'aider les utilisateurs à choisir la meilleure solution d'exécution de LLM en fonction de leurs besoins et de leur budget.

Accès au projet : https://github.com/exo-explore/exo

Points clés :
🌟 Exo Labs utilise la puce Apple M4 pour exécuter avec succès de puissants modèles d'IA open source sur un cluster de calcul local.
💰 L'exécution locale des modèles d'IA réduit les coûts, améliore la confidentialité et la sécurité, et évite la dépendance aux services cloud.
📊 Exo Labs lancera un site web de benchmark pour aider les utilisateurs à choisir la configuration matérielle appropriée pour leurs tâches d'IA.

Intelligence Artificielle Générative iOS18 AppleM4 ExoLabs

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Reply et AWS s'associent stratégiquement pour stimuler l'innovation en matière d'intelligence artificielle générative

Reply, leader mondial de l'intégration de systèmes et du conseil, a récemment annoncé un accord de partenariat stratégique pluriannuel avec Amazon Web Services (AWS) afin d'accélérer l'innovation et l'adoption de l'intelligence artificielle générative (IA générative). Ce partenariat aidera les entreprises du monde entier à exploiter pleinement le potentiel de l'IA grâce à des infrastructures cloud de pointe et des capacités pilotées par l'IA. Reply et ses filiales Data Reply et Storm Reply collaboreront avec AWS pour développer des solutions améliorant l'efficacité et la productivité des processus sectoriels.

Apr 2, 2025

La Cyberspace Administration de Chine publie la « Méthode d'identification du contenu synthétique généré par l'intelligence artificielle » : le contenu synthétique généré par l'IA doit être clairement identifié

Le Bureau de l'information sur Internet de Chine, le Ministère de l'industrie et des technologies de l'information, le Ministère de la sécurité publique et l'Administration d'État de la radiodiffusion et de la télévision ont élaboré conjointement la « Méthode d'identification du contenu synthétique généré par l'intelligence artificielle ». Cette nouvelle réglementation vise à faire face aux problèmes sociétaux actuels liés à la prolifération de contenus générés par l'IA, en particulier la diffusion de fausses informations, qui affectent le droit à l'information et les droits et intérêts légitimes du public. Ce règlement stipule clairement que tous les contenus synthétiques générés par l'IA, tels que les textes, les audios, les images et les vidéos, doivent être clairement identifiés à un endroit approprié. Cette mesure permettra de protéger efficacement les citoyens, les personnes morales et autres organisations.

Mar 14, 2025

180

Rapport Deloitte : 74 % des entreprises ont atteint ou dépassé le retour sur investissement de l'IA générative

À l'échelle mondiale, les entreprises de tous types s'efforcent de comprendre l'intelligence artificielle générative (IA générative) et d'explorer sa valeur potentielle. Selon un récent rapport de Deloitte sur l'état de l'intelligence artificielle générative, la plupart des organisations obtiennent en fait de bons résultats en matière de retour sur investissement. Ce rapport, basé sur une enquête menée auprès de 2 773 dirigeants dans 14 pays, révèle les progrès et les défis des organisations en matière d'application de l'intelligence artificielle générative. Légende de l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney.

Jan 22, 2025

1.3k

238 services d'intelligence artificielle générative enregistrés auprès du Cyberspace Administration of China en 2024

Le 8 janvier, le Bureau d'information Internet de Chine a publié un communiqué sur l'enregistrement des services d'intelligence artificielle générative, soulignant l'importance de promouvoir l'innovation et la réglementation dans ce domaine. Conformément aux dispositions des "Règles provisoires sur la gestion des services d'intelligence artificielle générative", le département de la cybersécurité continuera à promouvoir l'enregistrement des services d'intelligence artificielle générative. Au 31 décembre 2024, 302 services d'intelligence artificielle générative avaient été enregistrés auprès du Cyberspace Administration of China, dont 238 nouveaux services enregistrés en 2024. Cela montre que le domaine de l'intelligence artificielle générative est en pleine expansion...

Jan 9, 2025

2.0k

Shanghai ajoute 9 nouveaux services d'intelligence artificielle générative enregistrés

L'office de cybersécurité de Shanghai a publié un nouveau communiqué concernant l'enregistrement des services d'intelligence artificielle générative, visant à promouvoir l'innovation et l'utilisation réglementée de l'IA générative dans la ville. Conformément aux dispositions du « Règlement provisoire sur la gestion des services d'intelligence artificielle générative », Shanghai a procédé à l'enregistrement ordonné des services d'IA générative et a enregistré les services utilisant les capacités des modèles enregistrés via une API ou d'autres moyens. À ce jour, Shanghai a ajouté 9 nouveaux services d'IA générative enregistrés, portant le nombre total de services enregistrés à 63. Cet enregistrement...

Dec 31, 2024

2.1k

Microsoft met en garde : l'intelligence artificielle générative favorise la cybercriminalité et la manipulation électorale

Microsoft a récemment publié un livre blanc analysant en profondeur l'utilisation malveillante de l'intelligence artificielle (IA) générative, notamment pour la fraude, la création de matériel d'abus sexuel sur les enfants, la manipulation électorale et la diffusion non consentie d'images privées. La société souligne que ces problèmes ne sont pas seulement des défis technologiques, mais aussi de graves menaces pour la société. Note sur l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney. D'après le livre blanc de Microsoft, les criminels utilisent de plus en plus les capacités de l'IA générative pour commettre des actes malveillants. Ces actes incluent l'utilisation d'IA pour générer de fausses...

Nov 6, 2024

1.5k

Les résultats du troisième trimestre de Corning connaissent une forte croissance, grâce aux produits d'intelligence artificielle générative

Corning Incorporated (Corning Inc.) a récemment publié son rapport financier du troisième trimestre. Ce rapport montre que Corning a enregistré d'excellents résultats au troisième trimestre 2024, principalement grâce à la demande croissante de produits de connectivité fibre optique, particulièrement adaptés aux applications d'intelligence artificielle générative. Dans ce rapport, le chiffre d'affaires principal de Corning a atteint 3,73 milliards de dollars, soit une augmentation de 8 % par rapport à l'année précédente. Parallèlement, le bénéfice par action (BPA) de la société a augmenté de 20 %, atteignant 0,54 $. Cette croissance est due à...

Oct 30, 2024

930

En 2025, la véritable valeur de l'intelligence artificielle générative émergera

En 2025, l'intelligence artificielle générative (IA générative) devrait connaître un tournant décisif, révélant plus clairement son potentiel réel. À mesure que l'analyse de ses applications dans divers secteurs se précisera, l'IA générative, jusqu'alors noyée dans le bruit, dévoilera son véritable visage. Récemment, Hieb a estimé que les entreprises n'ont pas besoin d'opter pour des solutions coûteuses et complexes lorsqu'elles investissent dans l'IA générative. En réalité, de plus en plus d'entreprises découvrent que les grands modèles linguistiques (LLM) ne sont pas toujours...

Oct 22, 2024

1.9k

Le potentiel britannique en matière d'intelligence artificielle générative dépasse celui des autres pays du G7

Une nouvelle étude du cabinet de conseil Accenture révèle que le Royaume-Uni possède un potentiel en matière d'intelligence artificielle (IA) générative bien supérieur à celui des autres pays développés. Le rapport indique que l'exploitation efficace de cette technologie pourrait presque doubler la croissance économique britannique. Note sur l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney. Le rapport souligne que les plus grandes opportunités de l'IA générative résident dans l'amélioration de la productivité, en particulier dans le secteur public. Par exemple, les médecins pourraient gagner jusqu'à cinq heures de travail par semaine, et les commerciaux pourraient réduire considérablement leur temps de travail.

Oct 21, 2024

2.1k

Amazon rejoint C2PA pour lutter contre la désinformation générée par l'IA !

De nos jours, les deepfakes et les médias synthétiques sont de plus en plus courants grâce aux progrès de l'intelligence artificielle générative (IA générative). Pour relever ce défi, de nombreuses organisations s'efforcent d'améliorer les techniques de tatouage numérique afin de suivre l'origine du contenu. Bien qu'aucune organisation n'ait encore complètement réussi, le « Content Authenticity Initiative » (C2PA) renforce ses rangs. Le C2PA a annoncé qu'Amazon est devenu un nouveau membre de son conseil d'administration. Le C2PA est une norme technologique ouverte hébergée par la Fondation Linux.

Sep 14, 2024

2.8k

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu