À l'ère actuelle du développement fulgurant de l'intelligence artificielle (IA), les entreprises s'efforcent d'intégrer les technologies d'IA dans leurs environnements de production afin d'optimiser leur retour sur investissement. Cependant, malgré la disponibilité de modèles d'IA avancés sur le marché, les équipes rencontrent encore de nombreux défis lors du déploiement.
Selon les estimations de Peter Bendor-Samuel, PDG d'Everest Group, 90 % des projets pilotes d'IA générative auront du mal à atteindre le stade de la production. De plus, Gartner prévoit que d'ici fin 2025, de nombreux projets d'IA générative seront abandonnés après la phase de preuve de concept.
Parmi ces défis, le principal obstacle réside dans les problèmes de coordination. Les équipes manquent souvent de ressources suffisantes pour mener à bien toutes les tâches, les obligeant à dépendre d'API tierces rigides et coûteuses. Pour combler cette lacune, Simplismart AI a récemment levé 7 millions de dollars pour lancer une plateforme d'exploitation d'apprentissage automatique de bout en bout, conçue pour accélérer l'ensemble du processus de coordination, du réglage fin des modèles au déploiement et à la surveillance.
Par rapport aux autres solutions d'exploitation de l'apprentissage automatique sur le marché, Simplismart se distingue par son moteur d'inférence optimisé par logiciel personnalisé. Ce moteur permet un déploiement extrêmement rapide des modèles, améliorant considérablement les performances et réduisant les coûts associés. Amitanshu Jain, co-fondateur de Simplismart, affirme qu'en l'absence d'optimisation matérielle, le modèle Llama3.18B a atteint un débit de 501 jetons par seconde, surpassant largement les autres moteurs d'inférence.
Lors du déploiement interne de l'IA, les équipes doivent faire face à plusieurs goulots d'étranglement, notamment l'accès à la puissance de calcul, l'optimisation des performances des modèles, l'extension des infrastructures et l'efficacité des coûts. La plateforme Simplismart standardise l'ensemble du flux de travail, permettant aux utilisateurs d'ajuster, de déployer et de surveiller des modèles open source hautement optimisés selon leurs besoins.
Les utilisateurs peuvent choisir d'utiliser l'infrastructure partagée de Simplismart ou d'apporter leurs propres ressources de calcul, facilitant ainsi la configuration et le déploiement de leur propre infrastructure. De plus, le tableau de bord intuitif de la plateforme permet aux utilisateurs de configurer des paramètres tels que le GPU, le type de machine et l'échelle. La plateforme fournit également des fonctionnalités de surveillance permettant aux utilisateurs de suivre les accords sur les niveaux de service (SLA) et de surveiller les performances réelles des modèles.
Simplismart a actuellement établi des partenariats avec 30 clients entreprises et prévoit d'améliorer encore les performances de sa plateforme d'exploitation de l'apprentissage automatique. L'entreprise espère utiliser ce nouveau financement pour stimuler la R&D, accélérer l'inférence IA et viser une augmentation de son chiffre d'affaires annuel d'environ 1 million de dollars à 10 millions de dollars dans les 15 prochains mois.
Points clés :
💡 90 % des projets pilotes d'IA générative auront du mal à atteindre le stade de la production, les problèmes de coordination étant le principal obstacle.
🚀 Le moteur d'inférence personnalisé de Simplismart a atteint un débit de 501 jetons par seconde sans optimisation matérielle.
📈 L'entreprise a établi des partenariats avec 30 clients entreprises et vise un chiffre d'affaires annuel de 10 millions de dollars dans les 15 prochains mois.