Dans le développement de l'IA en entreprise, outre le choix d'un bon modèle et de bons prompts, l'optimisation des prompts est tout aussi cruciale. La technologie Agent Bricks récemment lancée par Databricks vise à résoudre ce problème et a encore amélioré les techniques d'optimisation des prompts. Selon une nouvelle étude publiée aujourd'hui par la société, sa technologie GEPA (Génération Évolutionnaire des Prompts Adaptables) a réalisé un saut qualitatif dans l'optimisation des prompts, permettant aux entreprises de réduire les coûts d'exploitation des modèles jusqu'à 90 fois.

Entretien avec un robot IA, négociation

Note sur la source de l'image : l'image a été générée par l'IA, le fournisseur de licence est Midjourney

Cette avancée en optimisation des prompts intervient alors que Databricks a conclu un partenariat de 100 millions de dollars avec OpenAI. Ce contrat permettra aux clients d'entreprises de Databricks d'accéder nativement au modèle GPT-5, ce qui s'inscrit dans la lignée de collaborations antérieures avec Anthropic et Google. Il convient de souligner que les 100 millions de dollars ne représentent pas un paiement entre les deux entreprises, mais une estimation du potentiel de revenus pour cette collaboration.

« L'optimisation des prompts ne consiste pas seulement à optimiser les requêtes existantes, mais à reconstruire les requêtes elles-mêmes », a déclaré Tang Hanlin, chef technique en réseaux de neurones chez Databricks, lors d'une interview. Il a précisé que la technologie GEPA améliore la qualité de l'interaction avec les systèmes d'IA en ajustant la manière dont les entreprises posent leurs questions.

La GEPA utilise une méthode appelée réflexion en langage naturel, qui permet à l'IA d'évaluer elle-même ses propres résultats et d'améliorer progressivement ses performances. Grâce à ce cycle de rétroaction, cette technologie est capable de découvrir automatiquement les meilleures stratégies de prompts pour des tâches spécifiques. Les données montrent que les modèles optimisés par la GEPA ont obtenu des performances supérieures de 4 à 7 points par rapport aux modèles de référence dans plusieurs domaines tels que la finance, le droit, les affaires et la médecine.

Dans les applications d'entreprise, les modèles open source optimisés par Databricks coûtent seulement 1/90 de ceux de Claude Opus4.1 lorsqu'ils traitent 100 000 demandes. Cette avantagne devient encore plus évidente lors d'applications à grande échelle, où le coût unitaire optimisé devient négligeable par rapport au coût global d'un service long terme. La GEPA dépasse non seulement les techniques courantes de micro-ajustement supervisé, mais réduit également les coûts de service de 20 %, tout en économisant du temps pour les ingénieurs et les scientifiques des données.

De plus, l'intégration avec OpenAI permet aux entreprises d'utiliser plus facilement divers modèles de haute qualité. Tang Hanlin a mentionné qu'aucune relation externe avec un fournisseur ou aucun jeton API n'était nécessaire pour appeler directement le modèle GPT-5 au sein de Databricks. Cette intégration simplifie la gestion des fournisseurs, qui était auparavant nécessaire lors du déploiement de modèles avancés.

Pour aider les entreprises à déployer davantage la technologie IA, Tang Hanlin a donné trois conseils : tout d'abord, établir un mécanisme d'évaluation fiable ; ensuite, remettre en question les options par défaut du micro-ajustement traditionnel ; enfin, repenser la stratégie d'achat de modèles. Pour les entreprises souhaitant occuper une position dominante dans l'application de l'IA, il est clair que les barrières liées aux coûts de performance de l'IA ont été franchies, et les entreprises ayant investi tôt dans les capacités d'optimisation auront un avantage compétitif de plus en plus marqué.

Points clés :  

🌟 **Databricks lance la technologie GEPA, qui aide les entreprises à optimiser les prompts IA et à améliorer la qualité des interactions.**  

💰 **Partenariat de 100 millions de dollars avec OpenAI, permettant aux clients d'entreprises d'utiliser directement le modèle GPT-5.**  

🔍 **Des experts conseillent aux entreprises d'établir un mécanisme d'évaluation, de remettre en question le micro-ajustement traditionnel et de reconsidérer leur stratégie d'achat de modèles.**