Récemment, Google a officiellement annoncé que son nouveau modèle Gemini 2.5 Flash-Lite est désormais en version stable (GA). Cette version est considérée comme le modèle le plus rapide et le moins coûteux, marquant ainsi une nouvelle avancée importante dans le domaine de l'intelligence artificielle chez Google. Le Gemini 2.5 Flash-Lite offre un bon équilibre entre performance et coût, et prend en charge nativement un contexte allant jusqu'à 1 million de tokens, apportant de nombreuses fonctions avancées.

La stratégie de tarification du Gemini 2.5 Flash-Lite est également très intéressante : le prix pour un million de tokens d'entrée est de seulement 0,10 dollar, tandis que le prix pour un million de tokens de sortie est de 0,40 dollar, ce qui est comparable aux prix du concurrent GPT-4.1 Nano. De plus, par rapport à la version bêta précédente, le prix pour les entrées audio a baissé de 40 %, ce qui montre sa sensibilité aux besoins des utilisateurs et sa réactivité face à la concurrence.
Dans divers tests de référence, le Gemini 2.5 Flash-Lite dépasse la version précédente 2.0, couvrant plusieurs domaines tels que la programmation, les mathématiques, le raisonnement et la compréhension multimodale. Ce modèle prend en charge une fenêtre contextuelle de 1 million de tokens, dispose de budgets de pensée contrôlables (thinking budgets) et propose plusieurs outils natifs, tels qu'une intégration avec Google Search, l'exécution de code et la fonctionnalité d'contexte URL.
Les développeurs peuvent utiliser le modèle Gemini 2.5 Flash-Lite en utilisant simplement des instructions de code simples, en spécifiant le modèle comme gemini-2.5-flash-lite. Il convient de noter que l'ancien plan d'alias de la version bêta sera supprimé le 25 août, et les développeurs devraient s'adapter rapidement à la nouvelle version.
Cette publication du Gemini 2.5 Flash-Lite marque le dévouement de Google à innover et optimiser continuellement ses technologies d'intelligence artificielle, offrant aux développeurs des choix plus efficaces et économiques. À l'avenir, il jouera certainement un rôle plus important dans divers scénarios d'application.
Points clés :
🌟 Le Gemini 2.5 Flash-Lite est le dernier modèle d'IA le plus rapide et le moins coûteux lancé par Google, désormais en version stable (GA).
💰 Ce modèle est facturé à 0,10 dollar par million de tokens d'entrée et à 0,40 dollar par million de tokens de sortie, avec une baisse de 40 % du prix des entrées audio par rapport à la version bêta.
🔧 Les développeurs peuvent utiliser la nouvelle version en spécifiant le nom du modèle gemini-2.5-flash-lite. L'ancien plan d'alias de la version bêta sera supprimé le 25 août.