Pixtral 12B est un modèle d'IA multi-modal développé par l'équipe Mistral AI. Il est capable de comprendre les images et les documents naturels, possède d'excellentes capacités de traitement de tâches multi-modales et maintient des performances de pointe sur les tests de référence textuels. Ce modèle prend en charge différentes tailles et ratios d'aspect des images, peut traiter un nombre quelconque d'images dans une fenêtre de contexte longue. Il s'agit d'une version améliorée de Mistral Nemo 12B, spécialement conçue pour le raisonnement multi-modal, sans sacrifier les capacités essentielles de traitement de texte.