Pixtral 12B é um modelo de IA multimodal desenvolvido pela equipe Mistral AI, que consegue compreender imagens e documentos naturais, possuindo excelente capacidade de processamento de tarefas multimodais, ao mesmo tempo em que mantém o desempenho de ponta em testes de referência de texto. O modelo suporta diversos tamanhos e proporções de imagens, podendo processar um número arbitrário de imagens em uma janela de contexto longo. É uma versão aprimorada do Mistral Nemo 12B, projetada especificamente para inferência multimodal, sem sacrificar a capacidade crucial de processamento de texto.