ShowUI est un modèle visuel-langage-action léger, conçu pour les agents GUI. Il combine entrée visuelle, compréhension du langage et prédiction d'action, permettant aux interfaces informatiques de répondre aux instructions des utilisateurs de manière plus naturelle. Son importance réside dans son aptitude à améliorer l'efficacité et le naturel de l'interaction homme-machine, notamment dans les domaines de l'automatisation des interfaces graphiques et du traitement du langage naturel. Développé par le laboratoire showlab, il est désormais disponible sur la plateforme Hugging Face pour la recherche et les applications.