Unitxt est une bibliothèque innovante, spécialement conçue pour les modèles linguistiques génératifs, permettant de personnaliser la préparation et l'évaluation des données textuelles. Intégrant nativement des bibliothèques courantes comme Hugging Face et LM-eval-harness, Unitxt décompose les processus de traitement en composants modulaires, facilitant ainsi la personnalisation et le partage. Ces composants incluent une définition complète du traitement des jeux de données, intégrant des formats spécifiques aux modèles et des invites de tâches. Unitxt-Catalog centralise ces composants, favorisant la collaboration et l'exploration dans les flux de travail modernes de données textuelles. Plus qu'un simple outil, Unitxt est une plateforme communautaire qui permet aux utilisateurs de collaborer à la construction, au partage et à l'amélioration de leurs pipelines de données.