Chunkr est un service d'API d'acquisition de données open source, spécialisé dans l'analyse de la mise en page de documents, l'OCR et le traitement par blocs, convertissant les documents en formats de données adaptés à RAG et LLM. Il prend en charge les fichiers PDF, DOC, PPT et XLS. Ce service structure le texte, les tableaux, les images et les contenus manuscrits, fournissant ainsi un support de données pour les applications d'intelligence artificielle et d'apprentissage automatique. Il est maintenu par Lumina AI Inc. et propose une période d'essai gratuite ainsi que différentes options tarifaires.