E2M ist eine Python-Bibliothek, die verschiedene Dateitypen in das Markdown-Format parsen und konvertieren kann. Sie verwendet eine Parser-Konverter-Architektur und unterstützt die Konvertierung verschiedener Dateiformate, darunter doc, docx, epub, html, htm, url, pdf, ppt, pptx, mp3 und m4a. Das endgültige Ziel des E2M-Projekts ist die Bereitstellung hochwertiger Daten für Retrieval Augmented Generation (RAG) und Modelltraining oder -feintuning.