E2Mは、様々なファイルタイプをMarkdown形式に解析・変換できるPythonライブラリです。パーサー-コンバーターアーキテクチャを採用しており、doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4aなど、幅広いファイルフォーマットに対応しています。E2Mプロジェクトの最終目標は、検索強化生成(RAG)およびモデルのトレーニングやファインチューニングに高品質なデータを提供することです。