このGithubプロジェクトは、GPTモデルを使用してPDFファイルを解析します。PDF内のレイアウト、数式、表、画像、グラフなどを完璧に解析でき、ページあたりの平均コストは0.013ドルです。 PDFファイルの解析手順は以下のとおりです。 1. PyMuPDFライブラリを使用して、PDFをテキスト領域と非テキスト領域に解析します。
最近、githubでgptpdfというオープンソースプロジェクトが注目を集め、1.1kのスターを獲得しました。これはGPT-4oに似たVLLMモデルを使用してPDFファイルを解析し、Markdown形式に変換するものです。
GPTを用いてPDFをMarkdownに変換するツール