यह Github प्रोजेक्ट GPT मॉडल का उपयोग करके PDF फ़ाइलों को解析 करता है, जो PDF में टाइपोग्राफी, गणितीय सूत्र, तालिकाएँ, चित्र, चार्ट आदि को पूरी तरह से解析 कर सकता है, प्रति पृष्ठ औसत लागत $0.013 है। PDF फ़ाइल解析 करने के चरण इस प्रकार हैं: 1. PyMuPDF पुस्तकालय का उपयोग करके PDF को गैर-टेक्स्ट क्षेत्रों और टेक्स्ट क्षेत्रों में解析 करें।
PyMuPDF पुस्तकालय का उपयोग करके PDF को गैर-टेक्स्ट क्षेत्रों और टेक्स्ट क्षेत्रों में解析 करें, और बड़े दृश्य मॉडल (जैसे GPT-4o) का उपयोग करके解析 करें और Markdown फ़ाइल प्राप्त करें। 2. बड़े दृश्य मॉडल (जैसे GPT-4o) का उपयोग करके解析 करें और Markdown फ़ाइल प्राप्त करें।