vision-parse é uma ferramenta que utiliza modelos de linguagem visual (Vision LLMs) para analisar documentos PDF em conteúdo Markdown bem formatado. Suporta diversos modelos, incluindo OpenAI, LLama e Gemini, conseguindo identificar e extrair texto e tabelas inteligentemente, mantendo a estrutura hierárquica, o estilo e a indentação do documento. As principais vantagens da ferramenta incluem alta precisão na extração de conteúdo, preservação da formatação, suporte a múltiplos modelos e hospedagem de modelos locais, sendo ideal para usuários que necessitam de processamento eficiente de documentos.