ds4sd
這是一個256M參數的預覽版文檔理解模型,專為文檔結構解析和內容提取任務設計,支持將圖像文檔轉換為結構化數據。
docling-project
SmolDocling-256M-preview-mlx-bf16 是一個基於 SmolDocling-256M-preview 轉換的輕量級視覺語言模型,專門用於文檔圖像理解和轉換。該模型使用 MLX 框架進行優化,支持將文檔圖像轉換為結構化的 DocTags 格式。
ahishamm
該模型是從 ds4sd/SmolDocling-256M-preview 轉換為 MLX 格式的視覺語言模型,支持圖像文本到文本任務。
SmolDocling是一款超緊湊的多模態視覺語言模型,專門為高效的文檔轉換而設計。該模型基於Idefics3架構,在256M參數規模下實現了強大的文檔理解能力,支持從圖像中提取文本、表格、公式、代碼等多種文檔元素,並與Docling生態系統完全兼容。