IBM與Hugging Face聯手放大招!開源“文檔解密神器”SmolDocling,複雜文檔一鍵變結構化數據!
話說在計算機科學領域,將那些結構複雜的文檔變成規整的數據,一直是個讓人頭疼的“老大難”問題。以前的“土辦法”,要麼是各種模型“組團出道”,搞出一套複雜的流程,要麼就得祭出“巨無霸”級別的多模態模型,雖然看起來很厲害,但動不動就“幻覺”,還特別“燒錢”。不過最近由IBM和Hugging Face聯手推出的SmolDocling,只有256M參數的開源視覺-語言模型(VLM),目標非常明確,就是要端到端地解決多模態文檔轉換的任務。SmolDocling的獨門祕籍SmolDocling最讓人稱道的地方,就是它