Liquid AI發佈LFM2-VL系列視覺語言基礎模型,推動多模態AI向輕量化、快速化和設備端部署發展。該系列包含450M和1.6B兩款輕量級模型,前者適用於資源受限環境,後者支持單GPU部署。模型基於LFM2架構,整合了視覺與語言處理能力。
Liquid AI推出LFM2-VL視覺語言模型系列,專爲低延遲和設備部署優化。包括450M和1.6B兩個高效變體,適用於手機、筆記本、可穿戴設備等,兼顧速度與準確性。相比現有模型,GPU推理速度提升兩倍,推動多模態AI應用發展。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
bartowski
這是LiquidAI的LFM2-VL-1.6B模型的量化版本,使用llama.cpp進行imatrix量化處理,提供多種量化級別選擇,能夠在不同硬件條件下高效運行視覺語言模型。
sabaridsnfuji
日本收據視覺語言模型lfm2-450M是一款專門用於理解和處理日本收據的視覺語言模型。它基於LiquidAI的LFM2-VL-450M基礎模型構建,能夠分析收據圖像,提取結構化信息,回答關於收據內容的問題,並以日語和英語提供詳細描述。