小巧強大!口袋級視覺AI模型moondream2:僅有16億參數,手機就能運行
最近,西雅圖的一家初創公司 Moondream 推出了名爲 moondream2的緊湊型視覺語言模型。儘管體積小巧,但該模型在各項基準測試中表現出色,備受關注。作爲一個開源模型,moondream2有望在智能手機上實現本地圖像識別功能。moondream2於三月正式發佈,該模型能夠處理文本和圖像輸入,具備回答問題、文本提取(OCR)、物體計數和物品分類等能力。自發布以來,Moondream 團隊持續更新該模型,不斷提升其基準性能。7月份的版本在 OCR 和文檔理解方面顯示出顯著進步,尤其是在對歷史經濟數據的分析