Ollama推出全新多模態AI引擎,推理性能顯著提升
前不久,Ollama 宣佈推出一款全新的多模態 AI 引擎,這款引擎的研發是獨立於原有的 llama.cpp 框架進行的,標誌着公司在人工智能領域邁出了重要一步。這一引擎是基於 Golang 編程語言開發,旨在大幅提高本地推理的精度,同時增強大型圖像處理的能力。新引擎的亮點在於其引入了圖像處理元數據、KVCache 優化及圖像緩存功能。這些創新使得在內存管理和資源利用效率上都取得了突破,確保 AI 模型在運行時更加高效。這對於需要處理大量數據的複雜模型,如 Llama4Scout,尤爲重要,能夠在更短