Ollama推出全新多模态AI引擎,推理性能显著提升
前不久,Ollama 宣布推出一款全新的多模态 AI 引擎,这款引擎的研发是独立于原有的 llama.cpp 框架进行的,标志着公司在人工智能领域迈出了重要一步。这一引擎是基于 Golang 编程语言开发,旨在大幅提高本地推理的精度,同时增强大型图像处理的能力。新引擎的亮点在于其引入了图像处理元数据、KVCache 优化及图像缓存功能。这些创新使得在内存管理和资源利用效率上都取得了突破,确保 AI 模型在运行时更加高效。这对于需要处理大量数据的复杂模型,如 Llama4Scout,尤为重要,能够在更短