Ollama 0.2 发布:默认启用并发 同时处理多个请求和加载多个模型
Ollama 0.2版本发布,新特性包括默认启用并发功能,允许同时处理多请求,提升用户体验。该更新增加了并行请求与不同模型的并行加载能力,优化了处理任务效率,支持多任务处理,包括聊天会话、代码完成与文档处理等。同时,系统增加了模型自动加载与卸载功能,根据GPU内存使用动态调整,确保稳定与高效运行。这次更新使得Ollama变得更强大与智能,带来了更优质的使用体验。欲体验新版本,可访问官方下载地址:https://ollama.com/download。