速報!Ollama 0.2バージョンがリリースされました!今回のアップデートでは、同時実行機能がデフォルトで有効になり、Ollamaが複数のリクエストを同時に処理できるようになり、より高速な体験を提供します。このアップデートにより、並列リクエスト機能の利用が可能になっただけでなく、異なるモデルを同時にロードすることもできるようになり、Ollamaは様々なタスクをより効率的に処理できるようになりました。
Ollama公式の発表によると、今回のアップデートにより、Ollamaは複数のチャットセッションの処理、チームへのコード補完サービスの提供、ドキュメントの異なる部分の同時処理、さらには複数のエージェントの同時実行が可能になります。さらに、Ollamaは検索強化生成(RAG)やエージェントなど、さまざまなモデルのロードに対応しており、ユーザーは大規模モデルと小規模モデルを同時に実行して、システムの柔軟性とパフォーマンスを向上させることができます。
なお、今回のアップデートでは、リクエストとGPUメモリの使用状況に応じて動的に調整されるモデルの自動ロードとアンロード機能も追加されました。これにより、システムの安定性と効率性が確保されます。これらのアップデートにより、Ollamaはより強力でスマートになり、ユーザーにより質の高い体験を提供します。最新のOllama 0.2を体験してみませんか?今すぐリンクをクリックしてダウンロードしましょう!
公式ダウンロードアドレス:https://ollama.com/download