AMDがvLLM-ATOMプラグインをリリースし、国内の大規模モデルの推論性能を深く最適化
AMDはvLLM-ATOMプラグインを発表しました。このプラグインは既存のワークフローを変更することなく、ハードウェアの可能性を最大限に引き出すことを目的としており、DeepSeek-R1やKimi-K2などの主要な大規模言語モデルの推論を顕著に高速化します。vLLMは高負荷環境におけるスループットとGPUメモリ使用効率を最適化するオープンソースフレームワークで、リクエストのスケジューリングとキャッシュ管理に特化しています。一方、ATOMプラグインはこの能力をさらに強化します。