Kimiと清華大学が、AI推論効率を向上させるオープンソース大規模モデル推論アーキテクチャMooncakeを共同開発
人工知能の急速な発展に伴い、大規模モデルの知能化レベルは向上していますが、それに伴い推論システムの効率性の課題もますます顕著になっています。高い推論負荷への対応、推論コストの削減、応答時間の短縮は、業界が直面する重要な課題となっています。Kimi社と清華大学のMADSys研究室は、KVCacheをベースとしたMooncake推論システム設計案を発表し、2024年6月に正式リリースしました。Mooncake推論システムは、…