マイクロソフトが Agent Lightning をリリース:強化学習を活用した大規模言語モデルのトレーニングを支援する新しいAIフレームワーク
マイクロソフトはオープンソースフレームワークである Agent Lightning をリリースしました。このフレームワークは強化学習を利用してマルチエージェントシステムを最適化します。現行のアーキテクチャを変更することなく、実際のエージェント行動を強化学習の遷移に変換し、大規模言語モデルの戦略性能を向上させます。このフレームワークではエージェントを部分的に観測可能なマルコフ意思決定過程としてモデル化し、現在の入力を観測とし、モデル呼び出しを行動として扱います。さらに報酬メカニズムを取り入れています。