アリグループと清華大学が共同開発した強化学習トレーニングフレームワーク「AReaL v1.0」が公開。エージェントのコード変更不要で多様なフレームワークと互換性があり、高い汎用性と効率的なトレーニングを実現。....
inclusionAI
AReaLはアリババグループによって開発された非同期強化学習訓練システムで、大型推論モデル向けに設計され、高速訓練と最先端の性能をサポートします。