AIbase
プロダクトライブラリツールナビゲーション

MaxMinLCB

Public

Code for our paper "Bandits with Preference Feedback: A Stackelberg Game Perspective"

作成時間2024-06-18T01:00:42
更新時間2025-01-30T18:42:57
https://arxiv.org/abs/2406.16745
3
Stars
0
Stars Increase