Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning (2017)
動画
- 1Pが人間のエキスパート
- 2Pが強化学習エージェント
論文紹介
https://arxiv.org/abs/1702.06230
スマブラDXを強化学習して、エキスパートに勝利した論文です。 DX大好きなので読んでみました。
しかしQ学習が非定常性な相手であるself-playに向かないっていうのは直感的ですね。 Discussionでちょろっと話されてるぐらいで、きっちり示されてるわけではないですが…。
zennのメモ
Beating the World’s Best at Super Smash Bros. Melee with Deep ReinforcementLearning (2017) スマブラDXへRL
しばらくスクラップをOpenにしておくので、ご意見ございましたら気軽にどうぞ。