クラウドエンジニアのノート

情報技術系全般，自分用メモを公開してます。

Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning (2017)

論文紹介機械学習強化学習 DLゼミ

動画

1Pが人間のエキスパート
2Pが強化学習エージェント

論文紹介

https://arxiv.org/abs/1702.06230

スマブラDXを強化学習して、エキスパートに勝利した論文です。 DX大好きなので読んでみました。

しかしQ学習が非定常性な相手であるself-playに向かないっていうのは直感的ですね。 Discussionでちょろっと話されてるぐらいで、きっちり示されてるわけではないですが…。

zennのメモ

Beating the World’s Best at Super Smash Bros. Melee with Deep ReinforcementLearning (2017) スマブラDXへRL

しばらくスクラップをOpenにしておくので、ご意見ございましたら気軽にどうぞ。