クラウドエンジニアのノート

情報技術系全般,自分用メモを公開してます。

Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning (2017)

動画

  • 1Pが人間のエキスパート
  • 2Pが強化学習エージェント

論文紹介

https://arxiv.org/abs/1702.06230

スマブラDX強化学習して、エキスパートに勝利した論文です。 DX大好きなので読んでみました。

しかしQ学習が非定常性な相手であるself-playに向かないっていうのは直感的ですね。 Discussionでちょろっと話されてるぐらいで、きっちり示されてるわけではないですが…。

zennのメモ

Beating the World’s Best at Super Smash Bros. Melee with Deep ReinforcementLearning (2017) スマブラDXへRL

しばらくスクラップをOpenにしておくので、ご意見ございましたら気軽にどうぞ。