メタ情報

著者

2021 08 24_dl_tomoya_oda from harmonylab

論文読む時に書いた汚いメモです。精読するときに役に立つかもです。

Transformer（GPT）で強化学習してみました系論文。有用性の検証のためにいろんな実験を行っているが、なにを示したいのかイマイチ理解できず、実験の意図がわからない部分が多かった。

おそらく性能としては現行のTD法を用いた手法がまだ強いのではと思う。ただ、長期的なタスク等に関してはDTが強い印象を受けました。

松尾研スプリングセミナー2021からいろいろ抜粋させて頂きました。非営利なので多めに見ていただけるとたかをくくっていますが、もし問題がございましたら、お手数ですがご連絡ください。