メタ情報

著者

MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2) from harmonylab

論文読む時に書いた汚いメモです。精読するときに役に立つかもです。

Worldモデルは、生成モデルとモデルベース強化学習の両方の知識がないとわからないので難しいです。 dynamics backpropの部分はよくわかっていないので誰か教えて下さい。

あと、生成モデルと強化学習の部分の説明は、松尾研スプリングセミナー2021からいろいろ抜粋させて頂きました。非営利なので多めに見ていただけるとたかをくくっていますが、もし問題がございましたら、お手数ですがご連絡ください。