2019-07-07から1日間の記事一覧

2019-07-07

PPOの実装(ネットワーク共有版)

PyTorch 強化学習

はじめに学習モデル Memory finish_path() get_batch() Agent get_action() update() 学習ループおわりに参考はじめに PolicyとValueのネットワークをタイプのものを全然見かけなかったので、勉強も兼ねてPyTorchで実装してみました。コードは以下に置…

雨宿り

だいぶスローペース

2019-07-07から1日間の記事一覧

PPOの実装(ネットワーク共有版)