Value-Based RL | TR

[RL/Value-based]Double Q-Learning

Reinforcement Learning

强化学习(Reinforcement Learning), Building Blocks, Value-Based RL

减少过估计偏差

[RL/Value-based]Q-Learning

Reinforcement Learning

强化学习(Reinforcement Learning), Building Blocks, Value-Based RL

Off Policy,学习最优$Q$

[RL/Value-based]SARSA

Reinforcement Learning

强化学习(Reinforcement Learning), Building Blocks, Value-Based RL

On Policy,遵循当前策略更新：