摘要:强化学习由于具有出色的数据效率和快速学习的能力,开始应用于许多实际问题以学习复杂策略。但是高维环境中的强化学习常常受限于维度灾难或者灾难性干扰,性能表现不佳甚至导致学习失败。围绕表征学习,提出了(试读)...