关键字:深度强化学习;;经验重放;;映射函数;;优先级;;游戏策略
摘要:为了使得高优先级被重放的概率进一步得到提升,并得到更重视最大优先级的函数表达式,对以往的研究中运用随机经验重放算法和一般的优先经验重放算法确定经验重放的优先级进行对比。通过改变优先级到概率的映射函数,利用小车爬山游戏模型表明改进优先经验重放算法可以使智能体快速的学习到最优的游戏策略,并可以大幅减少完成游戏所用的时间。结果表明新算法使游戏学习最优策略的速度提高了49.28%。
卷号:v.30;No.132
期号:02
是否译文:否