进化策略让 AI 开挂,玩游戏不断给自己续命

  1. 云栖社区>
  2. 雷锋网>
  3. 博客>
  4. 正文

进化策略让 AI 开挂,玩游戏不断给自己续命

技术小能手 2018-06-04 17:44:22 浏览878
展开阅读全文

强化学习会通过在系统中选择一系列的行为,把分数提到最高水平。我们可以将这类技术运用于训练一种可以打爆各种各样游戏的人工智能,例如在 Q bert 游戏中,人工智能每走一步,都要计算出合适的操作来控制这个橙色的光标,并在不碰到紫色敌人的情况下,点亮所有的立方体。

针对部分具有挑战性的深度强化学习问题,比如雅达利游戏,已经有研究表明,进化策略(Evolution Strategies)是强化学习的可行替代方案。本期论文所提出的进化策略,目标不仅是训练一个代理 而是并行训练所有代理,这种方法效率很高,就像大自然的进化那样,优胜劣汰,表现最好的代理产生新的后代。

Open AI 最近的研究结果表明,比起深度强化学习的各种通用手段,自然进化策略也不失为一种好的替代手段。本期论文使用的进化策略证明了,即便是年代久远的进化策略,最后的成绩也非常喜人

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 雷锋网