从游戏AI到自动驾驶,一文看懂强化学习的概念及应用

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

从游戏AI到自动驾驶,一文看懂强化学习的概念及应用

初商 2019-09-21 00:59:48 浏览428
展开阅读全文

image.png

作者:肖智清
来源:大数据(ID:hzdashuju)

导读:本文介绍人工智能领域中强化学习的基础知识,阐述强化学习的学习方法。

强化学习(Reinforcement Learning,简称RL,又译为“增强学习”)这一名词来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。例如,我每天工作中会根据策略决定做出各种动作。如果我的某种决定使我升职加薪,或者使我免遭处罚,那么我在以后的工作中会更多采用这样的策略。

据此,心理学家Ivan Pavlov在1927年发表的专著中用“强化”(reinforcement)这一名词来描述特定刺激使生物更趋向于采用某些策略的现象。强化行为的刺激可以称为“强化物”(reinforcer)。因为强化物导致策略的改变称为“强化学习”。

心理学家Jack Michael于1975年发表文章《Posi

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 华章计算机