独家 | 使用Python的OpenAI Gym对Deep Q-Learning的实操介绍(附学习资源)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 使用Python的OpenAI Gym对Deep Q-Learning的实操介绍(附学习资源)

初商 2019-08-25 22:14:30 浏览504
展开阅读全文

作者:ANKIT CHOUDHARY

翻译:张睿毅

校对:吴金笛

文章来源:微信公众号 数据派THU

本文4300字,建议阅读10+分钟。

本文作者通过实战介绍了Deep Q-Learning的概念。


导言

我一直对游戏着迷。在紧凑的时间线下执行一个动作似乎有无限的选择——这是一个令人兴奋的体验。没有什么比这更好的了。

所以当我读到DeepMind提出的不可思议的算法(如AlphaGo和AlphaStar)时,我被吸引了。我想学习如何在我自己的机器上制造这些系统。这让我进入了深度强化学习(Deep RL)的世界。

即使你不喜欢玩游戏,深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了:

image.png

那工业级应用程序呢?这里有两个最常见的深度强化学习用例:

  • 谷歌云自动机器学习(Google’s Cloud AutoML)
  • 脸书Horizon平台

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 数据派THU