如何让强化学习走进现实世界?DeepMind要用“控制套件”推动

简介:
本文来自AI新媒体量子位(QbitAI)

火遍全球的AlphaGo让我们知道了强化学习打游戏究竟有多6,这么强大的算法什么时候才能打破次元壁,走进现实、控制物理世界中的物体呢?

DeepMind已经开始往这方面努力。他们昨天发布的控制套件“DeepMind Control Suite”,就为设计和比较用来控制物理世界的强化学习算法开了个头。

就像ALE(Arcade Learning Environment)极大推动了用强化学习打电子游戏的研究一样,DeepMind希望他们的Control Suite也能推动用强化学习控制实体的研究,比如说先让模拟环境中的机器人学会行走、游泳、搬东西等等。

Control Suite设计了一组有着标准化结构、可解释奖励的连续控制任务,还为强化学习Agent提供一组性能测试指标

这些任务基于MoJoCo物理引擎,所用的语言是Python。DeepMind在GitHub上放出的源代码中,就包含基于MoJoCo的Python强化学习环境,以及为MoJoCo提供Python绑定的软件库。

59801837dc0cfbcce9245b274da284a90d02e0ae

如上图所示,Control Suite中的任务可以分为14个领域,也就是14类物理模型,上排从左到右分别是:

体操机器人Acrobot,(两节钟摆)、杯中小球、倒立摆、猎豹形机器人、手指、鱼、单足跳跃机器人,下排从左到右分别是人形机器人、机械手、钟摆、质点、形似两节手臂的Reacher、游泳机器人、步行者。

DeepMind还测试了A3C、DDPG和D4PG强化学习算法在这些任务上的表现,:

eb76924a677167d0c505517703f7b59d5349bf89

这些结果也是强化学习完成控制任务的基线数据。

DeepMind Control Suite似乎很受欢迎,截止量子位发稿,已经在GitHub上收获了300多个星标。

6039ba15db376ec998a8daf0a3efe14a454311c1

Twitter网友们也在热烈讨论这个Control Suite。不过,DeepMind官推为这个套件所选的配图,可谓骨骼清奇,被不少网友质疑:这是……最优跑步方式?

O(∩_∩)O 最后放出来,给大家来观赏一下:

3ed43cf67206c3662934e120091890968b863ab0

请勿模仿,请勿模仿,请勿模仿。

如果受伤了还怎么看下面的论文和代码呢~

论文:
https://arxiv.org/pdf/1801.00690.pdf

代码:
https://github.com/deepmind/dm_control

本文作者:夏乙
原文发布时间:2018-01-04
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
深度学习疆界:探索基本原理与算法,揭秘应用力量,展望未来发展与智能交互的新纪元
35 0
|
11月前
|
机器学习/深度学习 人工智能 监控
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
193 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
清华大学周伯文:ChatGPT火爆揭示新一代协同与交互智能的高度重要性
清华大学周伯文:ChatGPT火爆揭示新一代协同与交互智能的高度重要性
116 0
|
11月前
|
机器学习/深度学习 存储 人工智能
ChatGPT掀智力革命!OpenAI发布AGI路线图,最终通向超级智能世界
ChatGPT掀智力革命!OpenAI发布AGI路线图,最终通向超级智能世界
167 0
|
人工智能 算法 机器人
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
117 0
用算法模拟演变机器人“进化”!MIT开发新平台,还能优化机器人身体和大脑,已开源
|
机器学习/深度学习 人工智能 安全
会泡咖啡的机器人问世,AI机器人的工作边界在哪?
最近,日本涉谷又有一家AI机器人咖啡厅开业。在这家“奇特的咖啡厅”,客人进入咖啡厅点单付款之后,就会被Sawyer用它的方式接待——它的屏幕上面会显示出欢迎的表情并附带“欢迎光临,来点美味的咖啡怎么样”的语音,接着Sawyer会拿起杯子为你冲泡出你点的咖啡,从选取咖啡粉到将沸腾的热水注入温度调制装置,将降温的热水加入装了咖啡粉的滤泡杯到滤出一杯香醇的手冲咖啡,整个过程全都是由Sawyer自主完成,且仅仅只要两分钟。
会泡咖啡的机器人问世,AI机器人的工作边界在哪?
|
存储 人工智能 自动驾驶
AI化学家诞生!1天可做500个实验,自主开发新材料,实验室劳力们,颤抖吧
近日,来自北卡罗莱纳州立大学和布法罗大学的研究人员开发了一项名为“人工化学家”的技术,该技术结合了人工智能(AI)和执行化学反应的自动化系统,以加速研发和生产商业所需的新化学材料。
|
机器学习/深度学习 传感器 人工智能
AlphaGo背后这项核心技术,后来怎么样了?
近年来,深度学习(Deep Learning, DL)作为机器学习的一个重要研究领域,得到了长足的发展,为强化学习(Reinforcement Learning, RL)提供了强有力的支撑,使RL能够解决以前难以处理的问题,例如学习直接从像素玩视频游戏。
|
机器学习/深度学习 人工智能 自动驾驶
吴恩达:模拟人脑,未来AI执行精神层面任务有望快过人类!
AI在未来如何实现真正的“智能”?这个问题似乎遭遇瓶颈。目前深度学习对人类大脑的模拟仍然处于初级阶段,是否应该沿这条路继续走下去?吴恩达认为,通过深度学习模拟大脑,未来的AI能够比人类更快地完成精神层面的任务。也有研究人员认为,应从大自然中寻找灵感,让AI建立关于世界的“心理模型”。
1263 0