OpenAI推出开源机器人模拟软件Roboschool(附代码)

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=png&wxfrom=5&wx_lazy=1


今天,马斯克和YC总裁Altman等硅谷名流共同创办的人工智能非营利组织OpenAI发布了一个开源的机器人模拟器Roboschool。


 三个应用了不同控制策略的机器人在Roboschool中赛跑

Roboschool是增强学习研究平台OpenAI Gym上的机器人模拟器,提供了一组新环境,让用户可以在模拟器中控制机器人,想在一个环境中训练同时训练多个agent也很容易。

在OpenAI Gym刚刚发布的时候,不少用户抱怨机器人模拟器MuJoCo需要付费证书。现在,Roboschool打破了这个限制,每个人都可以免费使用。

与Gazebo、V-REP等其他模拟器一样,Roboschool也基于开源的物理库Bullet Physics Engine。

环境

Roboschool包含12个环境,有的和MuJoCo差不多,也有全新的,比如说高难度版的人形机器人行走任务、多玩家乒乓球环境等。环境的数量还会继续增加,OpenAI表示也希望社区参与进来,贡献更多环境。

MuJoCo环境现有的任务转移到Roboschool中之后,画风更写实。

比如行走的慢镜头,原来是这样的:

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

现在是这样:

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

再比如说,新的环境中为蚂蚁增加了重量,让原来这样的蚂蚁:

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

能保持至少两条腿着地:

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

健壮的交互式控制

原来的OpenAI Gym中,好几个环境的目标都是学习一个行走控制器。但是,这些环境给出的目标过于基本,仅仅是“向前移动”,于是在实践中,行走策略将学会沿一条曲线轨道移动,状态空间的大部分都不会被触及。另外,最终的策略也会非常脆弱:轻轻推一下,机器人就可能崩溃摔倒。

Roboschool为3D人形机器人新增了两个带有交互式控制的环境,运动问题变得更富有挑战性。

一个是HumanoidFlagrun(人形机器人+旗标+跑),机器人在其中的任务是跑向旗标,而旗标的位置是随机变动的。

另一个叫HumanoidFlagrunHarder(人形机器人+旗标+跑+更难)比上一个增加了让机器人摔倒再爬起来的任务,在每一次训练的开始,机器人可能是站着的,也可能是躺在地上的。另外,在训练过程中,一直有白色方块攻击机器人,想让它脱离轨道,就像下面视频中这样:


虽然这个机器人行走的速度不快,看起来也不自然,但是在任何情况下都能恢复行走,也知道如何寻找方向。

多角色

Roboschool中的RoboschoolPong,允许用户在同一环境中同时训练或运行多个agent,以后还会有更多环境。

多角色训练是指,你可以训练同一个agent自攻自守,也可以用同一个算法训练两个不同的agent,甚至可以训练两种不同的算法,让他们相互竞争。


 在RoboschoolPong中同时训练两个agent

相关链接

Roboschool的GitHub地址:
https://github.com/openai/roboschool

OpenAI Gym:
https://gym.openai.com/

MuJoCo:
https://mujoco.org/

有人把OpenAI Gym中的MuJoCo换成了开源物理模拟器DART:
https://github.com/DartEnv/dart-env

本文作者:李林
原文发布时间:2017-05-16 
相关文章
|
2月前
|
人工智能 自然语言处理 开发工具
AI2 开源新 LLM,重新定义 open AI
艾伦人工智能研究所(Allen Institute for AI,简称 AI2)宣布推出一个名为 OLMo 7B 的新大语言模型,并开源发布了预训练数据和训练代码。OLMo 7B 被描述为 “一个真正开放的、最先进的大型语言模型”。
|
2月前
|
人工智能
微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
【2月更文挑战第8天】微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
42 3
微软变“渣男”!据悉已投资法国开源 AI 独角兽Mistral,OpenAI成“备胎”了?
|
2月前
|
存储 人工智能 自然语言处理
选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试
OpenAI最近发布了他们的新一代嵌入模型*embedding v3*,他们将其描述为性能最好的嵌入模型,具有更高的多语言性能。这些模型分为两类:较小的称为text- embeddings -3-small,较大且功能更强大的称为text- embeddings -3-large。
95 0
|
4月前
|
存储 人工智能 机器人
通过 OpenAI 和 Langchain 构建 Arxiv 论文摘要 Twitter 机器人
通过 OpenAI 和 Langchain 构建 Arxiv 论文摘要 Twitter 机器人
55 0
|
7月前
|
存储 机器学习/深度学习 人工智能
摆脱 OpenAI 依赖,8 分钟教你用开源生态构建全栈 AI 应用
大模型时代的到来使得 AI 应用开发变得更加轻松、省时,尤其是在 CVP Stack 的范式下,开发者甚至可以用一个周末的时间做出一个完整的应用程序。
238 1
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
对标Llama 2,OpenAI开源模型G3PO已在路上
对标Llama 2,OpenAI开源模型G3PO已在路上
|
9月前
|
存储 监控 机器人
不论微信钉钉还是什么软件,我写了个通用的消息监控处理机器人
不论微信钉钉还是什么软件,我写了个通用的消息监控处理机器人
|
10月前
|
机器学习/深度学习 人工智能 物联网
Sam Altman谈OpenAI:面临GPU短缺恐慌,GPT-3或将开源
Sam Altman谈OpenAI:面临GPU短缺恐慌,GPT-3或将开源
|
11月前
|
Web App开发 人工智能 缓存
OpenAI 开源 3D 模型生成器 Shap-E|马斯克宣布将卸任推特CEO|思否周刊
OpenAI 开源 3D 模型生成器 Shap-E|马斯克宣布将卸任推特CEO|思否周刊
102 0
|
11月前
|
人工智能 自然语言处理 前端开发

热门文章

最新文章