备案控制台

开发者社区量子位文章正文

谷歌新论文：让机器人依靠视觉识别抓取特定物体

2018-01-22 1008

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

近日，谷歌团队在arXiv上发布了新论文《End-to-End Learning of Semantic Grasping》，这篇文章由谷歌成员Eric Jang、Sudheendra Vijayanarasimhan、Julian Ibarz、Sergey Levine和Peter Pastor五人共同完成。

量子位选取论文中关键信息，编译整理分享给大家。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

实验介绍

这篇论文首先讨论了机器人的语义抓取任务，即机器人借助单目图像抓取用户指定类别的相应物体。受视觉神经处理模型中双流假说的启发，研究人员提出了一种语义抓取框架，它允许用端对端的方式学习物体识别、分类并设计抓取路线。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

△ 工作人员根据用户指定，将测试用的杂物分为16类

受双流假说的启发，研究人员将模型分为“腹流”和“背流”。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

△ 背流（绿色）与腹流（紫色）源于视觉皮层的同一区域/维基百科

在这个模型中，腹流负责识别物体类别，背流同时解释正确抓取所需的几何图形关系。测试人员利用机器人自主数据采集能力获取了大量自监督数据集来训练背流，并用半监督学习中的标签传播算法训练腹流，同时佐以适当的人力监督。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

△ 受双流假设的影响，将模型分为了腹流和背流

论文用实验方法展示了改进后的抓取系统方法。当然这不仅仅包含端对端内容，还包括用边界框检测的基线处理方法。不仅如此，还展示了用辅助数据、无语义抓取数据和无掌握操作以及语义标记图像共同训练的模型，这可能会大大提高语义抓取性能。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

△ 实验所用的机器人手臂，具有两只手指和单目图像相机

实验结果

在本次实验中，通过让机器人在不同类别的物体中，抓取随机指定的五个物体来评估机器人的语义抓取能力。每次实验重复10次，抓取的物体包含一组30个训练对象和30个未经测试对象。研究人员通过基线比较证明各种架构在决策语义抓取模型中的作用。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

△ 对比实验结果统计表

本实验的结果可总结为如下6点：

1）端对端的语义抓取优于传统的检测分类方法

2）双流语义分解预测优于单流模型

3）分离架构的理解能力胜过双支路架构

4）9层含attention的CNN表现胜过16层无attention的CNN

5）辅助语义数据能够增强双流架构的分类表现

6）反映物体分布的辅助语义数据提高了分类抓取的准确性

最后，附上论文地址：

https://arxiv.org/abs/1707.01932

【完】

本文作者：安妮

原文发布时间：2017-07-10

文章标签：

算法

测试技术

机器人

关键词：

机器人抓取

论文机器人

机器人论文

论文机器人抓取

机器人视觉

行者武松

目录

相关文章

楠竹11

|

1天前

|

机器学习/深度学习算法机器人

论文介绍：使用仿真和领域适应提高深度机器人抓取效率

【5月更文挑战第11天】研究人员提出结合仿真数据和领域适应技术提升深度机器人抓取效率。通过在仿真环境中生成多样化抓取数据并使用GraspGAN和DANN进行像素级和特征级适应，使模型能在现实世界中更好地泛化。实验表明，这种方法能减少现实数据需求，同时保持高抓取性能。尽管面临物理差异和成功率挑战，该研究为机器人抓取技术的进步提供了新途径。论文链接：https://arxiv.org/abs/1709.07857

楠竹11

11 5 5

LabVIEW开发

|

2天前

|

传感器数据采集人工智能

LabVIEW开发微控制器控制的并行机器人的实时视觉图像处理

LabVIEW开发微控制器控制的并行机器人的实时视觉图像处理

LabVIEW开发

9 1 1

以山向海

|

3月前

|

机器学习/深度学习传感器算法

植保机器人目标检测与识别

植保机器人目标检测与识别

以山向海

21 1 1

以山向海

|

3月前

|

传感器机器学习/深度学习算法

植保机器人视觉传感器与图像采集

植保机器人视觉传感器与图像采集

以山向海

38 3 3

以山向海

|

3月前

|

传感器机器学习/深度学习算法

植保机器人作物识别与监测

植保机器人作物识别与监测

以山向海

44 2 2

以山向海

|

3月前

|

传感器机器学习/深度学习算法

植保机器人环境感知视觉感知

植保机器人环境感知视觉感知

以山向海

16 2 2

天行无忌

|

5月前

|

存储人工智能机器人

通过 OpenAI 和 Langchain 构建 Arxiv 论文摘要 Twitter 机器人

通过 OpenAI 和 Langchain 构建 Arxiv 论文摘要 Twitter 机器人

天行无忌

62 0 0

AI2中文网

|

11月前

|

机器人语音技术 Android开发

App Inventor 2 语音交互机器人Robot，使用讯飞语音识别引擎

App Inventor 2 语音识别及交互App。识别语言指令并控制机器人运动，主要用到语音识别器及文本朗读器组件，语音识别相关开发最佳入门。代码逻辑简单，App交互性及趣味性非常强~

AI2中文网

171 0 0

-开发达人-

|

12月前

|

传感器 Web App开发运维

5620亿参数，最大多模态模型控制机器人，谷歌把具身智能玩出新高度

5620亿参数，最大多模态模型控制机器人，谷歌把具身智能玩出新高度

-开发达人-

130 1 1

-开发达人-

|

12月前

|

机器学习/深度学习存储数据采集

7 Papers & Radios | 谷歌开源机器人领域transformer；DeepMind推出剧本写作AI

7 Papers & Radios | 谷歌开源机器人领域transformer；DeepMind推出剧本写作AI

-开发达人-

246 0 0

量子位

热门文章

最新文章

在机器人流程自动化（RPA）中，判断网页或元素是否加载完成是一个重要的步骤

人类发明及研究AI机器人是在作死吗?

SK616001-A 编程模块 BBC Brown Boveri DSQC系列机器人备件

使用TDengine国产时序数据库存储能耗数据并通过钉钉机器人接收报警信息

中国私募股权基金约1.5亿欧元收购意大利工业机器人公司

ROS机器人程序设计（原书第2版）2.2.4　消息

外媒：中国积极部署工业机器人 2020年跻身世界10强

《机器人爱好者（第3辑）》——为什么早期的机器人开发落后了

《仿人机器人原理与实战》一2.5　行为链“小魔怪”

谷歌新论文：教机器人预测3D结构、然后抓取物体

人类发明及研究AI机器人是在作死吗?

SK616001-A 编程模块 BBC Brown Boveri DSQC系列机器人备件

在机器人流程自动化（RPA）中，判断网页或元素是否加载完成是一个重要的步骤

海尔、乐聚联手，发布国内首款家庭服务人形机器人

，出现了一个RPA（机器人流程自动化）的运行异常，具体错误为 `rpa.core.errors.RPATimeoutError`

量化交易策略机器人系统开发|成熟案例|详情方案

单片机和FreeRTOS上跑机器人ROS的应用

简单几步，钉钉机器人秒变通义千问对话机器人

智能咖啡厅助手：人形机器人 +融合大模型，行为驱动的智能咖啡厅机器人

Sony BRC-300P 三个1/4英寸7型高级CCD传感器一体式标清机器人紧凑型摄像机

相关课程

更多

声纹识别技术

计算机视觉类比赛汇总

语音识别原理与应用

跨越N次元一键变身AI漫画人

个性化语音合成模型微调

相关电子书

更多

下一代服务机器人的应用和创新

机器人的小脑SLAMWARE - 机器人自主定位导航系统

AIOps的核心技术之一：任务机器人如何在金融运维运营中落地

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

使用函数计算部署通义千问大模型实现AI对话

使用PAI-DSW x EasyPhoto快速完成AIGC人物写真生成

Lindorm AIGC：十分钟搞定智能问答 + 多模态检索

基于函数计算一键搭建手写体OCR识别平台

【文生文】一键部署ChatYuan模型

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）