1. 聚能聊>
  2. 话题详情

众包“表演”来训练人工智能,管用么?

《连线》杂志发表了一份报道,描述了人工智能创业公司利用亚马逊的众包网站Mechanical Turk来获取数据训练算法的过程。文章由36氪编译。

因为地处远离街道的一个角落里,旧金山SoMa区的全食超市婴儿食品区并没有太多的客流量。我瞥了一眼保安,然后伸手去拿苹果和西兰花柠檬泡芙。把它们放进我的空购物车中后,马上又把它们放回去了。“你拍到了吗?”我让我的同事用他的iPhone拍摄这一过程。这是我第一次带薪“表演”。我正在帮助训练软件,以便让未来的机器人能够帮助人们购物。

全食超市是一个不知情的参与者,这是一个德国-加拿大的创业公司Twenty Billion Neurons的项目。我悄悄地做了其他9个简单的动作,包括打开冰柜,从右向左推车,然后从左向右等等。然后我什么东西都没买就离开了。后来,我花了大约30分钟把视频剪辑到对方所需的2到5秒,并把它们上传到亚马逊的众包网站Mechanical Turk上。几天后, 我得到了3.5美元的报酬。如果Twenty Billion想要开发一个购物助手机器人软件,它将需要更多的数据。
u_534083909_3767603419_fm_27_gp_0
在偷偷摸摸的环游全食超市的时候,我加入了一支无形劳动力队伍:他们的报酬很少,以推进人工智能的名义做一些奇怪的事情。你可能已经被专家或者媒体告知人工智能是技术的顶峰,但这些工人是是人类背后混乱现实的一部分。

支持者认为,生活和商业的每一个方面都应该由人工智能来调解。这是一场由大型科技公司发起的运动,表明机器学习可以处理识别语音或图像等任务。但目前大多数机器学习系统,如语音助手,都是通过训练算法来构建的,这些算法有大量的标签数据,这些标签则来自于检查图像、音频或其他数据的承包商,他们会给出标注,比如那是一只考拉,那是一只猫,她说的是“汽车”等等。

现在,研究人员和企业家希望人工智能能够理解现实世界中的行动。因此,工人们需要在超市和家里进行“表演”。他们正在生成数据来训练人工智能算法。这就是为什么有一天早上,我会脸朝下趴在办公室地板上, 让粗糙的合成纤维挤压着我的脸。然后,我的同事拍了一张照片。把它上传到Mechanical Turk后,我从伯克利一家名为“Safely You”的八人创业公司那里获得了7美分的报酬。该创业公司开发了一种软件,通过监控来自养老院的视频信息,来检测老人是否已经跌倒。老年痴呆症患者往往不记得他们为什么或怎么会倒在地板上。 在加州附近的11个设施中,Safely You的算法可以帮助工作人员快速找到一个视频中的位置, 从而揭开这个谜团。

Safely You正在收集像我这样的假摔数据,以测试它们的系统。该公司的软件主要是由护理设施中产生的老年人视频数据来进行训练,不过在训练前需要让员工或承包商进行标注。通过用其他地方(比如Mechanical Turk)搜集而来的数据进行训练,可以迫使机器学习算法扩大理解范围。

那家愿意为我在全食超市中表演付钱的创业公司,Twenty Billion Neurons,下的本钱更大,花费了大量的资金来获取数以百万计的人们表演数据,来训练算法。联合创始人兼首席执行官罗兰·梅瑟维奇(Roland Memisevic)认为,这是让机器获取物理世界常识的唯一实用途径,这是人工智能领域的长期追求。

像国际象棋和围棋这样的游戏,拥有有限的、严格的棋盘和明确的规则,非常适合计算机。在现实世界中,哪怕是一个孩子的常识是超越了计算机的。想要倒一杯咖啡,他可以毫不费力地抓住和平衡杯子和水瓶,并控制倒水的弧度。人们利用同样的根深蒂固的知识,以及对他人动机的理解,来解释自己在世界上所看到的一切。

如何让机器能够这样做是人工智能的一大挑战。一些研究人员认为,那些能有效识别语音或图像的技术不会有多大帮助,想要突破,需要有新的技术。梅瑟维奇从久负盛名的蒙特利尔学习算法研究所(MontrealInstitute of Learning Algorithms,MILA)离开,创办了Twenty Billion,因为他相信如果训练得当,现有的技术可以给我们带来更多的帮助。“它们工作得非常好,”他说。“为什么不通过强迫它们学习真实世界的东西,将其扩展到更微妙的现实方面呢?”

为了做到这一点,这家创业公司正在收集大量的视频数据,在这些视频中,众包演员们会表演不同的身体动作。其希望通过训练来让它们的算法能够“学习”物理世界和人类行为的本质。这就是为什么当在全食超市里表演时,我不仅从货架和冰箱里拿东西,而且还制作了几乎相同的视频剪辑片段。

Twenty Billion的第一个数据集现在已经开源发布了。它里面有超过10万个视频片段,描述了日常物品的简单操作,比如拿起鞋子,把遥控器放在一个硬纸盒里,然后沿着桌子推一个绿辣椒直到它掉下来等等。梅瑟维奇没有提起“制造一个能够帮助我们购物的机器人”的问题,而是说汽车应用是一个很好的领域,其已经与宝马合作过了。

那么问题来了:
1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?

参与话题

奖品区域 活动规则 已 结束

10个回答

1

微wx笑 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
众包肯定是比较有用的,就像征集大家的意见差不多,
虽然可能有很多无效的,但其中总会包含有价值的(这个是自己想像不到的)。

2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
AutoML,赋予人工智能自学的能力。

3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
算力,存储,通信。相关的法律、法规。

4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
会参加的,感觉像玩游戏一样。

1

浮生递归 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
有作用,但不会太明显,其实就是模拟人类的学习方法吧。但是比较起来,人类的数据源和学习量可比计算机大多了,容量也完全不在一个级别。一个普通人,通常要20年左右,才能完全学会这个世界上的各种事务。而这20年里,除了睡觉,全部在学习状态。相当于20x365x24小时的视频长度。而且画面还是超清的。

2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
更深入的模拟人类学习的方式,装上摄像头,走出去。去大街上观察这个世界,然后有深度的去分析拍摄的视频,同时将视频内的内容都关联起来进行分析、理解。就像小朋友学着长大一样。

3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
硬件支持。足够高分辨率的摄像头、足够快的带宽和足够大的存储设备。目前来看,这些其实都还不能满足训练用到的海量数据的处理。

4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
当然会。不仅会,还应该提倡不同的人,可以创建自己不同的训练方法。说不定方法多了,突然冒出一种效率特别高的训练方法,将人工智能一下提高几个台阶呢。人类科技的发展不都是这样吗,突然出现某种技术,一下将文明推进几个年代。

1

沙漠的热情 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
可以一试

2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
原创算法的革新比较难,算力由于云计算的缘故大家应该都差不太多,那就拼数据了。
谁离用户近,谁更易搜集数据,谁拥有更多数据,谁训练的模型就更灵巧,就更显智能。

3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
马斯克、霍金都对人工智能的发展表达了担忧,人工智能难保不用于恶意目的,相关的法律、法规、监管也应该跟上。

4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
是的,会的。对人工智能认识肤浅,能参与的话,机会难得。

1

pwdking 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
此类表演还是不能完整的代表真实情况,也可能存在误导。
2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
数据是必须的,可以考虑直接和商家合租,安装在购物车上
3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
机器设备
4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
否,对个人没有什么价值。

0

徐环 复制链接去分享

欺上瞒下

0

cjsoldier 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
有用。文中提到汽车应用是一个很好的领域。我看出来了,她是想做一个“行走的无人超市”,或者她想做一个“汽车人”(变形金刚)。

2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
人产生数据太慢了。设计一款游戏,从游戏中获取数据。或者用三维动画模拟人类的行为。

3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
海量数据的获取
统一格式,以便数据共享
模型的共享,不要重复训练同一个模型

4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
不会。我会借钱招几个人兼职做这个。

0

aoteman675 复制链接去分享

1,大家觉得这篇文章里面介绍的收集特定视频的方法建立的训练集的作用如何?
为了学习模拟相似行为能力,机器学习训练集就能在特定的场景下做特定的动作。机器没有思维,所以只能题海战术的训练他。总之学不完的,这种训练集合只能在特定场景下,且需要大量的数据训练,这种训练还是只能处理某一项业务,就像一个学生一直做一种类型习题,换汤不换药的训练,机器在这方面准确率和灵活性就高了。但是让人同时掌握物理、数学、化学等学科的进阶还行,但是深入研究就没有精力了,机器也是一样,但是机器不用休息,训练集可以多一些,模拟相似度可以无限接近理论值。
2,除了这种方法,大家觉得还有那些其他方法可以更高效的对人工智能进行训练?
跟着科学家一起生活,在科学家身上安装各种传感器,眼睛是摄像头。机器通过大量数据存储、分析、训练、自主学习,这样才是仿生人工智能训练。让机器接触人类一切事物,才能感知世界。
3,大家觉得人工智能的发展过程中,除了算法和训练还有那些基础性的工作需要进行完善?
《人工智能的恶意用途:预测、预防和缓解》这份报告需要分析,警惕人工智能发展过程中的各种危险。
4,如果有时间,你是否会参与这种众包训练人工智能的活动,为什么?
有空就会参加,就像软件系统内测一样,这样的测试才能得到完整的报告,系统才能完善。参加训练为人工智能出一份力,造福全人类的事都要参加,主要是还有钱赚。人工智能训练需要异样训练集,每个年龄段的不同性别及各个阶段学历的人都需要参加,思维不同,行为方式也会不同。

0

1991019640831211 复制链接去分享

感觉只是一时的浪潮

0

1890419617345472 复制链接去分享

人工智能不是特别懂,但是,肯定的是,我们的生活将会越来越方便,越智能化,越安全。

0

mei-12 复制链接去分享

人工智能不是很懂了,我猜想通过算法必须要大量的数据支持,让电脑根据算法去选择执行,这个就像是有很多例子,算法是让电脑快速的找到对应类的例子,再在其中选择一个执行。这样就很难实现全能的,如果做单一类型智能机器人还是可以实现的。机器学习,训练,这个就好比训练宠物,只不过电脑比宠物学的快,但是缺少思考,限于现在的环境,做单一机器人后综合起来感觉还是很可行啊!以后得社会估计都会人手一个辅助机器人吧!毕竟社会发展太快,不懂的东西多了