清华数据院院长韩亦舜:大数据时代的数据伦理问题探究

简介:

0?wx_fmt=jpeg

导读:5月26日,2015年贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会在贵阳召开,数据开放与隐私保护作为一个专门的分论坛,在同天下午举办。清华大学数据科学研究院执行副院长在会上做了大数据伦理与道德的分享。大数据文摘今日带您走进数据开放与隐私保护论坛,聆听韩亦舜院长对数据引发伦理道德问题的看法。


0?wx_fmt=jpeg

韩亦舜

清华大学数据科学研究院执行副院长,关注数据开放,数据伦理以及数据隐私研究


以下是演讲实录

刚才几位嘉宾就数据的安全问题,隐私问题分享了观点,我今天从不同的角度说一些有待探讨的观点。


我不知道大家是否听说过,曾经在国外伦理课上有一个经典的故事,说的是一个轨道车按照正常轨道向前行驶,但是突然刹车失灵,前面轨道上有5个人。司机还有一个选择,选择旁边一条道,旁边的轨道上有1个人。那5个人违规了,1个人没有违规,如果撞死这1个人,显然这个人是无辜的,但是一般认为撞死1个人的代价小。这就遇到了伦理的困境。今天大数据时代,我们会面对同样的问题。我们把情景改为是一部谷歌的自动驾驶车,想一下自动车遇到这种情况会怎么样,也许他可能比当年那个有轨车司机做决断的时候想得更多算的更多,能发现这1个人跟5个人的身价,有没有犯罪记录,到底撞谁合适。其实我们面临的很多东西数据是算不出来的。

0?wx_fmt=jpeg

这是一类伦理问题。还有在数据伦理上遇到另一个挑战,会不会产生大数据时代的弃儿。今天我们都是用手机打车了,我们的父母,那些不会用智能手机的人,出门还打得到车吗?我是今年才开始用手机打车的,之前每次打不到车的时候我都恨自己为什么不学会启用手机打车软件。我还算是信息时代的赶潮人,但是我们的父母怎么办呢,他们很有可能将来与这个数据时代差距拉得越来越大,很多人会成为信息时代的弃儿。该怎么办?还有,如果你曾经有过犯罪记录,将来走到哪里都会被查到有案底而受到歧视怎么办?怎样才能正常地回归社会?

0?wx_fmt=jpeg


接下来,我们讲去年最后一天发生的那个不该发生的事情,上海发生踩踏事件死了很多人,也有很多官员受处分。最让人遗憾的是之后网上发了很多报告说这个事情可以避免。在座的搞技术的人都知道,我们用手机定位是可以看到人流的变化趋势,就可以采取应急措施。可惜这些技术在我们该用的时候都没有用上,这个背后什么问题呢?

0?wx_fmt=jpeg


我们讲信息孤岛,还有一个责任孤立的问题。拥有公共安全移动数据的机构,并不需要对公共安全事件负责。如果给处分的时候把拥有公共安全数据的人也包括进来,可能他们就不会有不同的思考。我们都说安全大事,信息安全是头等大事,它也变成谁都不愿意碰的话题。2014年年初就发生了一个踩踏事件,只是在稍微偏远的地方,大家传播得不太广就没有引起重视。现在上海的外滩还会不会再发生?除了公安部门规定多少人不能组织群众集会,要申办单位自己有保护措施等,是不是涉及公共安全的数据仍然没有开放没有利用。所以我就问一句,数据安全或者保护数据就一定对吗,这里也有一个伦理问题,你拿的是社会公共安全的数据你不用起来,最后造成社会公共安全事故,你觉得这对吗?

0?wx_fmt=jpeg


第三个例子是"人肉"。我不知道各位有没有参与过"人肉",我这里提一个最新的"人肉"案例,发生在成都那个女孩子超车被打的事情。我不知道在座的有没有参与或传播这个事,批评这个女孩子赞那个男孩子?我觉得有一个事不对,就算她再怎么不对,那个男孩子都不应该下车打人。大家后来收到过进一步的信息吗,女孩子开房的信息都在网上传,太可怕了,这就是网络暴力。今天互联网的传播力太强,甚至会导致出现网络暴力。有时候大家可能觉得我们用“人肉”方式把抽烟的官员,带表的官员挖出来,大家感觉大快人心,但我们要清楚“人肉”不是公器,不能作为一个普遍的工具。如果我们任由这种思想发展、这种形式存在,对社会是有危害的。今天就算这个女的超别人车不对,中间双方又互相别车什么的,我们就该站道德的高度上践踏别人的权利吗?把别人女孩子开多少次房都发到网上?中国原来就有一句古话好事不出门,坏事传千里。政府干部们苦于做了好事传不出去,有一点坏事马上传开。当有一些不负责任的言论遇到社会心理扭曲的时候,网络的危害就很容易被扩大。记得几年前就有网络暴力歪曲事实,最后害了男女恋爱双方其中一方跳楼这种悲剧。也许男女双方跟传播网络言论的人没有什么关系,因为这种舆论压力把别人害死了,而且跟事实还不符。这很可怕。

0?wx_fmt=jpeg

0?wx_fmt=jpeg

刚才讲的这几个例子说明大数据时代,出现了一些新关系新问题。过去就有伦理道德一说,大数据时代有了数据伦理道德。大家想一想大数据时代的到来,可以让在遥不可及的地方,如果没有互联网,没有交通工具,没有通讯工具就根本不会认识的人,不会跟他发生一点关系的人联系在一起。像这样的人与人组合是大数据时代才有的新关系。互联网时代完全没有关系的人也会伤害到其他人。传到我手上说那个开房记录跟成都那个女的没有什么关系,但是这个传播伤害了别人。这个大数据时代产生特殊的人与人之间的关系,是数据关系。


我们通常讲道德,伦理,也没有什么严格定义,我们就这么认为吧。核心部分是法律规定,法律以外就是在道德伦理范畴,我把道德跟伦理稍微区分了一下,道德广义一些,伦理就是人跟人具体发生关系了。你在街上扔一个东西,开车的时候扔一个垃圾别人说这个人不道德,不会说这个人不伦理。如果你侵犯别人隐私不光是不道德,还是伦理的问题。

0?wx_fmt=jpeg

0?wx_fmt=jpeg


我们提倡一个观点,就是要建立在大数据时代的伦理原则,挖掘数据的时候问问你自己到底要干嘛;有的是生成数据,生成数据的时候要对你生成的数据负责。能不能提倡一个传责自负?记得我在大学读书的时候,也发生过现代陈世美跟秦香莲那样的事情,当时是贴大字报,那个也是传播信息,只是没有现在这么快,伤害也就小一些。今天你传播了就要对你传播的内容负责。当然我们需要考虑对公众人物,对普通人物,对公众行为和对个人行为的区别对待。公众人物有时候很希望别人关注他,他想着法把一些信息甚至对一般人来说是隐私的信息暴露出来。这时你传播一个公众人物信息的责任和你传播一个素不相识人信息的责任会不一样。我们要探讨数据时代人与人之间的关系怎么确定?最后一个伦理原则即便抛开大数据时代也是对的,那就是我们的古训:“己所不欲勿施于人”。

0?wx_fmt=jpeg


再讲讲利己主义的悖论。隐私问题:我们现在一方面希望得到个性化服务,一方面希望保护自己的隐私。当女生定制一件合体的裙子时候,你已经把三围告诉别人,而且让别人寄到你家里。为什么你告诉别人,你不图的就是个性化,这是一个悖论。不要过分强调个人隐私。如果你想要隐私,不许医生使用你的病例在别人身上,医生可以不给你治病。因为医生治病能力是在大量别人病例的基础上建立起来的。第二个悖论服务。是我们家的例子,就是住的地方信号不好,投诉几次移动公司说你们小区的人都不同意建基站,我们一方面希望有很好的通话质量,又不想自己住的周边放基站,这都是伦理的思考。当然还有一方面希望别人把数据公开出来,一方面找种种借口不开放自己的数据。

0?wx_fmt=jpeg

这里面涉及很多新时代的问题,新的挑战,但我认为我们价值观会重塑。什么是隐私?有些在今后不再成为隐私,你走在公众场合下,你就没有了行为方面的隐私。我今天讲的每句话都得负责任,所以我说的话都不是隐私。数据的权属问题,我们刚才专家提到,有没有权把自己信息删掉,如果有一个犯罪分子对你进行了侵害,我们到网上查它的踪迹的时候,结果说对不起,他10分钟之前把自己的信息删了,作为受害者你愿意吗,肯定不愿意,很多事情是双刃剑。信息安全问题也是,没有绝对的安全,我们一环一环扣起来,争取能够发现问题解决问题。现代社会权力和义务是对等的,没有对数据的绝对权力,个人没有,企业没有,政府也没有。

0?wx_fmt=jpeg


今天铺天盖地的数据向我们袭来,我们有很多新问题还没有解决好,包括数据道德伦理教育。法律永远不可能解决所有的问题,我们需要道德伦理,要进行伦理道德教育。希望伦理道德教育能够作为基础教育一部分,包含数据时代人与人之间关系的新特点;面对利益冲突的时候,运用大数据理念分析各方的关注点以达到新的平衡。在道德伦理教育中要有正确的舆论引导,要建立基于数据伦理道德的新公序良俗。

0?wx_fmt=jpeg


大数据给我们出了这么多难题,我个人还是很看好大数据。因为毕竟这个大数据让我们把这个社会、这个世界和我们自己看得更清楚了;大数据因为它增加了信息透明度,有利于建立社会的公平正义。大数据时时在提醒我们行为规范,大家既然觉得自己害怕一些做的“坏事”暴露出去,那就少做或者不做。我在清华的时候听学生们说在中国人民银行的网站上可以查自己的信用记录,我能够隐约感觉到学生们在意自己的信用记录了。有越来越多的人在意自己的信用记录,对于我们中国这样一个没有很好的建立起信用体系的社会来说,是一个好事。说明大家开始有这个意识了。

0?wx_fmt=jpeg
另外毕竟跟过去相比大数据让我们更接近事实,一个人的DNA数据有几个T,这个是不是跟十万年前一样不敢说,但是这个数据可能一万年前就是存在的,只不过那时我们不知道。我们今天突然知道这些数据的存在感觉挺恐怖的。但是大家想一想,在16世纪到17世纪的时候,人类刚刚发明望远镜,我们突然发现某一亮点原来是一个大星球;我们肉眼看手上什么都没有,拿显微镜一看,看到很多细菌在那里走感觉很恐怖。我们今天发现很多我们不曾接触的数据,感觉一下子乱了章法。人类就是在不断的认识世界中前行。我们今天对世界认知的颗粒度超过以往,我们要看清这个世界。大数据还能够记录违背法律及公序良俗的行为,帮助我们建立更好的秩序。大家都希望这个社会变得更美好,大数据能够帮助我们让这个社会更美好。


今天提出这些问题,还是希望引起大家的思考,能够带来大家对大数据的兴趣以及大数据相关问题的深入讨论!谢谢大家!


原文发布时间为:2015-05-28

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
算法 NoSQL 大数据
清华崔鹏团队KDD论文一作解读:在大数据背景下进行因果效应评估
上述图表只汇报了小部分结果,更多结果详见我们论文。从上述结果中,我们发现,基于 Directly Estimator 在所有 setting 下都失败了,这是因为该方法忽略了数据中存在的 confounding bias;基于 propensity score 的方法
2213 0
|
大数据 数据挖掘 UED
清华讲坛:国双大数据助力传统媒体融合转型
本文讲的是 : 清华讲坛:国双大数据助力传统媒体融合转型   ,   新媒体时代来临,微信、微博等社交平台方兴未艾,人人都成为信息的主体和传播渠道,传统媒体的内容垄断地位及收费模式面临严峻挑战,纷纷寻求借助新技术,实现成功转型。
1535 0