大数据开放面对的瓶颈究竟是什么?

简介:

大数据无影无形却又无所不在,这个听起来冰冷的词汇,如今已经被商机包围。你上网搜索的关键词、你网上购物的记录,你在社交平台分享的消息,你去超市买口香糖的频次,甚至你在八达岭高速上拨出的一个电话,可能都极具“价值”,成为别人洽谈桌上的筹码。

大数据开放面对的瓶颈究竟是什么?

被“窥视”的无奈

对于许多在网上购物的顾客来说,总能在网页上看到与他们浏览记录相似的产品广告, 这似乎让数据变得贴心起来,但大家也逐渐意识到这并不是巧合。网络浏览记录、交易记录、手机通话记录、收发邮件 记录、社交网络记录,你在网络上的每一个“足迹”都会以数据的形式记录并存储下来,它们精准、事无巨细。

不可否认,大数据为监测和预示人们的生活提供了极大的方便,然而个人隐私也随之暴露在无形的“第三只眼”之下。无论是电子商务、搜索引擎还是微博、微信等互联网服务商都对用户行为数据进行挖掘和分析,以获得商业利益,这一过程不可避免地威胁到普通人的隐私。大数据有可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。

一直以来,大家普遍认为,只要我们在网络中匿名就可以避免个人信息的泄露,但是大数据告诉我们,数据的交叉检验会使得匿名化失效。我们的隐私数据每天被记录,随时有可能被泄露。

“用户在使用微信的时候,免费使用并打开一些关联链接,但是平台拿到了你的信息并窥视了你的隐私,这代表我们享受了这种服务就牺牲了隐私,由于我国法律并没有对数据使用进行相关约束,也没有信用评估的机构进行监管,使得目前很多数据使用还游走在法律的边缘,数据拥有者如何用它、用到什么程度,没有清晰的界定,有触碰隐私的交易也没办法干涉。”中国联通网络技术研究院首席专家唐雄燕告诉记者。

当数据交易还处在不成熟时期时,哪些领域更应该注重数据隐私的保护和规避?大数据产业联盟会长董力明告诉《经济》记者,交易数据获取收益,就有可能涉及个人隐私,比如说在互联网广告领域。“这时就要做数据脱敏以保护隐私,目前在贵州建立的大数据交易所,更多的是和政府相关的数据,这就必然要对数据进行脱敏。”

目前,比较成熟的数据交易方式是通过数据报表交易,报表不涉及隐私,反映的是社会、产业、消费者群体的趋势,隐私数据不能开放不代表不能有数据生态,脱敏后的数据能够流通起来并创造很高的社会效益。

对此,唐雄燕也表示认同,他认为,个人数据最小,但是也最敏感。数据脱敏会把敏感信息进行编码,让这个编码代表唯一的一个人,但又不与他人重复。

追逐利益不能违反规则

作为掌握诸多数据的运营商、企业,如果深入挖掘这些数据,带来的收益非常可观,基于企业、运营商等对数据交易的需求,除去一些非法交易,数据交易今后怎么做?

唐雄燕表示,“由于行业壁垒重、法律不健全以及涉及顾客隐私,现阶段很多的数据还不能轻易进行交易。大家也在探索,作为运营商首先会考虑今后交易一些统计性数据。”

当国内一些大数据领域的互联网公司在数据交易上违反国家的法律和商业道德时,作为数据平台的专业人士,中金标准数据公司总经理郝文嘉认为,要从国家的层面立法打击,毕竟个人的隐私通过互联网被售卖以获取商业利益,这本身就违反了国家《民法》和《经济法》的规定,“国家立法机关要跟上基层进步的步伐”,在全球,隐私交易行为都是不被允许的,这种行为触碰了商业道德底线,想要建立起平等、公平的市场环境就要遵守规则。

可能有一些掌握信息的商业性机构或是管理机构,不注意数据保密,把信息泄露出去,利用信息去追求商业目的,全国政协委员、中华全国律师协会会长于宁向《经济》记者称,虽然国家在隐私保护法律上能找到相关条款,但在大数据领域涉及隐私保护的法律条文还没有跟上。

信息发达和发展带来新变化,这也引起了国家立法机构的重视,《民法》、《刑法》也渐渐地开始体现对隐私的保护,专家学者在反映,法律也在创制、调整,但是具体涉及国家立法的计划,还需要人大常委会的立法机构和法律专业人士进行引领和商讨。

但董力明认为,对某个领域如果监管太多,可能会抑制其活力。

就算利用法律去强制控制,法律和规则有的时候也难以规定得太过具体,所以中间肯定会存在灰色地带,唐雄燕表示,大数据在运营的过程中,“一些问题可能会随着时间逐步显现并规范,大家会形成共识,在一些问题还没显现的时候,不能先出现法律去遏制它的发展。目前的数据交易的平台也在尝试发现问题的过程中,然后去改善。”

别让政策阻碍了数据开放

数据只有连接起来才能创造价值,那么大数据市场真的得到开放了吗?董力明认为,离真正的数据开放还有很远的路要走,“美国和英国数据开放的第一步是跟生物相关的数据,政府希望通过开放这些数据,来增加社会效益,但是在与企业有关的数据上,大多数企业还保持谨慎态度,因为这是数据资产,不可能轻易地开放出来。另外与人相关的数据涉及隐私保护这个敏感地带,所以更是难以得到开放的。”目前社会上开放的,往往是与宏观、经济、政府的一些公共部门,比如说天气、地质相关的数据,这些数据不涉及如军事等相关的敏感信息。

如果技术不是阻碍大数据发展的瓶颈,那还有什么遏制了它的发展?数据开放面对的瓶颈究竟是什么?中国通讯协会常务副理事长兼秘书长张新生说,“是政策上的”,如果不把对各层面利益的分配架构打好,数据开放还是较为漫长的过程,但是也不要把政策看得太重,不盈利也要将大数据做起来。他表示,“别期望政府走在前面,这会遏制创新和产业的快速发展,企业要先动起来,探索的过程永远是未知大于已知。”

那么,数据的把控权利移交政府会否对数据安全有更好的把控?“我觉得政府很难完全控制大数据,只是能够制定一些规则,只有商业机构更清楚地知道数据的价值,政府主要还是保护数据的安全。”唐雄燕说。

大数据并不神秘,但是在国内这种环境下,真正运用大数据的很少,它还面临着认识和能力上的问题。郝文嘉说:“每一种数据都是有缺陷的,因为数据来源于互联网,同时互联网数据的发布也是海量的,这就会存在一些数据发布的参数、量质不符合应用和计算的状况,数据的价值有缺陷就影响发挥,这是任何行业都不可避免的,所以盲目地去相信大数据也不对,正是由于大数据的缺陷性,数据公司就更要努力把缺陷补足。”

目前这个阶段,还处于大数据发展的初级阶段,郝文嘉还认为,经过数据平台对数据的不断补足,对社会数据应用的提高,这个过程中,数据积累到一定程度达到成熟,就会推动整个社会成指数型进步,这也是走向人工智能化的一个基础。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
分布式计算 MaxCompute
《MaxCompute持续打造开放的产品生态》电子版地址
《MaxCompute持续打造开放的产品生态》PPT
84 0
《MaxCompute持续打造开放的产品生态》电子版地址
|
存储 数据采集 算法
Paper Time|开放式时空大数据助力智能公交路线规划
Paper Time|开放式时空大数据助力智能公交路线规划
520 0
Paper Time|开放式时空大数据助力智能公交路线规划
|
SQL 消息中间件 分布式计算
基于开放共享的自主研发—MaxCompute 持续增强生态与开放性建设
MaxCompute 是阿里巴巴自研的云原生数据仓库,同时也兼容大部分大数据生态系统。一个平台无法实现所有功能和解决所有问题,MaxCompute 需持续增强生态与开放性建设,方能走得更远。
1078 2
基于开放共享的自主研发—MaxCompute 持续增强生态与开放性建设
|
存储 弹性计算 人工智能
大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测
计算性能稳定优异,极低访问延迟,主动运维
大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测
|
存储 分布式计算 自然语言处理
基于MaxCompute+开放搜索的电商、零售行业搜索开发实践
搜索一直是电商行业流量来源的核心入口之一,如何搭建电商行业搜索并提升搜索效果,一直是电商行业开发者努力攻克的难题。基于传统数据库或开源引擎虽然能够搭建基础搜索服务,但随着商品数据的增多和业务流量的增长,难免会遇到性能瓶颈和效果瓶颈。另一方面,随着电商、直播、云计算等技术的不断发展,越来越多的传统零售企业正在进行互联网云上转型,特别是受近两年疫情等因素的影响,APP、小程序已经成为零售企业重要的业务增长来源。在此背景下,如何快速搭建高效搜索服务成为零售行业上云及转型的难题。
1117 0
基于MaxCompute+开放搜索的电商、零售行业搜索开发实践
|
数据采集 人工智能 运维
《一站式大数据开发治理DataWorks使用宝典》官方电子书开放下载
零基础入门大数据开发治理,上手DataWorks 10大模块
38725 2
《一站式大数据开发治理DataWorks使用宝典》官方电子书开放下载
|
自然语言处理 运维 监控
阿里云飞天大数据产品价值解读——《一站式高质量搜索开放搜索》
随着研发技术的发展,开发者对内容、工具、平台等的一站式需求愈加强烈。为了构建更加高效和高质量的一站式大数据搜索产品,阿里云将一站式搜索服务的核心着眼于实现高质量以及开放式搜索。本次直播将由阿里云智能-高级产品专家染天为大家全面解析OpenSearch核心能力、搜索体验、价值评估并分享典型案例
4873 0
阿里云飞天大数据产品价值解读——《一站式高质量搜索开放搜索》
|
人工智能 搜索推荐 大数据
开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践 | 开发者必读(130期)
深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。
3516 0
|
大数据 人工智能 分布式计算
开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践
深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。
66419 0
开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践