挖掘数据价值vs确保隐私安全,可以同步

  1. 云栖社区>
  2. IT168>
  3. 博客>
  4. 正文

挖掘数据价值vs确保隐私安全,可以同步

青衫无名 2017-09-01 10:29:00 浏览805
展开阅读全文
文章讲的是挖掘数据价值vs确保隐私安全,可以同步“隐私”已经成为一个社会广泛关注的关键词,我们每天都在产生大量数据,很难做到把个人信息完全封闭起来,那么,在这样一个移动互联、大数据盛行的时代,怎样才能保护好个人隐私呢?首先我们需要了解的是什么样的数据可以称为隐私数据。你认为是隐私,他认为只是信息;于你而言强调保护,于他而言强调分享。按市场上通用的分法,我们一般将隐私数据分为个人信息、财产信息和隐私信息三种,前两者与人们的日常工作生活息息相关,而隐私信息则更为私密,诸如病史尤其精神病史之类的内容。

  隐私为什么会暴露,我们分析出的原因与时代特征有很大关联:一是在大数据时代,人们对数据的利用不仅包括合法途径,还有一些非法的利用方式,如通过出售用户数据来牟利,从而造成大量隐私泄露等状况发生;二是移动互联网的迅速兴起,让人们的工作和生活变得越来越透明,促使个人隐私内容越来越多,包括账号密码、图片、视频和通讯录等,加大了数据暴露的风险;第三,一种共识已经达成,越来越多的人都清楚认识到数据既然有价值就会有风险,没有任何人能够100%控制如何使用自己的个人信息。

  隐私保护,政府、企业、个人合力共筑就像走路不能抹去自己留下的脚印一样,我们根本无法抹去“数据脚印”,这让你的隐私暴露风险增大。散落于手机、电脑、信用卡和视频监控等各种业务系统中的数据乍一看价值不大,但如果把它们深入整合、挖掘,就能发现这个消费者的性格、爱好以及消费习惯等信息,这些信息对于商家、企业非常有价值,但对消费者来说,预示着宁静生活被打破了。

  从个人角度讲,我们要增强隐私保护意识,比如不填写非业务关联的表单、不在搜索关键词和聊天记录里包含个人信息,等等。但是,隐私保护的主导权却不在个人手中,真正能对这些数据信息进行保护的是搜集到信息的商家和企业。

  近两年,国家政府着重强调信息安全,企业都非常关注信息安全问题。敏感的个人、财务和隐私信息受到多种不同行业和政府数据隐私法规的管制,如果政府部门、金融机构、医疗院所、企业集团不能保持数据隐私,他们就会面临严重的财务和法律惩罚,同时还会在客户与市场信心方面蒙受可观损失。众多的企业和机构纷纷建设信息安全政策、设立隐私保护策略、引进技术产品来保护这些隐私数据,以增加客户的信任度。

  数据管控,业务和IT是 “合伙人”在企业里,制定安全政策、设立隐私保护策略的应该是CIO。对于CIO来讲,即要把数据当成企业资产来管理,同时它也应该成为风险管控的一个方面。资产管理比较容易理解,难的是作为风险要如何管理。我们可以借鉴前期的网络安全、防病毒等安全管理方面的例子。数据风险管理既有数据安全管理自己的特点,也属于传统安全管理领域的一部分。Informatica建议客户进行数据安全管理的第一步是对信息进行安全等级划分,区分出哪些数据需要做管控,哪些可能要做,哪些缓做。第二步则要建立数据安全责任体系,同时也需要各种内部流程去支持配合。

  建立风险应急机制也是CIO应该重点关注的问题。任何人都不可能保证信息会100%的不泄露,不管采用什么样的方案,多么完善的安全措施,终归有泄露的可能。假设你的客户已经获知他的信息被泄露,风险已经发生了,如果没有正确的处理方法将最终失去客户,甚至面临法律的严惩。

  对于数据,很多人都会认为是技术部门在管控它,实际应用则归属业务部门。我们知道,管控就会限制自由,业务部门更希望充分的自由,这看上去好像是对立的,其实业务和IT永远是协作关系,是“合伙人”。这两年比较火的一个词是可穿戴设备,很多企业认为自己已经做过防下载,安全信息绝对不会被下载。但当眼镜里有个摄像头,业务人员看完企业全部信息后拿回家传到个人电脑上,你又能怎样防? 所以,这个大数据和移动互联时代,业务部门也应该是数据的责任人,他们虽然不能直接接触数据库,但会看到数据库中的敏感信息,也可能会无限制地使用这些信息, IT要让业务部门及时了解到风险实际存在。

  数据泄露,内部威胁大于外部攻破我们从调研机构的研究发现,主要的数据泄露不是来自于互联网攻破,而更大的原因来自于企业内部数据被盗,当然这个企业内部指的不仅仅是内部员工,有可能是供应商、合作伙伴和外包人员。内部威胁大于外部威胁,并不是指安全技术和解决方案方面,落后于外网,相反,正是企业在外部环境中部署了层层安全网关,软硬件结合安全“武装到牙齿”,甚至将安全外包给专业的服务商。而企业却往往容易忽略来自内部的威胁,除了那些“内鬼”主动进行商业秘密泄露行为,还有很多“被动”泄密,如企业员工使用社交网络,在工作期间与外部合作,容易在企业内网之外将敏感数据泄露出来,而这些企业必须预见并防止敏感数据遭到有意或无意的误用、泄漏或盗窃。

  信息泄露的方式千变万化,每种都有不同的管控方式, Informatica对数据隐私泄露问题做了多年详细调查与研究,向客户推荐的数据隐私保护方案能够让他们在使用重要数据的同时,将数据泄露和损失的风险降到最低。Informatica隐私保护解决方案是一个通用产品,可以针对任何数据库, Oracle、DB2、SQL Server、MySQL、SAP/Sybase、Hadoop平台等,能够解决个人信息、财产信息、隐私信息、汇总信息等隐私的问题。

  Informatica方案,保护隐私时获得数据价值

  Informatica隐私保护解决方案基于数据脱敏技术,并且在最近两年,开始被越来越多的组织机构所采用。数据脱敏可分为动态数据脱敏和静态数据脱敏。其中,静态数据脱敏用于处理静止的数据。例如,当机构单位打算把数据从一个生产数据库拷贝到另一个非生产数据库时,就要提前对这些数据进行脱敏,也就是所谓的静态数据脱敏。Informatica Persistent Data Masking是高度可扩展的高性能静态数据脱敏软件,可帮助 IT 组织管理对最敏感数据的访问。该软件通过创建可在内部和外部安全共享的真实但无法识别归属的数据,防止机密数据(例如:信用卡卡号、地址和电话号码)意外泄露。

    而动态数据脱敏可随时对敏感字段进行脱敏。数据使用者可以共享和移动数据,同时确保只有认证用户才能查看真实值,并在数据分析和研究中使用这些数据而不违反数据隐私法规。 比如,当银行的客户代表根据客户要求调整信用卡限额时,他要调用单独的应用程序,以访问客户的概要信息。此时,动态数据脱敏技术会从数据库中取回用户脱敏后的银行帐号、生日和其它敏感信息。Informatica Dynamic Data Masking动态数据脱敏软件,可以实时防止未授权用户访问敏感信息。它允许 IT 组织根据用户的身份验证级别应用先进灵活的数据脱敏规则,同时动态地为信息脱敏,阻止、审计和提醒访问敏感信息的最终用户、IT 人员和外包团队,同时确保便捷地遵守隐私法规。

  我们再来看一个在数据挖掘过程实现数据隐私保护的案例。数据挖掘是挖掘数据价值的一个手段,在做数据挖掘模型时必须要使用真实的数据,假如虚拟一套数据做挖掘模型,有可能挖出来的东西与实际业务不匹配。很多行业在做数据挖掘、数据分析的时候,用的都是真数据,而用真数据就有泄露风险。Informatica解决方案在数据库前建立了一道防火墙,让你访问单条数据的时候,永远不会看到真实数据,但通过防火墙将模型放进去后,它又确实是运行在真实数据上。某银行做大客户促销活动,希望从银行海量数据中挖掘出一批适合这个产品的客户,银行的需求是挖掘模型能够把大客户的身份证号码提炼出来。挖掘模型的风险可以用Informatica方案建防火墙来解决,还有一个风险是如何确保拿出身份证号码的客户的信息安全。Informatica拥有独特的技术,确保提取的身份证既能反馈到真实的数据库里的信息,又不会显示真实的身份证信息,防止泄密风险。

  价值与隐私,如同数据这枚硬币的两面,手握用户数据的企业,必须确保自己在发掘大数据价值的同时,尽量不去碰触到那条敏感的隐私红线,这才是从大数据这座矿山中开掘出真金白银的可靠途径。


作者:杜绍森

来源:IT168

原文链接:挖掘数据价值vs确保隐私安全,可以同步

网友评论

登录后评论
0/500
评论
青衫无名
+ 关注
所属云栖号: IT168