大数据流通存隐忧 产业信任体系亟待建立

简介:

就在今年10月,始于美国东部的“DDoS攻击”席卷了整个美国,引起了人们对数据安全的恐慌,大数据安全问题逐渐暴露。在第三届世界互联网大会的大数据分论坛上,中国科学院秘书长邓麦村在致辞中指出,如何突破大数据关键技术,如何运用大数据推动经济发展、完善社会治理,如何在推动大数据发展的同时确保信息安全,已成为世界各国和各行业普遍关注的热点问题。

邓麦村还呼吁,产业各方要在大数据理论、方法及关键应用技术等方面进行探索,不断提升数据分析处理能力、知识发现能力和辅助决策能力,形成安全可靠的大数据体系。

大数据安全难题几乎已成业内共识。正如中国科学院院士、中国科学技术大学常务副校长潘建伟教授所说:“在对各式各样的资源进行数据收集的时候,第一个挑战便是互联网的安全性,我们希望数据能够被安全地收集。”在他看来,新量子革命或者量子通信的飞跃,也是为了能够更加安全和有效地进行大数据分析。

中国信息通信研究院总工程师余晓晖在演讲时也表示,在释放大数据潜能时,如何解决安全和信任问题成为当务之急。

安全与信任问题形势严峻

在我国,数据交易产业刚起步。2015年4月,国内第一家数据交易平台——贵阳大数据交易所才正式上线。截至2016年10月,我国已经建成并运营的大数据交易所(或交易平台)已经超过10家。

余晓晖透露,预计到2017年年中,大数据交易所(或交易平台)将达到15~20家。可以说,平台建设正处在井喷期,而且平台的变现能力正在得到稳步提升。值得注意的是,随着流通环节的加强,就个人数据收集角度而言,海量的数据收集难度比较大,收集过程中透明度也比较低。

余晓晖指出,在数据分析过程中,通过对数据的深度挖掘分析,可以形成用户画像,将给个人隐私带来威胁,并且在流通环节,由于多方主体的介入,使得数据转移的控制力差,数据泄露的风险正在加剧。

他还强调,在数据交易方面,由于缺乏统一的数据交易规则,也存在一些问题。一是数据的权属不明确,交易标的争议也很大;二是由于数据的定价模式不统一造成数据资产的评估存在困难;三是数据安全问题比较突出,如何确保数据在交易过程中不被泄露、窃取、篡改、复制是当前需要解决的重要问题;四是数据交易监管机构未明确。

信任体系建设需克服三大难题

正如余晓晖所言,目前数据交易平台建设正处井喷期,但是数据资源交易机制、定价机制以及规范交易行为的举措都尚未明确。余晓晖呼吁,规范的大数据流通信任体系亟待建立,建立规范的大数据流通信任体系需要解决三大问题。

一是数据权属问题需要得到准确界定。从传统意义上来说,数据的所有权应当属于数据的原始提供者。但基于原始的用户数据,在去除个人身份属性之后,如何划分数据主体、与数据控制者的产权边界,亟待业界统一认知。

二是数据隐私保护问题需要大力规范。目前,基于大数据对用户的行为特征进行分析并得出用户偏好的营销行为已经广泛开展。然而,与此相关的个人隐私泄露问题也被广泛探讨。对公民个人信息的保护,与数据的获取和使用存在天然的不协调,这方面的法律法规亟需完善。

三是数据流通各环节标准缺乏统一共识。一件商品越标准化,对其进行交易就越方便。然而,由于数据本身的属性,其清洗、分析、存储、定价等问题都存在一定特殊性。数据买方事先无法获知数据使用的效果,因而无法评判数据价格的合理性,导致数据买方需求不足。


本文作者:赵艳薇

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
46 0