大数据陷阱:谁有权享有大数据,谁有权分析大数据

简介:

既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证

中国信息通信研究院在第十六届中国互联网大会上发布的《中国数字经济发展白皮书(2017)》指出,2016年中国数字经济总量达到22.6万亿元,同比名义增长接近19%,占GDP的比重超过30%,同比提升2.8个百分点。数字经济已成为近年来带动经济增长的重要动力。

人类已经进入到了一个无商不利用数据,无领域(包括政府)不利用数据的时代。无论你利用数据赚钱也好,还是希望改善公共服务和社会治理也好,大家共同面临一个法律上难题:谁有权享有数据?享有什么内容和程度的数据权利?如何保护数据?数据的权益属性?类似的问题,还没有得到很好的智库研究,也未能提供很好的有效政策建议。本文提出五个智库观点,供决策依据考虑。

经过处理的大数据才有价值

大数据是来源于网络和各种传感器对特定对象的记录,它是关于人、组织和物(机器和自然界)在特定时间、地点的行为、过程、事件的事实数据。作为技术,大数据是抓取和分析世界和人们生活的一种数据技术,它使人类具有全过程、全方位记录各种事件和行为的能力,具有透析过去和预测未来的能力。

在大数据时代,任何数据均具有潜在的价值。在过去人们重复利用的数据资源主要是人类观察、思考、创作完成的成果,比如文章、文件、论文、著作等,而如今人类可以利用各种机器运行轨迹、人类活动记录、自然界变化观测等信息,过去需要大量观察访谈、调查统计、测量等完成的,现在可以借助计算机系统、各种数据采集器完成,并通过大数据分析工具实现全样本、自动化处理和分析。在过去,没有人在意我们自己的行为轨迹,也无法记录大量的事件和过程,可以说作为“垃圾”自觉或不自觉地扔掉了,而现在的数据技术使我们具有变废为宝的能力,因而大数据技术可以说是一种在浩瀚的数据海洋中发现“宝贝”的技术。

正因此,数据正在成为人类可拥有和控制的资源。我们已经进入到数据生存时代,大数据正在提供新的研究范式,重新认识宇宙、物质、生命和社会,并在此基础上带来科技技术、管理决策、社会发展的巨大变革。如今我们提到的智能制造、人工智能、机器学习、分享经济、个人性化定制或服务等技术和商业模式的创新无不建立在数据资源基础上。著名大数据公司Gartner认为,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可以毫不夸张地说,未来经济和社会发展是建立在大数据技术普遍应用基础上,数据不仅成为经济创新转型发展的引擎,而且是所有企业市场竞争的重要资源。因而,数据利用秩序成为未来社会的第一秩序。

传统的财产权不适合大数据

如果说所有权(排他支配权)是构筑物质资源利用秩序的法律工具的话,那么它是否可以移植到数据世界,建构数据的利用秩序呢?答案是否定的。这是因为数据的非物质性,很难实现排他使用。其一,数据使用的非排他性,一个占有使用并不妨害他人占有使用;其二,数据使用具有非消耗性,数据的使用不消耗本体,反而丰富数据,使数据具有新含义或增值。因而数据天然地不适合于所有权体系,通过数据上设置排他支配权不适用于大数据时代。

在《民法总则》制定过程中,数据信息曾被纳入知识产权的客体,试图设立类似知识产权的专有权,但最终出台的《民法总则》并没有将数据信息列为知识产权的客体。这是因为,大数据背景下的数据更多的是事实记录,其数据的收集(采集)和聚合本身并不能实质性改变数据的价值。数据具有价值或者能够实现价值需要一系列的筛选、分类、处理、合并,形成主体数据、专题数据,使数据变成可用的数据产品,通过数据产品交易或服务,实现数据的价值。那么,数据产品化或商品化的过程,是否可以被赋予类似于知识产权的专有权呢?

知识产权是保护创造性劳动成果的一种制度,而创新劳动成果多表现为思想、技术方法、标识等,而这些离不开信息或数据。不过,知识产权并没有建立对创新成果(思想或信息)本身的支配权,而是将思想或信息置于公共领域,仅赋予权利人一定期间的商业化使用创新成果的专有权。也就是说,在知识产权体系下,仍然坚持信息(思想)公开和自由原则,数据及其所承载的科学文化成果被认为是社会活动的公共要素,置于公共领域。

显然,在大数据时代,我们仍然应当坚持将数据产品或信息视为公共资源的原则,而不允许信息私权化或成为私权客体。因为这样会妨碍科学文化进步,妨碍社会正常交往和运行。数据赋权仍然应当坚持数据的公共资源属性,不应当赋予数据持有者对数据的所有权,我们也不应当突破知识产权制度理念和框架,赋予数据持有人对数据本身的某种支配权。

因此,无论以有形物为基础财产权,还是以无形物为基础财产权体系,均难以解决数据时代的数据利用秩序问题。

数据该如何赋权

数据从原生数据到有价值的数据产品需要投入,这不仅仅是劳动投入,而且还有资本投入,而只有当这些投入得到足够的回报时,才有人从事数据的收集、处理和加工,将数据转化为产品或服务。解决数据产品制作者激励是数据赋权要解决的核心问题。

根据前面的论述,即使是数据产品,也要保持社会公众对该产品的可接触或可学习的公共属性,仅仅赋予数据产品制作者以商业化使用数据产品的权利。数据产品的制作者权利应当包括自己使用和许可他人使用的权利,或者利用数据提供服务的权利,同时有权制止他人商业目的的使用该数据产品的权利。这种基于对于数据分析加工劳动而取得的数据使用,属于一种新类型财产权,不妨可以称为数据使用权。它区别于传统的物权之处,在于它不是对数据的支配权,而区别于传统知识产权之处在于,它并不要求独创性或创新性。这样,可以给数据产品制作者实现其收集和加工数据的激励,促进数据产品的生产和流通,满足社会对数据产品的需要。这里赋权的正当性在于保护数据上存在合法利益,使数据产品持有人可以收回劳动投入甚至获取利润,但并不能绝对地排除他人使用相同的数据。当然,如何确保数据产品制作者商业化使用权,又使数据保持一定的开放性,使公众可获取性,需要精细的法律制度设计。

数据主体利益的保护原则

在大数据环境下,一切数据皆有源。当数据来源于个人或者是对个人的描述时,就落入个人数据(又称个人信息)范畴。个人数据包含隐私信息(个人的私密信息),隐私保护成为个人数据保护的重要组成部分。在这方面,国际社会关于个人数据使用的总体原则是合法、正当和必要原则,以不侵犯个人尊严或自由等基本权益,尤其是隐私利益为基本限制,只有法律规定的敏感信息需要征得个人的同意,而一般的个人信息则并不需要个人同意。我国现行规则为,除遵循合法、正当和必要原则外,还必须征得个人的同意,似乎给了个人对个人信息的控制权。这与个人信息的多样化或多种法律属性(许多个人信息是可以公开的并为企业组织使用的)事实不吻合。其实,仅仅识别特定个人并不足以给个人以对该信息享有支配权,个人信息仍然是社会交往的工具。但是,个人信息的收集和使用必须尊重个人权利,必须确保个人知情和在必要时的干预(更正、删除等)。

除了来源于个人外,企业数据还需要获得其他企业和社会组织的数据。除非这些数据是置公开的可供他人自由获取的状态(成为公共数据),那么取得这些组织的数据也需要获得数据实际控制人的同意,而不能够随意抓取、窃取或采取其他非法手段获得。数据产品制作者权益的保护是建立在合法取得数据的基础上。这种合法取得实际上也意味着法律对数据来源者利益的保护。在此方面除了保护个人信息外,还有企业信息的保护问题。

大数据应用最关键的是取得尽可能大而全的数据,而为取得他人的数据就必须合法合规,其中最为重要的是尊重和保护个人信息权益。由此,数据利用秩序归根结底是要建立数据来源方(原材料提供者)到收集加工制作方(制作者)再到数据方(消费者)有关于数据权利和义务配置秩序,在保护各方权益的前提下,保持数据开放性和流通性,使数据得到社会化的利用,实现数据的价值。

数据利用秩序关系大数据战略

在过去,数据被作为公共资源,甚至许多数据被作为垃圾随意地丢弃了,没有讨论数据产权问题。但是,随着数据价值的重新发现,随着人们对数据掌控能力的提高,数据逐渐地成为可控制的对象了。在数据可控制的情形下,要让人们掌握的数据拿出来分享和利用就必须要有激励,就必须创制数据社会化利用的秩序。《国家信息化发展战略纲要》明确提出要“探索建立信息资产权益保护制度”。由于数据本身仍然需要保持一定公共性,赋予任何主体对数据和数据产品的绝对支配权,都背离人类社会发展的基本理念,因而数据赋权,仍然应当坚持信息自由原则。

数据总是处于不断地脱离原来主体而流动,而正因为这样的流动,才使数据产生价值,但脱离主体也意味着原主体丧失对数据的控制。既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
14天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
27天前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
1月前
|
数据采集 运维 数据挖掘
API电商接口大数据分析与数据挖掘 (商品详情店铺)
API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。
|
3月前
|
关系型数据库 MySQL Serverless
高顿教育:大数据抽数分析业务引入polardb mysql serverless
高顿教育通过使用polardb serverless形态进行数据汇总,然后统一进行数据同步到数仓,业务有明显高低峰期,灵活的弹性伸缩能力,大大降低了客户使用成本。
|
3月前
|
机器学习/深度学习 数据采集 算法
大数据分析技术与方法探究
在当今信息化时代,数据量的增长速度远快于人类的处理能力。因此,如何高效地利用大数据,成为了企业和机构关注的焦点。本文将从大数据分析的技术和方法两个方面进行探究,为各行业提供更好的数据应用方向。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据分析的技术和方法:从深度学习到机器学习
大数据时代的到来,让数据分析成为了企业和组织中不可或缺的一环。如何高效地处理庞大的数据集并且从中发现潜在的价值是每个数据分析师都需要掌握的技能。本文将介绍大数据分析的技术和方法,包括深度学习、机器学习、数据挖掘等方面的应用,以及如何通过这些技术和方法来解决实际问题。
49 2
|
3月前
|
机器学习/深度学习 人工智能 运维
大数据分析:探索信息世界的钥匙
在当今信息爆炸的时代,大数据分析成为挖掘宝藏般的技术和方法。本文将介绍大数据分析的基本概念、技术与方法,并探讨其在商业、科学和社会领域中的广泛应用。从数据收集和预处理到模型构建和结果解读,大数据分析为我们揭示了信息世界的钥匙,为决策者提供了有力的支持。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
104 0
|
3月前
|
数据挖掘
离线大数据分析的应用
离线大数据分析的应用