机制 | 治理大数据可信度价值

简介:

大数据的利用价值取决于元数据的可靠程度。

一方面,中国现阶段由于数据管理的相关法律欠缺,加之法律层面没有将企业、政府甚至个人所拥有的合法数据界定为其重要资产,并且社会文化中收集、管理数据的意识不够,不重视对数据的保存和利用,从而忽视保护数据的真实性等,以上种种原因直接导致未来使用大数据的可信度。

另一方面,大量从社交媒体、社区互动等数据源收集来的数据,本身不一定可靠。很多信息发布随意性强,公开的数据找不到数据引用来源,有些个人或企业受利益驱使,刻意伪造数据等。这些都构成大数据使用过程中的障碍。

解决方案可以从依法保护各种公共数据的真实性,制定政策促进和鼓励企业、政府机构通过市场机制对各自拥有和掌握的数据进行买卖、交易等活动入手,从而带动全社会重视各种数据的真实性和可靠性。试想,谁会花大价钱去买假数据或水分很高的数据呢?企业拥有真实的数据,建立了可信赖的品牌效应,它就拥有了大数据的专业市场。这个就是市场机制倒逼个人、企业和政府机构对数据采取诚信负责的态度,促使政府依法惩处数据造假、篡改数据等非法行为,最终从文化、习惯和日常行为上减少和杜绝各种数据欺诈行为。

大数据可靠性是所有国家面临的挑战,非中国特有。例如美国石油研究院及其游说团体,为了推动一个从加拿大阿尔伯塔到得克萨斯州的石油项目立项,刻意利用推特这个社交平台造势,造成好像几十万用户都一边倒地支持这个项目的印象,试图以此影响政府决策,结果最终被高人识破,露出马脚。证据就是很多“支持”来自临时注册的水军账户,这些“用户”平时在社交平台上不活跃,仅仅在短时间内使得“支持率”大幅度攀升。如果仅靠这种被刻意扭曲了的“社会舆情数据”来做政府决策显然不靠谱。好在在美国,由于类似做法的组织者(例如企业、机构等)要为此承担相应的法律责任(公开欺诈罪和误导罪),加之雇用大量水军人工成本太高,这种行为无论从法律还是经济的角度来看都不可能长久。

长久以来,政府机构、企业多方收集各种数据,以满足自身业务的需求,而这些数据往往淹没在该组织的内部系统里,大多时候并没有充分利用和管理起来,慢慢就形成了人为的数据割据与封锁。政府、企业对内没有进行数据挖掘工作,对外又拒绝数据分享,最终直接导致整个社会大数据重复储存,无法整合,利用率低下,或者无法共享专业大数据。

在美国,类似的问题也很突出。据麦肯锡全球研究院估计,以医疗管理行业为例,由于同样的病人数据同时储存于医院、诊所、保险公司等不同地方,在无法即时分享数据的情况下,同样的数据又经过不同机构的病人管理系统、承销系统、索赔管理系统、供应商系统等进行操作,仅此重复程序和管理造成的直接行政费用一年就高达1000亿到1500亿美元。

要使得全社会可以依法使用、分享储存于各种政府机构互不关联的公共数据,最终还是要靠法律和规章,包括申诉程序。要提高全社会现有大数据的利用率,需要政府和企业通力合作。对政府而言,可以马上做到的就是在保障国家安全和公民个人隐私的前提下,依法开放公共数据,进而通过推出以数据创新为基础的公共服务,向企业和社会个人销售数据产品。政府可以支持鼓励国有企业依法对公众出售其有商业价值的数据。对企业而言,可以通过合法的途径和方式获取、收集、购买数据产品,进行数据交易。最终市场机制使数据依法在全社会自由流动,创造出最大社会价值。
本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
64 0
|
4月前
|
人工智能 安全 大数据
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
喜报|瓴羊Dataphin入选上海市经信委2023创新攻关成果、IDC企业大数据治理研究代表产品
|
5月前
|
大数据
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇
|
11月前
|
分布式计算 DataWorks 关系型数据库
带你读《全链路数据治理-全域数据集成》之22:1. 背景信息
带你读《全链路数据治理-全域数据集成》之22:1. 背景信息
168 0
|
11月前
带你读《全链路数据治理-全域数据集成》之23:2. 使用限制
带你读《全链路数据治理-全域数据集成》之23:2. 使用限制
133 0
|
11月前
|
分布式计算 DataWorks 关系型数据库
带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源
带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源
157 0
|
11月前
|
SQL 分布式计算 DataWorks
带你读《全链路数据治理-全域数据集成》之25:4. 配置任务
带你读《全链路数据治理-全域数据集成》之25:4. 配置任务
199 1
|
11月前
|
运维 DataWorks 调度
带你读《全链路数据治理-全域数据集成》之26:5. 提交执行任务
带你读《全链路数据治理-全域数据集成》之26:5. 提交执行任务
165 0
|
11月前
|
存储 分布式计算 运维
带你读《全链路数据治理-全域数据集成》之32:1. 背景信息
带你读《全链路数据治理-全域数据集成》之32:1. 背景信息
155 0
|
11月前
|
分布式计算 DataWorks MaxCompute
带你读《全链路数据治理-全域数据集成》之33:2. 使用限制
带你读《全链路数据治理-全域数据集成》之33:2. 使用限制
121 0