开放数据指数2014发布

简介:

开放数据指数2014发布:英国继续领导世界各国数据开放,台湾成亚洲数据最开放地区


从开放数据指数看世界开放数据的趋势,以及中国开放数据

何为开放数据?

开放数据运动自2009年美国奥巴马政府执政以来已经席卷了全球各国,无论是发达国家如美国、英国,还是发展中国家如肯尼亚、哥伦比亚都已经在努力开放政府乃至企业的数据来实现数据的经济和社会价值。所谓开放数据,其指的是可以通过公共渠道免费访问获得的,不受版权、知识产权都限制而可以自由使用、价值、重发布的数据。按照英国开放知识基金会的「开放知识定义」(http://opendefinition.org/od/1.1/zh/),开放数据可以简单概括成以下四点:

1)电子化可下载

2)免费且公开可获得

3)开放格式且机器可读(即需要csv这样机器可自动处理的数据格式,而非PDF)

4)开放授权,即任何人为了任何目的可以自由使用、价值和重发布开放的数据。


既然开放数据在国际上如此流行,那么我们如何知道哪个国家在开放数据上做的更好呢?开放数据指数(index.okfn.org)就能给出一个答案。

0


开放数据指数

0


开放数据指数(index.okfn.org)是一项由英国开放知识基金会组织的,通过社区众包方式并结合同行评议和专家评审展开的关于世界各国家与地区10个关键数据集开放性的调研项目。对于每个国家或地区,开放数据指数考察了其是否将10个关键数据集,比如国家1:25万地图数据、国家公共交通时刻表数据、国家项目级支出数据等,发布在了电子化、免费、机器可读、开放授权的条件下。开放数据指数的目的在于为每一个关键数据集设立下数据的采集和发布标准,推动各国家地区能够采用此标准开放数据,从而使得社会组织、企业等能够真正挖掘出这些数据的潜能。


自2013年发布了第一期开放数据指数以来,开放数据指数已经被不同国家政府(例如俄罗斯)采用作为考评开放数据项目绩效的KPI。 开放数据指数所设定的数据发布标准也成为了各社会组织、科研机构用于推动政府进一步完善数据采集、发布、开放的重要工具。


在2014年,开放数据指数的调研涵盖了更多的国家,从2013年的70个国家增长至了97个国家,包含了大量之前未曾调研的拉丁美洲和非洲国家。这当中不乏令人惊喜的结果


,比如哥伦比亚第一次参加评议就一鸣惊人,排至第12位。


较之13年的结果,法国是当之无愧进步最大的国家。其在2013年的评选中仅排名至12位,而经过一年的努力,先是建立和社会组织的对话机制,再到今年年中作为设立欧洲第一个国家首席数据官,其最终在2014年的评议中升至第3位。同样令人瞩目的进步也在亚洲发生,台湾地区在2013年的评议中仅为36位,而在2014年台湾地区已经升至11位,这一成绩与台湾政府本身对开放数据的重视,开放数据联盟对产业的推动,以及民间团体例如codefortomorrow,g0v等积极开展民间-政府对话与协作等密不可分。

0

然则,即使有诸多进步,但宏观来看,世界各国和地区仍待进一步开放更多的关键数据集。目前统计所有970个被检视的数据集,仅有11%是真正开放的,这条开放数据的道路还有诸多需要破除的绊脚石。


中国开放数据

0 对于中国而言,中央政府至今还未推出相应的开放数据政策,而与开放数据相关联的数据所有权界定、数据授权、个人隐私保护法等议题也都尚在讨论中。较之2013年,中国在10个关键数据集的开放上并未有进步,也因此当大量新国家加入开放数据指数,以及若干国家有了大幅进步以后,中国的排名从2013年的36名下滑至了57名。


而细致的来看10个关键数据集的开放情况,中国目前公开可访问到的有7项(除了1:25万国家地图数据,全民普选数据,国家项目级支出数据),而集中的问题在于,这些数据仅为公开,却尚未达到开放的标准。这也就意味着,这些数据常常不能下载且只能通过网页或者网络应用来访问,且数据往往受版权保护而无开放授权。比如,国家公共交通时刻表考察了中国国家运营的铁路时刻表,这一项数据目前官方发布渠道中,仅在12306网站提供了时刻查询系统,但无法直接下载相应的数据,这就决定了该项数据只能算是公开而非开放,故而只有45%的开放性。同样,环境数据例如Pm2.5数据虽然大量公开,但都仅提供在网页格式下,无法直接下载数据,也无法访问到历史数据,故而也不能算作开放。


而这里要特别指出的是,对于1:25万国家地图数据,其因为目前对于电子地图的保密规定是不公开的(可参考http://bkb.ynet.com/3.1/1104/04/5851254.html 以及 《测绘管理工作国家秘密范围的规定》),而纵观97个国家地区,目前仅32个国家地区不提供公开的1:25万国家地图,这也不禁让人思考是否保密过严了?


当然,中国国家层面虽然进展不大,但是中国各地方省市区各级政府都在逐步实验开放政府数据,比如上海的[开放数据平台])(http://www.datashanghai.gov.cn)就在2012年上线,且根据其2014年工作计划,上海将在之后发布更多有价值的数据集,例如医院空床位数量,急诊人数,公路实时交通信息等。 而佛山市的南海区也走在开放数据的前列,在今年设立了数据统筹局之后69天内便上线了他们的「数说南海」平台,且设立了数据治理委员会专门破除数据开放的官僚阻碍,还将在之后和社会组织、企业进一步互动,加强数据的利用和开发。



开放数据指数2014显示全球各国和地区政府开放关键数据集的进展缓慢

开放知识基金会发布的开放数据指数追踪全球各国开放数据的状态 开放知识基金会今日发布了其2014年度的开放数据指数。这项调查显示,虽然全球各国开放数据都有了一定的进步,但是大多数政府仍旧未能将关键的信息提供在市民和企业可访问的格式下。 开放知识基金会的创始人和主席 Rufus Pollock 评论道:


开放政府数据能够促进公民社会的建设,政府公信力的增强,创新产业的发展。它使得市民得以了解并施行他们的权利,并为社会各界带来益处:无论是交通领域,还是教育领域,又或是医疗领域。在过去几年里,虽然政府对开放数据的支持日益增长,但开放数据指数却显示真正的进展却远低于预期。


开放数据指数通过评估各国10个关键数据集,例如政府项目级支出数据、国家公共交通时刻表、环境污染指数等的可获取性和可访问性来进行国家级开放数据项目绩效排序。 2014年,英国再摘开放数据指数的桂冠,总体开放性达到了96%,而紧随其后的则是丹麦以及去年排名才12位而今年已到第3位的法国。第4位的是芬兰,而第5位则由澳大利亚和新西兰共享。今年的指数结果里最令人振奋的有去年排名27而今年进步到第10位的印度,以及共同占据第12位的拉丁美洲的哥伦比亚和乌拉圭。 塞拉利昂,马里共和国,海地以及几内亚在今年的开放数据指数中垫底,但需要指出的,还有更多比这些政府在数据开放性上更糟糕的,这里没有包含他们主要是因为没有足够的公开数据以供评估以及当地没有足够的志愿者来完成相应的评估。 整体而言,虽然开放的关键数据集整体数量有所上升(从87到104),但开放数据集占整体的比例仍旧很低,仅为11%。 即使对于那些在开放数据项目上的领头国家,也有大量的提升空间:比如对于美国和德国,他们就没有提供整合的、开放的企业注册数据库。而政府项目级支出的数据开放性也让人大失所望,大多数国家要么完全没有提供此类信息,又或者仅提供了有限的信息。在97个国家中,仅有英国和希腊两个国家提供了完全开放的政府项目级支出数据。在目前各国经济增长仍旧缓慢甚至艰巨的时期,提供市民和企业免费开放的数据意味着我们能够更高效的开源节流,以及提高政府效能。 Pollock 说道:

为了真正实现开放数据的价值,政府不应仅仅将数据表格放到网上,而需要做更多的工作。这些数据应当能够被人轻易找到和理解,也应当能够被自由、免费使用、加值、重发布,而不限制其身份、地点和目的。


原文发布时间为:2014-12-12

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
3月前
|
NoSQL 算法 大数据
国内首个图计算标准发布,悦数图数据库通过测试
近日,经中国通信标准化协会批准,《大数据图计算平台技术要求与测试方法》标准正式发布,这是我国首个图计算平台标准,为图计算平台的发展提供了一个标准化的指导方针,对于推动我国图技术的发展具有重要意义。
|
8月前
|
存储 自然语言处理 安全
用户增长实战-商业模型
有路必有福,有路必有胜。
80 0
|
9月前
|
人工智能 数据可视化 JavaScript
基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数
基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数
基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数
|
人工智能
7-118 估值一亿的AI核心代码 (20 分)
7-118 估值一亿的AI核心代码 (20 分)
117 0
7-118 估值一亿的AI核心代码 (20 分)
|
11月前
|
自然语言处理 搜索推荐 API
160亿参数,新增多项能力,复旦MOSS开源了
160亿参数,新增多项能力,复旦MOSS开源了
|
11月前
|
数据可视化
「产品战略管理 」产品策略工具 - BCG增长 - 共享矩阵
「产品战略管理 」产品策略工具 - BCG增长 - 共享矩阵
|
11月前
|
网络协议 Cloud Native Linux
|
人工智能
L1-064 估值一亿的AI核心代码 (20 分)
L1-064 估值一亿的AI核心代码 (20 分)
335 0
L1-064 估值一亿的AI核心代码 (20 分)
|
边缘计算 Cloud Native 安全
欧拉首个数字基础设施全场景长周期版本将于4月15日发布,深度解读新特性
欧拉首个数字基础设施全场景长周期版本将于4月15日发布,深度解读新特性
103 0
欧拉首个数字基础设施全场景长周期版本将于4月15日发布,深度解读新特性
|
大数据
采用高级分析策略的多数企业收入增长超过15%
采用高级分析策略的多数企业收入增长超过15%