ISE18/15-16
何谓开放资料?
- 目前,开放资料并无统一的定义。举例而言,data.gov.uk7注释符号代表data.gov.uk是英国政府推行的政策项目,目的是以开放资料形式发放非个人的政府资料。 将开放资料界定为"以开放格式发表、机器可读,并按特许授权条款被自由再用的资料"。而根据Open Definition8注释符号代表Open Definition由开放知识基金会于2005年创立。开放知识基金会是全球化的非牟利网络,旨在推广开放资料(包括內容及数据)。,开放资料则是"能被任何人自由使用、再用及转发的资料 - 最多只受来源标示(attribute)及以相同方式分享(sharealike)的约束"。9注释符号代表一般而言,来源标示是指资料使用者必须标明原创资料的发表者,而以相同方式分享则是指资料使用者必须按与原资料相同的条款,就其新创作给予特许。 根据世界银行的定义,符合下述条件的则属开放资料:(a)资料以机器可读的标准格式发放,并(b)有明确的特许授权条款,资料可不受限制地作商业性质及非商业性质的使用和再用。
- 开放资料虽沒有统一的定义,但优质的开放资料集一般具备以下5项特点:
(a) | 可得性 - 不同种类的使用者均可取得资料;
|
(b) | 费用 - 使用者应可免费取用资料,或缴付不多于合理 水平的复制费用以取用资料;
|
(c) | 机器可读性 - 资料必须以机器可读的格式发放,例如CSV、JSON、XML等电脑可处理及分析的格式;
|
(d) | 权限 - 在资料的使用、重制及分发上的限制极少;及
|
(e) | 可互通性 - 资料必须可与其他资料互联互通,以发展出更多及更好的产品和服务。
|
- 开放资料的范围和来源各不相同。开放资料的范围可以涵盖有关本地、区域及国际的资料,而来源亦可由商业及政府机构提供。不少机构为营运需要而收集各类的资料,而政府亦从日常运作收集资料,但无论在数量和范畴方面均更具规模。
- 开放资料与大数据虽有一定程度的关系,但两者分属两个截然不同的概念。近年资讯科技发展迅速,互联网的应用更见普及,因此产生了前所未有的大量数据。这些经由社会活动产生、并由商业及政府机构收集的庞大原始数据,称为"大数据"。大数据通常从3方面界定,称为3Vs:即(a)volume(数量)(大量的数据)、(b)variety(种类)(数据来源及格式多样化)及(c)velocity(速度)(以实时或近乎实时方式产生和分析数据)。
- 综上所述,"大数据"是指数量庞大、种类多元和适时的资料集,而开放资料则是公开给公众的资料集,开放的程度根据上文所述的5项特点而判定。此外,大数据涉及处理数量庞大的资料集,以分析数据之间的模式及关系。而开放资料则涉及提供机器可读的资料,而该等资料是市民、企业及机构可在不受限制或最少限制的情况下使用、再用或分发。
开放资料的效益
- 应用开放资料是近年出现的发展,源起于英美在2000年代末推行开放资料的措施。10注释符号代表美国总统奧巴马于2009年1月就职首天签署《透明度及开放政府备忘录》(Memorandum on Transparency and Open Government)。奧巴马在该备忘录中承诺,其领导的政府将上下一心确保取得公众的信任,并建立具透明度、公众参与及多方合作的制度。其后,美国于2009年5月推出政府开放数据入门网站Data.gov,涵盖共47个资料集。在此期间,英国亦有积极开放资料,首相卡梅伦于2010年推出政府开放数据入门网站data.gov.uk。 近年,开放资料的重要性及引起的关注有增无减,现时已有超过70个国家将资料开放。11注释符号代表请参阅Economist (2015)。 促进开放资料发展的主因之一是科技的进步,例如记忆储存装置价格下降,以及数码世界的资料量急速膨胀。数据为本的分析及决策受到高度重视,亦推动开放资料的迅速发展。
- 广泛使用开放资料,应为政府、市民和机构带来多方面的好处。举例而言,政府将公共资料以开放资料形式发放,可确保其施政(包括使用公帑的情况)的透明度,因而有助减少资源浪费,及提高政府的问责性。发放更多开放资料,亦可让市民加深了解政府的运作,从而增加市民对政府的信任,并促进公众的社会参与。
- 此外,以开放资料形式发放公共资料可鼓励创新,有助改善政府的服务效率。例如英国有科技人员与医生合作,利用开放资料揭露受公帑资助的国民保健署(National Health Service)用于处方药物的开支过大的问题。12注释符号代表请参阅Prescribing Analytics (2016)。 在2012年进行的调查,分析了英格兰(England)家庭医生开出他汀类降胆固醇药物的书面处方,以及英格兰內各地使用该药物的情况,发现在处方较昂贵的品牌药物和较廉宜(但疗效相同)的仿制药方面差异甚大。上述调查估计如果每名医生均处方同样有效的仿制药,国民保健署或可节省超过2亿英镑(25亿港元)的药物开支。
- 开放资料亦可为消费者和商业机构带来正面的经济影响。根据麦肯锡全球研究院于2013年进行的一项调查,使用开放资料可惠及全球的医护、交通运输、消费产品、私人财务、教育、石油及燃气,以及电力等7个行业,合共的经济效益每年超过3万亿美元(23万3,000亿港元)。麦肯锡报告亦指出使用开放资料如何为公营及私营领域带来裨益,其中包括:
(a) | 医护 - 让服务提供者对病人作出最适时和最适合的治疗,并确保护理工作合乎成本效益;
|
(b) | 交通运输 - 市民可利用开放资料,选择交通公具和乘搭时间,从而节省交通时间;
|
(c) | 消费产品 - (i)藉着利用有关社交媒体或社区人口的开放资料,帮助制造商及零售商更具针对性地向消费者进行市场推广及销售,以及(ii)帮助消费者作出更明智的消费决定,因他们可藉开放资料了解产品的价格及其他资料(例如包装食品的产地来源);
|
(d) | 私人财务 - 由第三者提供数据,让金融服务消费者了解按揭、退休计划、信用卡及其他金融产品的最新收费;
|
(e) | 教育 - 利用学生个人学业成绩及学习方式的数据,特定设计适合他们的能力及学习兴趣的课程,从而改善教学的质素;
|
(f) | 石油及燃气 - 企业可利用公开的地质数据及油气存量估算,在选择勘探开发新能源的位置和兴建炼油设施的地点时作出更明智的决定;及
|
(g) | 电力 - 使用开放资料有助住戶及工商业用戶在购买电器产品/设备及选用电力供应商时,加以比较,作出明智的选择。
|
海外经验
- 开放资料所带来的潜在效益,促使不少政府仿效英美逐步开放公共资料。2015年全球开放资料指数对122个地方进行调查,按13项数据将它们排名,台湾和英国分别位列前一、二名。13注释符号代表英国在2013至2014年间名列第一,但其位置在2015年被台湾取代。
- 台湾于2013年建设完成具备互动功能的政府资料入门网站,使用者可在网站建议政府开放尚未公开的资料集,并可讨论已开放资料的应用事宜。更重要的是,台湾设立了正式咨询机制,所有政府部级机关均特别设置政府资料开放咨询小组,作为政府与民间之间的沟通管道。咨询小组的成员包括政府人员和工商业协会、社会团体及学术界的代表。
- 与此同时,英国制订了一套清晰的标准,即"公共资料原则"(Public Data Principles),供各公营机构在发放公共资料集时采用。这套原则不仅列明发放的公共资料须易于取用,同时须确保资料适时发表。此外,为鼓励资料再用,"公共资料原则"亦规定资料须以易于使用的格式提供,并按照划一的开放政府授权条款14注释符号代表开放政府授权条款是一套简明的条款及条件,公营机构的资料提供者根据这些条款及条件,授权使用及再用资料,并对此设定很少的限制。开放政府授权条款不需使用者注册或申请,他们只须确保遵守 相关的条款及条件使用资料便可。 (Open Government Licence)发放。
- 在英国,data.gov.uk上的资料集均附有"开放度评级",简明地显示该资料集的开放度。评级准则以"开放度五星制"(Five Stars of Openness)为基础,一星代表开放资料的开放度最低,五星则代表开放度最高。15注释符号代表"开放度五星制"由万维网发明人Tim Berners-Lee设立。最低为一星(单纯以任何方式,以开放特许在网上发放资料),最高为五星(资料集与网上其他现存资料集互联互通)。 据data.gov.uk表示,"开放度五星制"旨在提升资料质素,目标是使更多政府开放资料集达到五星评级。
结语
- 开放资料的价值来自资料是否被广泛应用。因此,开放资料必须以使用者为中心,切合他们的利益和要求。咨询资料使用者的意见是决定何类资料应予发放的有效方法。台湾的开放资料政策十分重视社区参与,其特色是在政府入门网站设有特定的互动功能,以及就开放资料成立正式咨询机制,以促进政府资料提供者与资料使用者之间的积极对话。
- 除推动社区积极参与外,确保开放优质的资料集,使资料获得最充分利用,亦相当重要。在英国,政府设立了data.gov.uk,作为获取公共资料的统一平台,并将各个资料集纳入其中。16注释符号代表据Professor Nigel Shadbolt表示,"对data.gov.uk而言,仅设立统一平台,并将各个资料集纳入其中,这样并不足够。" Shadbolt是英国政府公营机构透明度委员会成员,该委员会由首相设立,目的是推进公开政府的政策。请参阅Shadbolt (2011)。 除此以外,英国政府还制订发放公共资料的原则,规定"甚么"(what)公共资料应在网上发表,以及"如何"(how)发表,并设定了简明的"开放度五星制",以评审资料的开放及可再用程度。
立法会秘书处
资讯服务部
资料研究组
刘奕君
2016年5月20日
附注:
1. | 开放资料对建设智能城市尤为重要。关于智能城市的论述,请参阅资料研究组于2015年3月以"何谓智能城市?"为题所发表的《资讯述要》。
|
2. | 资科办于2004年7月1日成立,负责统领政府內外资讯科技的发展。
|
3. | 资科办于2011年推出一项为期18个月的试验计划,发放公共设施的地理参考数据和实时交通资讯,供市民免费下载及增值再用。相关资料是透过名为"资料一线通"(Data.One)的入门网站提供。
|
4. | 经革新的网站提供强化的搜寻能力及新增功能,例如用戶可直接在入门网站上将数据制作成各类图表,甚至在地图上显示有关数据。
|
5. | 全球开放资料指数每年由开放知识基金会(Open Knowledge Foundation)计算,以评量全球各地政府开放资料的状况。排名取决于13项数据的可得性(availability)和可读性(accessibility),其中包括政府统计数字、政府财政预算、法例、政府开支、选举结果及采购合约竞投等数据。
|
6. | 台湾在2015全球开放资料指数的排名,较2013年的第36和2014年的第11位为高。
|
7. | data.gov.uk是英国政府推行的政策项目,目的是以开放资料形式发放非个人的政府资料。
|
8. | Open Definition由开放知识基金会于2005年创立。开放知识基金会是全球化的非牟利网络,旨在推广开放资料(包括內容及数据)。
|
9. | 一般而言,来源标示是指资料使用者必须标明原创资料的发表者,而以相同方式分享则是指资料使用者必须按与原资料相同的条款,就其新创作给予特许。
|
10. | 美国总统奧巴马于2009年1月就职首天签署《透明度及开放政府备忘录》(Memorandum on Transparency and Open Government)。奧巴马在该备忘录中承诺,其领导的政府将上下一心确保取得公众的信任,并建立具透明度、公众参与及多方合作的制度。其后,美国于2009年5月推出政府开放数据入门网站Data.gov,涵盖共47个资料集。在此期间,英国亦有积极开放资料,首相卡梅伦于2010年推出政府开放数据入门网站data.gov.uk。
|
11. | 请参阅Economist (2015)。
|
12. | 请参阅Prescribing Analytics (2016)。
|
13. | 英国在2013至2014年间名列第一,但其位置在2015年被台湾取代。
|
14. | 开放政府授权条款是一套简明的条款及条件,公营机构的资料提供者根据这些条款及条件,授权使用及再用资料,并对此设定很少的限制。开放政府授权条款不需使用者注册或申请,他们只须确保遵守 相关的条款及条件使用资料便可。
|
15. | "开放度五星制"由万维网发明人Tim Berners-Lee设立。最低为一星(单纯以任何方式,以开放特许在网上发放资料),最高为五星(资料集与网上其他现存资料集互联互通)。
|
16. | 据Professor Nigel Shadbolt表示,"对data.gov.uk而言,仅设立统一平台,并将各个资料集纳入其中,这样并不足够。" Shadbolt是英国政府公营机构透明度委员会成员,该委员会由首相设立,目的是推进公开政府的政策。请参阅Shadbolt (2011)。
|
参考资料:
1. | Advisory Panel on Public Sector Information. (2014) What is the Value of Open Data?
|
2. | Capgemini Consulting. (2013) The Open Data Economy Unlocking Economic Value by Opening Government and Public Data.
|
3. | Economist. (2015) Open government data - out of the box.
|
4. | European Commission. (2015) Creating Value through Open Data.
|
5. | Gurin, J. (2014) Open Data Now.
|
6. | McKinsey & Company. (2013) Open data: Unlocking innovation and performance with liquid information.
|
7. | OECD. (2015) Assessing government initiatives on public sector information.
|
8. | Open Data Hong Kong. (2015) Comment on the revamped Data.Gov.HK site.
|
9. | Open Knowledge. (2015) Global Open Data Index.
|
10. | Open Knowledge. (2016) Open Data Handbook.
|
11. | Shadbolt, N. (2011) Open for Business.
|
12. | The World Bank Group. (2016) Open Data Essentials.
|
13. | Prescribing Analytics (2016).
|
14. | W3C. (2016) Data on the Web Best Practices.
|