ISE18/15-16

主題: 資訊科技及廣播、電子政府


何謂開放資料?

  • 目前,開放資料並無統一的定義。舉例而言,data.gov.uk7註釋符號代表data.gov.uk是英國政府推行的政策項目,目的是以開放資料形式發放非個人的政府資料。 將開放資料界定為"以開放格式發表、機器可讀,並按特許授權條款被自由再用的資料"。而根據Open Definition8註釋符號代表Open Definition由開放知識基金會於2005年創立。開放知識基金會是全球化的非牟利網絡,旨在推廣開放資料(包括內容及數據)。,開放資料則是"能被任何人自由使用、再用及轉發的資料 - 最多只受來源標示(attribute)及以相同方式分享(sharealike)的約束"。9註釋符號代表一般而言,來源標示是指資料使用者必須標明原創資料的發表者,而以相同方式分享則是指資料使用者必須按與原資料相同的條款,就其新創作給予特許。 根據世界銀行的定義,符合下述條件的則屬開放資料:(a)資料以機器可讀的標準格式發放,並(b)有明確的特許授權條款,資料可不受限制地作商業性質及非商業性質的使用和再用。
  • 開放資料雖沒有統一的定義,但優質的開放資料集一般具備以下5項特點:

    (a)可得性 - 不同種類的使用者均可取得資料;

    (b)費用 - 使用者應可免費取用資料,或繳付不多於合理 水平的複製費用以取用資料;

    (c)機器可讀性 - 資料必須以機器可讀的格式發放,例如CSV、JSON、XML等電腦可處理及分析的格式;

    (d)權限 - 在資料的使用、重製及分發上的限制極少;及

    (e)可互通性 - 資料必須可與其他資料互聯互通,以發展出更多及更好的產品和服務。
  • 開放資料的範圍和來源各不相同。開放資料的範圍可以涵蓋有關本地、區域及國際的資料,而來源亦可由商業及政府機構提供。不少機構為營運需要而收集各類的資料,而政府亦從日常運作收集資料,但無論在數量和範疇方面均更具規模。
  • 開放資料與大數據雖有一定程度的關係,但兩者分屬兩個截然不同的概念。近年資訊科技發展迅速,互聯網的應用更見普及,因此產生了前所未有的大量數據。這些經由社會活動產生、並由商業及政府機構收集的龐大原始數據,稱為"大數據"。大數據通常從3方面界定,稱為3Vs:即(a)volume(數量)(大量的數據)、(b)variety(種類)(數據來源及格式多樣化)及(c)velocity(速度)(以實時或近乎實時方式產生和分析數據)。
  • 綜上所述,"大數據"是指數量龐大、種類多元和適時的資料集,而開放資料則是公開給公眾的資料集,開放的程度根據上文所述的5項特點而判定。此外,大數據涉及處理數量龐大的資料集,以分析數據之間的模式及關係。而開放資料則涉及提供機器可讀的資料,而該等資料是市民、企業及機構可在不受限制或最少限制的情況下使用、再用或分發。

開放資料的效益

  • 應用開放資料是近年出現的發展,源起於英美在2000年代末推行開放資料的措施。10註釋符號代表美國總統奧巴馬於2009年1月就職首天簽署《透明度及開放政府備忘錄》(Memorandum on Transparency and Open Government)。奧巴馬在該備忘錄中承諾,其領導的政府將上下一心確保取得公眾的信任,並建立具透明度、公眾參與及多方合作的制度。其後,美國於2009年5月推出政府開放數據入門網站Data.gov,涵蓋共47個資料集。在此期間,英國亦有積極開放資料,首相卡梅倫於2010年推出政府開放數據入門網站data.gov.uk。 近年,開放資料的重要性及引起的關注有增無減,現時已有超過70個國家將資料開放。11註釋符號代表請參閱Economist (2015)。 促進開放資料發展的主因之一是科技的進步,例如記憶儲存裝置價格下降,以及數碼世界的資料量急速膨脹。數據為本的分析及決策受到高度重視,亦推動開放資料的迅速發展。
  • 廣泛使用開放資料,應為政府、市民和機構帶來多方面的好處。舉例而言,政府將公共資料以開放資料形式發放,可確保其施政(包括使用公帑的情況)的透明度,因而有助減少資源浪費,及提高政府的問責性。發放更多開放資料,亦可讓市民加深了解政府的運作,從而增加市民對政府的信任,並促進公眾的社會參與。
  • 此外,以開放資料形式發放公共資料可鼓勵創新,有助改善政府的服務效率。例如英國有科技人員與醫生合作,利用開放資料揭露受公帑資助的國民保健署(National Health Service)用於處方藥物的開支過大的問題。12註釋符號代表請參閱Prescribing Analytics (2016)。 在2012年進行的調查,分析了英格蘭(England)家庭醫生開出他汀類降膽固醇藥物的書面處方,以及英格蘭內各地使用該藥物的情況,發現在處方較昂貴的品牌藥物和較廉宜(但療效相同)的仿製藥方面差異甚大。上述調查估計如果每名醫生均處方同樣有效的仿製藥,國民保健署或可節省超過2億英鎊(25億港元)的藥物開支。
  • 開放資料亦可為消費者和商業機構帶來正面的經濟影響。根據麥肯錫全球研究院於2013年進行的一項調查,使用開放資料可惠及全球的醫護、交通運輸、消費產品、私人財務、教育、石油及燃氣,以及電力等7個行業,合共的經濟效益每年超過3萬億美元(23萬3,000億港元)。麥肯錫報告亦指出使用開放資料如何為公營及私營領域帶來裨益,其中包括:

    (a)醫護 - 讓服務提供者對病人作出最適時和最適合的治療,並確保護理工作合乎成本效益;

    (b)交通運輸 - 市民可利用開放資料,選擇交通公具和乘搭時間,從而節省交通時間;

    (c)消費產品 - (i)藉着利用有關社交媒體或社區人口的開放資料,幫助製造商及零售商更具針對性地向消費者進行市場推廣及銷售,以及(ii)幫助消費者作出更明智的消費決定,因他們可藉開放資料瞭解產品的價格及其他資料(例如包裝食品的產地來源);

    (d)私人財務 - 由第三者提供數據,讓金融服務消費者了解按揭、退休計劃、信用卡及其他金融產品的最新收費;

    (e)教育 - 利用學生個人學業成績及學習方式的數據,特定設計適合他們的能力及學習興趣的課程,從而改善教學的質素;

    (f)石油及燃氣 - 企業可利用公開的地質數據及油氣存量估算,在選擇勘探開發新能源的位置和興建煉油設施的地點時作出更明智的決定;及

    (g)電力 - 使用開放資料有助住戶及工商業用戶在購買電器產品/設備及選用電力供應商時,加以比較,作出明智的選擇。

海外經驗

結語


立法會秘書處
資訊服務部
資料研究組
劉奕君
2016年5月20日


附註:

1.開放資料對建設智能城市尤為重要。關於智能城市的論述,請參閱資料研究組於2015年3月以"何謂智能城市?"為題所發表的《資訊述要》。

2.資科辦於2004年7月1日成立,負責統領政府內外資訊科技的發展。

3.資科辦於2011年推出一項為期18個月的試驗計劃,發放公共設施的地理參考數據和實時交通資訊,供市民免費下載及增值再用。相關資料是透過名為"資料一線通"(Data.One)的入門網站提供。

4.經革新的網站提供強化的搜尋能力及新增功能,例如用戶可直接在入門網站上將數據製作成各類圖表,甚至在地圖上顯示有關數據。

5.全球開放資料指數每年由開放知識基金會(Open Knowledge Foundation)計算,以評量全球各地政府開放資料的狀況。排名取決於13項數據的可得性(availability)和可讀性(accessibility),其中包括政府統計數字、政府財政預算、法例、政府開支、選舉結果及採購合約競投等數據。

6.台灣在2015全球開放資料指數的排名,較2013年的第36和2014年的第11位為高。

7.data.gov.uk是英國政府推行的政策項目,目的是以開放資料形式發放非個人的政府資料。

8.Open Definition由開放知識基金會於2005年創立。開放知識基金會是全球化的非牟利網絡,旨在推廣開放資料(包括內容及數據)。

9.一般而言,來源標示是指資料使用者必須標明原創資料的發表者,而以相同方式分享則是指資料使用者必須按與原資料相同的條款,就其新創作給予特許。

10.美國總統奧巴馬於2009年1月就職首天簽署《透明度及開放政府備忘錄》(Memorandum on Transparency and Open Government)。奧巴馬在該備忘錄中承諾,其領導的政府將上下一心確保取得公眾的信任,並建立具透明度、公眾參與及多方合作的制度。其後,美國於2009年5月推出政府開放數據入門網站Data.gov,涵蓋共47個資料集。在此期間,英國亦有積極開放資料,首相卡梅倫於2010年推出政府開放數據入門網站data.gov.uk。

11.請參閱Economist (2015)。

12.請參閱Prescribing Analytics (2016)。

13.英國在2013至2014年間名列第一,但其位置在2015年被台灣取代。 

14.開放政府授權條款是一套簡明的條款及條件,公營機構的資料提供者根據這些條款及條件,授權使用及再用資料,並對此設定很少的限制。開放政府授權條款不需使用者註冊或申請,他們只須確保遵守 相關的條款及條件使用資料便可。

15."開放度五星制"由萬維網發明人Tim Berners-Lee設立。最低為一星(單純以任何方式,以開放特許在網上發放資料),最高為五星(資料集與網上其他現存資料集互聯互通)。

16.據Professor Nigel Shadbolt表示,"對data.gov.uk而言,僅設立統一平台,並將各個資料集納入其中,這樣並不足夠。" Shadbolt是英國政府公營機構透明度委員會成員,該委員會由首相設立,目的是推進公開政府的政策。請參閱Shadbolt (2011)。


參考資料:

1.Advisory Panel on Public Sector Information. (2014) What is the Value of Open Data?

2.Capgemini Consulting. (2013) The Open Data Economy Unlocking Economic Value by Opening Government and Public Data.

3.Economist. (2015) Open government data - out of the box.

4.European Commission. (2015) Creating Value through Open Data.

5.Gurin, J. (2014) Open Data Now.

6.McKinsey & Company. (2013) Open data: Unlocking innovation and performance with liquid information.

7.OECD. (2015) Assessing government initiatives on public sector information.

8.Open Data Hong Kong. (2015) Comment on the revamped Data.Gov.HK site.

9.Open Knowledge. (2015) Global Open Data Index.

10.Open Knowledge. (2016) Open Data Handbook.

11.Shadbolt, N. (2011) Open for Business.

12.The World Bank Group. (2016) Open Data Essentials.

13.Prescribing Analytics (2016).

14.W3C. (2016) Data on the Web Best Practices.