公開數據要人人可讀 也要機器可讀

2019-04-12 數據公開 專題報道

文:IT狗

網址:https://aamacau.com/?p=53129

時間:2019年04月13日 16:16

香港公開數據包括了政府部門和私人企業的資料集

根據國際組織Linking Open Government 的搜尋計算顯示,2013年全球已有43個國家參與開放數據,一共開放了超過102萬個,涵蓋24種語言,而經由各國參與,也加速實現了更公開、透明以及創新應用的開放政府。

開放資料的目的是串聯不同部門、組織,甚至國家作資料互通,令應用更方便,分析更全面。例如台灣的政府資料開放平台(https://data.gov.tw),總資料集就超過4萬個,服務由縣市的交通事故資料(欄位包括:日期、時間、死傷、駕駛執照種類、路面狀態等等多項),到政府單位決算、縣市的不動產買賣實價(欄位包括:建築物型態、建築完成年月、建物現況格局——間隔、車位類別等多項)乃至每月藝文活動都有。

在香港,政府的「資料一資通」(https://data.gov.hk)除了政府部門提供的數據外,還包括了中原地產、中華電力的數據庫。數據分類亦由人口到城市管理、教育、工商業發展皆有。而且這些開放數據的網站都為資料提供了機器可讀的格式。

現時澳門的數據開放較以前有進步,例如政府開始了「澳門公共服務一戶通」的電話程式,以前要分別到幾個不同部門網頁查看的數據,現在用一個APP就可以查閱。但這樣的開放程度遠未足夠。10個不方便,澳門有8.5個,「閉門造車」的情況非常嚴重。

開放數據,除了人可以讀到,機器也要可以讀到,例如XML格式或較新的JSON格式,但現在不是。業界常批評,政府為何還如此落後,提供的是Excel,甚至是PDF。PDF是掃描文本而成,怎樣將它變成一些電腦可以處理的格式?又要重新輸入一次嗎?這不是Open Data(公開數據)。真正Open Data是一些可以機器讀到的數據;一個統一的格式,放在全世界任何地方都可以直接用到的,這才是真正的Open Data。

台灣的公開數據資料集有逾4萬個

數據的品質在於你得到文件檔後,需要幾多額外加工才可將它變成可以做下一步的材料。最好當然是一拖,一按「輸入」就完成,一個字都不用重新輸入。以今時今日澳門的能力,開放數據非不能也,實不為也。政府做這麼多監察,一定要所謂的「大數據」,就是要整合各部門的資訊,巨細無遺,每個街道角落的攝錄乃至記數系統,甚麼都要有。掌握越多,數據收集越多,畫面才夠大,才叫「大數據」。以前澳門不行,現在肯定可以。而現時澳門數據開放落後,部分原因是政府不重視開放數據的重要。市民知得多、知得少又如何?可以左右政府嗎?這就關乎政府對市民知情權的重視程度有多高。

公開數據後,每一個人在民間都可以用利用這些資訊做不同的研究,就連中學生也可以編寫程式,了解社會。例如政府曾說要「智慧交通」,通過收集巴士、的士及穿梭巴士的實時行駛GPS數據,透過大數據分析得出不同道路的擠塞指數。公眾掌握這些有用嗎?有的,例如大家可否用這些數據做教學。中學生也可以在電腦課寫程式,統計哪條馬路最繁忙,推算出一條理想的出行路徑。民間也可以做出較多比較美觀的資訊圖表,即可以百花齊放。新聞從業員亦可以用這方法去說多些故事。

這些就是Open Data,公開數據,不只是所謂的高層決策者公開,就連中學生都可以寫一些程式,大家一起參與解決這些問題。

不開放,又如何?事實是,這方向是大氣候。新一代,特別是現在的學生做功課不再只是紙上談兵,實作的比較多。開放數據有助市民參與政策的制訂,對關心城市的發展很有幫助。當然,再深一層就是有助監察。

對政府施政有幫助嗎?就看政府是否重視這些民間做出來的成果。現時政府向前走了第一步,但但還要向真正的Open Data作出努力。

訂閱每月紙本

台灣政府的公開數據有多項選擇