数据开放 @ 台湾

写在台湾2016大选投票之际

Posted on: 2016-01-16 Last edited: 2017-09-06
语言:

去年 (2015年) 底,台湾在英国开放知识基金会的全球开放数据指数 (Open Data Index) 上超过英国,成为全球数据开放指数第一的地区。

共有122个地区的指数,其中英国第2,美国第8,新加坡第23,香港第37,中国第97。详见:http://index.okfn.org/place/

评分标准涵盖了国家统计、政府预算、法律、选举、土地、环保等多方面的数据。除了要“有数据”之外,数据是否及时更新、是否免费开放、是否机器可读,都很重要。

data.gov.tw
台湾政府开放数据平台

我们就来看看 Number One 的台湾,数据开放对社会到底有什么影响。

政府开放数据 民间处理数据

之前提到,开放数据一个重要指标是机器可读。也就是提供结构化的数据,便于用程序处理数据和展示数据。常见的是XML或者JSON格式,也有以CSV或者Excel格式的。有了机器可读的格式,数据的使用方无需再费大量精力重新录入数据;有新数据时,也能以程序处理。

 

政府提供的只是数据,该怎么展现和利用,就是民间智慧。台湾民间有不少团队,将数据制成交互式的网页。数据看台湾就是一例。

我們是一群來自擁有資訊專長背景的資料愛好者,剛好現在是提倡資料開放的時代,因此希望可以透過編寫程式碼的方式,來貢獻自身的能力。

http://taiwanstat-about-us.cannerapp.com/

数据看台湾做的主要是视觉化的工作。除了登革热,还有空气质量、紫外线、降雨量、水质的实时情况。

Taiwanstat
数据看台湾 - 台南登革热恢复情况

 

Taiwanstat
数据看台湾 - 水库即时水情

政府未公开资料 民间来整理

即便台湾是开放数据榜首,还是很多资料,十分有用,但政府没有整理或公开,或者公开的形式不利于大众利用。比如,议员在立法院中的立场,虽有会议流程记录和视频,但是却不是一个简单的表格。这个时候,就要靠民间的力量去整理。

零时政府 g0v.tw

gov不收錄   g0v來收錄

gov沒資料   g0v建資料

零时政府做的就是这个。在他们的立委投票指南中,列明了各个立法委员曾经在不同社会议题上的取态。之前说过,立法院的会议记录是官方提供的资料,但是怎么解读议员的立场、概括决议和社会议题之间的关系,就需要主观判断了。

为此g0v是通过让网民投票“贴标签”的方式,来整理议员的立场。

votely
一项表决案的标签

这是一种类似维基的crowd-sourcing,或者也可算是“人肉整理”。

还有,对于非电子格式的资料,如扫描件,g0v也有让网民自行认领任务,扫描OCR识别进行数字化。

数据看台湾类似,g0v也是主要由程序员组成。不过,g0v是去中心化的,更像一个开源社区。也就是说任何人都可以开放新项目,或者为已有项目贡献代码——所有的程序和网页源码基本上都在github上。他们定期举行“黑客松”,即是一群人聚在一起开发一些新应用、新功能。他们也大量使用Google Docs、hackpad(在线协作编辑)来汇集ideas,协同工作。沟通通过Slack进行, 任何人都能加入。http://g0v.tw/zh-TW/join.html

「不要問為何沒有人做這個,先承認你就是『沒有人』」。

因為,「沒有人」是萬能的。

——g0v的座右铭

 

政府借力民间力量

2015年八仙乐园粉尘爆炸事故之后,g0v很快推出网页,显示台湾各地医院实时可用病房数量、伤员人数等等。献血中心的血型需求情况,g0v也抓取资料,建立镜像来分担网站流量。

根据报道,这是“史上第一次政府主动向社群讨救兵,由社群发动在一個下午做出供民众查询伤患咨讯的系統”。后来在花莲台风中又派上用场。

相关报道http://www.wealth.com.tw/article_in.aspx?nid=5315

政府和民间团体的合作可能性打开之后,便能擦出更多火花。

g0v早前开发了一款“中央政府财政预算视觉化”的网页应用。2015年9月,台北市政府与g0v合作,在之前技术的基础上开发了“台北市总预算视觉化” Budget.taipei 供市民查看,民众还可以在同一个网页上反馈意见。

还有一些有意思的项目:

  • 萌典 https://www.moedict.tw
    • 一个集国语、闽南语、客家话于一体的字典应用。数据主要来自于教育部。有发音、书写动画等等功能。也有手机应用。
  • 天龙特公地 http://taipei-pop.herokuapp.com/
    • 台北各种公有土地的查询。数据也是政府提供的。可以在Google地图上精确地看到每块公有土地的范围、用途等等。
《萌典》手机应用

数据打造 民主2.0

台湾大选在即,我们也可借此看看台湾的数据开放对民主政治有何影响。

内地这几年流行“互联网+”,加的东西各种各样。但是有没有想过“互联网+政治”或者“互联网+民主”。我觉得,g0v的许多应用,应该可以算是一种“互联网+政治”了。

g0v在这次台湾大选中提供的网页应用有:

  • 立委投票指南
    • 出席率、表决率、财产情况。还有“缺席率排行榜”,偷懒的议员恐怕日子不好过了。
    • 大约有数十万使用者(统计数据还未公开),同时在线人数应该至少破千。.
    • URL: http://vote.ly.g0v.tw/
  • 政党票计算器
  • 2016总统大选承诺一览表(民众可编辑)

这些工具,都会帮助选民做选择时的依据更科学,作出informed choice,而不仅仅看表面的宣传。

立委投票指南之缺席排行榜

有不少人的印象中觉得台湾政治就是蓝绿恶斗、民粹等等,或者觉得造势喊口号显得老套而空洞。以前也许是这样,现在台面上或许还是这样,或者说大部分的政治人物还是会按传统做。但是,台面之下,民间社会,恐怕早已开始向新的形态演变。

2014年无党籍的柯文哲能够当选台北市长,各种小党势力渐起,或许可以说明民众开始求新,独立判断力越来越强。民众的选择有了更多科学的数据,靠的就不只是好感,政党的“铁票”也会越来越少。这或许会倒逼政治人物顺应时代,增加透明度,回应诉求。而这个民主2.0时代的出现,要归功于开放、易于获取的资料和数据,以及幕后开发应用、利用数据的一个个民间团体、一个个独立的个人。

Final thoughts

文首提到的开放数据指数,评判的其实都只是政府的数据开放程度,至于民间团体怎么利用这些数据、创造出了哪些App并不在考量之列。

其实,政府只需负责增加透明度、公开数据,而如何利用数据、发挥创意,则交由民间。到头来,政府甚至还可以采用民间开发的技术,来服务民众。另一方面,政府在尝到民间力量的甜头之后,也有更大机会主动公开更多数据,以求民间协助。民间搭好一套“查询系统”,为政府铺好了路,政府就只需公开数据。这是一个非常良性的循环。


希望这篇文章能帮到你了解台湾。今日便是台湾2016大选投票日,希望每个台湾选民都能在数据的帮助下作出最符合自己意志的选择。