统计与开放数据:收获未用知识,赋权普通市民,优化公共服

96
Feng
2014.03.28 16:54* 字数 3013

英国下议院近日发表了一份长篇报告综述了英国开放数据运动截至至今的发展现状和存在的问题。报告主要涉及了5个方面:开放数据提升政府公信力,开放数据的经济价值,开放数据优化政府工作,如何加速发展开放数据,以及开放数据发展的策略。整篇报告最终产出38条结论,完整内容可见:http://www.publications.parliament.uk/pa/cm201314/cmselect/cmpubadm/564/56402.htm

此处摘译整篇报告的主要要点:

提升政府公信力

  1. 报告指出,政府开放数据政策的重要目的之一是期望能够让人们有能力来对政府问责,在过去几年中,我们已经能看到许多成功的例子。比如对于政府医疗花费而言,通过创业公司 Mastodon 对医生处方数据的分析,我们了解到如果医生多开常用药,那么每年NHS(国家医疗服务)其实可以节省2亿英镑的开支。但值得注意的是,由于近几年政府对开放数据经济价值的兴趣日益增长,其原本开放数据来提升政府公信力,赋权于民的目标也受到了动摇。

  2. 开放数据的定义应当更为清晰,明确,来确保政府机构和民众能够充分利用其来监督政府。

  3. 政府公务员常常担忧数据不完美而不愿意开放数据,而这一点在 Stephan Shakespeare 看来完全可以通过采取「双渠道」政策来解决。即一方面要「尽早发布数据,即使它并不完美」,另一方面也要坚持「数据高质量」为核心价值观。他认为这两点本身并不矛盾,数据的尽早发布可以帮助政府更好地提高数据质量。

  4. 我们常常指出 data.gov.uk 现在有 13,000 数据集,但我们并不知道有多少数据集其实是通过将一个大数据集拆分发布,或者重新发布已经存在的数据集而来博取数量上的绩效指标的。 这些拆分大数据集和将更新数据作为新数据集的做法,对于公众而言毫无益处。

  5. 开放数据的定义要在各个部门间以及外包服务公司间都保持统一。政府采购应当整体改革,特别是IT采购,所有相应数据都应当被鼓励开放。因此,开放数据政策不仅仅针对政府部门,也针对和政府有合约的企业。

  6. 信息公开法需要进行变革来整合开放数据的理念。这包括,对于信息公开中主动公开和被动公开的数据,都应当提供在开放授权、机器可读的形式下;对于过往被申请公开的数据,相关部门应当主动将这些数据以开放数据的形式发布。

  7. 政府在开放数据时必须考虑隐私问题,确保个人无法通过开放的数据被识别。Care.data 则是一起经典的失败案例,因其存在个人医疗记录泄漏的风险。隐私问题在考虑时需要和公众利益保持平衡,比如不能因为隐私的借口,而剥夺人们了解国家企业领导信息的权利。

  8. 政府应当对公众做更多教育来让人们意识到开放数据对他们日常生活的影响。这过程中要尽量避免使用晦涩难懂的技术词汇,降低门槛让更多的人能开始使用开放数据对政府问责。

  9. 政府应当采用一套全新的星级评判标准来评估公众参与情况。比如,一星代表数据发布者仅基于需求关系来开放数据,而五星意味着发布者和使用者之间有着紧密的合作和互动。

开放数据的经济价值

  1. 开放数据的经济价值既在创建新的商业模式,也在提升现有的商业模式。

  2. 开放数据对商业的变革会让一些企业胜出,一些企业失败,但最终的赢家是消费者。

  3. Data.gov.uk 到底在政府之外有多少价值目前还存疑。目前其的使用情况还不明。

  4. 「发布数据,然后等人来用」的方法已经淘汰了。政府需要想办法来刺激与推动数据消费。

  5. 英国政府在2012年投资建设开放数据研究院(Open Data Institute),其目标便是要「催化开放数据的经济发展」。目前有19个国家试图在模仿这种发展模式,而引入了ODI。美国和加拿大都已经建立了国家级开放数据研究院(作为ODI国际结点)

  6. 英国若要在开放数据经济领域领先,就需要加快步伐。

  7. 开放数据可以是免费,但其之上的服务可以是收费的。基于此,政府的一些数据集不应当再收取授权费,而应当尽早采用这种新的模式来促进经济发展。

  8. 英国某部长 Fallon 先生称开放数据将会使国际大公司受益,而本土小公司则没有能力来处理那么庞大的数据,因此我们还是需要以付费授权形式来发布数据,保护本土经济。而开放数据研究院回应称,这种说法是没搞懂如今的网络式经济发展,因为对于各国际大公司而言,数据收费本来就不能阻止他们访问那些数据,如果免费开放数据,我们反而能让更多原本负担不起费用的本土企业受益,而且就算大企业免费拿了数据,但他们带回来的投资等回报也将会是巨大的。对于向大公司和小公司收取不同授权费的说法,ODI也表示不认同,因为这完全不符合经济原则,而且信息的自由流动才能真正让小公司受益。

  9. 政府需要一种新方法来长期支持开放政府数据。对一些数据集收费只能解一时的燃眉之急,不能成为长久解决方案。对于政府在数据采集和发布过程中的成本,政府可以在其他政府服务中想办法收回。比如,对于公司注册、土地注册等服务,政府可以向相关企业收取开放数据成本费,来资助必要的数据采集和开放工作。

  10. 一些数据是基础数据集,比如邮政编码数据,统计区域的地理位置编码,企业注册号等。这些数据是其他数据集的「核心参考数据」,没有他们,其他数据也无法有效使用。丹麦政府就将他们的地址数据库开放,而且估计这将会为他们带来40倍于封闭这些数据的收益。

  11. 政府必须和企业紧密合作来创建一个良好的开放数据生态供他们成长。开放数据研究院因此成立来帮助初创企业成长,但她的实际影响仍带长期观察和评估。

优化政府工作

  1. 开放数据不但可以帮助公众监管政府,政府内部也能通过开放数据来做更好的决策。

  2. 部长们提到,各部门都被期望来使用他们自己发布的以及其他部门发布的数据来优化他们自己的工作。信息共享是设计和实现优质服务的关键。

  3. 政府部门间的信息共享仍旧不成熟,期望开放数据的工作能提升各部门间的写作,促进工作优化。开放数据也使得外部专家对政府服务的优化提出建议成为可能。

如何加速发展开放数据

  1. 政府公务人员缺乏必要的数据处理能力。虽然有很多投资进入「大数据」领域,但更多是着眼于「硬件购买」。人员的技能培训是关键,无论是公职人员还是普通民众,都应当能够掌握必要的数据处理技能来让我们充分利用开放数据。

  2. 政府文化需要改变。如果高层不要求见到真正的数据实证,那么就每人会在乎数据能力,开放数据运动也就无法成功。

  3. 政府统计工作人员可以为开放数据贡献良多。国家统计数据应当被开放。统计人员应当领导政府内的开放数据工作,但他们现在却未被足够重视。

  4. 一套5星评价系统可以被引入去评估开放统计数据的重用性。如果开放统计数据包含元数据,那么可以得到一星;如果数据提供了更为丰富的背景资料和数据链接,那么则可以达到五星。

开放数据发展的策略

  1. 开放数据发展需要有清晰的策略重点。因为它本身可以意味很多东西(比如,经济发展,政府透明化等等),政府需要明确自己到底想要重点做哪一方面的工作。

  2. 开放数据研究院指出,开放数据发展的策略可以包含:

    • 将开放数据作为更宽泛的数据开放和使用策略的一部分
    • 保证政府采集的数据是社会需要的
    • 建立商业模型来支撑数据发布
    • 由国家数字服务(GDS)来建设一个世界级的数据发布平台
    • 确保政府受益于开放数据,培养公务人员的数据能力来充分利用这些数据
    • 在发布自身数据之外,要开始鼓励与政府有合约的企业开放相关数据
  3. 政府内究竟谁在领导整个开放数据运动还不够明确。英国开放数据用户组(译者注:政府成立的独立监管小组,帮助数据需求者反馈数据请求给相关政府部门)说开放数据的整体发展方向不明确,这是因为确保各部门在开放数据上作出进展的机制不健全,职责过于分散,而使得整个进程缓慢。内阁在开放数据工作上的努力很大程度上依赖于财政部和商业创新部门的支持

  4. 开放数据研究院创始人之一 Sir Nigel Shadbolt说财政部可能是诸多阻碍因素的幕后黑手。因为他们没有完全被说服去相信开放数据是一个崭新的机遇,并且他不认为财政部明白开放数据究竟能创造怎样巨大的经济价值。开放知识基金会创始人 Dr. Rufus Pollock 认同这一点,称财政部是真正的阻碍者。

  5. Stephan Shakespeare 号召政府建立一个统一的权威机构主管开放数据发展,确保其带来的利益能够快速成为现实。

  6. 政府应当将开放数据作为最主要的项目。内阁中应当设立一个专员主管开放数据事务,来明确其发展方向,引领所有部门的合作。内阁应当明确制定开放数据政策的职责,并且内阁应当负责全局推进开放数据运动。

漫谈开放数据与发展