开放数据到开放发展(二):从 China AidData 项目看开放援助款数据

注:该文最初发布在开放知识基金会中国博客, 如果你想了解更多,请关注官方微博

中国对非年度援助金额分布2000-2011 (http://china.aiddata.org/analyze)

China AidData 项目

中国对非洲援助一直以来都是个饱受争议的问题,而在这长达60年的资助历史中,中国对非洲到底援助了多少金额,可能没有多少人搞清楚过。致力于国际援助款透明化与开放化的研究机构 AidData 在2012年起便针对这个问题展开了研究。由于中国官方并未采用一些国际援助款登记平台例如经济合作与发展组织 (OECD) 的 CRS 或者国际援助款透明计划 (IATI) 的援助款数据平台, 因此 AidData 无法通过搜索这些现有的数据库来获取所有援助款数据。 AidData 在这个项目中便采用了一种基于媒体报道 (media-based) 的数据采集方式:通过对不同中外媒体源例如 WikiLeaks,BBC 的相关报道进行挖掘与整理,研究员成功搜集了大量官方公开的或者未公开的对非援助项目以及金额数据,从而形成了 China.AidData 的数据库。

AidData 在这个项目中证明了基于媒体报道的数据采集方式是一个很好的解密非公开援助款项目的手段。比如,非洲马拉维作为中国的受援助对象在其官方系统中仅公布了两项中国援助计划,但通过挖掘不同媒体报道,AidData 成功地将额外14个总值163万美金的中国援助项目公开,进一步将中国对非援助计划透明化。

AidData 的数据库目前囊括了2000-2011年间中国资助50个非洲国家的1,673个项目,项目总值达750亿美元。为了便于记者、研究人员、政策制定人员等访问这些数据,AidData 创建了项目网站 china.aiddata.org 提供数据的查询、访问、下载以及可视化。同时,为了提升数据的质量以及持续追踪中国对非援助项目,网站也接受用户提交的新信息,例如照片、文件、媒体报道、视频等。

IATI:援助款数据开放标准


IATI示例-对中国援助数据

国际援助款透明计划致力于通过提升援助款数据的流动性来推动全球援助款的透明。为了使数据更容易流动,IATI制定了一套数据发布标准来帮助各基金会、政府、NGO等管理并且发布它们的援助数据,而这套标准就是IATI数据标准。该数据标准实际是一套 XML 标记模式定义,主要对于援助项目 (Activity) 以及机构 (Organization) 进行了详细的定义。比如,上图中所展示的便是一个针对中国儿童健康的援助项目数据记录。更多关于该数据标准的信息,还请参见 IATI 标准项目主页:http://iatistandard.org/

当越来越多的机构采用 IATI 标准来发布数据,那么各机构间就有了统一的「语言」来交换相关的数据。为了进一步帮助公众以及机构找到需要的援助数据,IATI 也通过开放知识基金会的开源数据门户系统 CKAN 搭建了 IATI 数据门户 http://iatiregistry.org/ 。 该数据门户同时提供 API 方便开发者整合不同的援助数据,帮助公众进一步理解以及研究援助项目的决策制定和资源分配。比如,前不久的台风「海燕」在菲律宾造成了极大的伤亡与损害,而后各方提供了大量的援助项目,其中一些项目和资金数据都已经通过 IATI 的数据标准予以开放,开发者 Mark Brough 便基于这些数据创建了一个应用供公众查询相应的援助项目:http://pwyf.github.io/philippines/

随着「开放数据」以及「开放发展」运动在全球逐渐成为主流,国内的基金会、NGO、政府机构是否也该开始行动起来,学习 IATI 的数据标准,发布自己援助/资助或者受助的项目与资金数据,使资助项目更为透明化。

推荐阅读更多精彩内容