×

失踪的开放授权:为何说中国还没有开放数据?

96
Feng
2014.05.24 20:33* 字数 2162

公开数据≠开放数据!

在之前所写的「开放数据≠公开数据≠共享数据」一文中,我们已经讨论过为什么简单将数据公开在网站上不能算作开放数据。而这里,进一步我们要强调的是,将数据公开在一个机器可读的格式下,也不能被归类为开放数据。开放数据的核心,不仅在于技术上的开放,更重要的是在于其法律层面上的开放,即法律上对使用者如何使用数据设下极少的(具体的可接受的限制在下节中介绍)限制。

什么是开放授权?

如果你较为熟悉知识共享协议,那么或许你已经对开放授权有一定的了解了。开放授权是一类对使用者设下极少使用限制的授权方式。一般来说,开放授权协议允许设下以下两种限制:

  1. 你必须在使用内容或数据时对所有者进行署名

  2. 如果你对原有内容或数据进行了演绎,那么演绎后的内容或数据也要以相同方式授权。

一个开放授权协议一般会同时(不)包括以上两者,或仅包含一个。但除了这两个限制之外,一般是不允许有其他种类的限制条件的。如果一个授权协议设置了其他的限制条件,那么这个授权协议也就不能算作开放授权协议了。

除了以上两种可能限制之外,开放授权不再对用户使用数据设下其他限制,而这又意味着什么呢?

  1. 这意味着对于任何人而言都有平等的机会来访问、获取并使用数据。无论是穷人还是富人,都有相同的权利来使用这些数据。

  2. 这意味着使用目的的无限制。无论是使用数据做研究又或是使用数据做新闻报道,还是说拿数据来进行商业产品的开发,都是不禁止的。

现有数据门户的协议评估

那么对于现有的数据门户,也即中国统计局的「国家数据」平台,北京的北京政务数据资源网,上海的上海政府数据服务网,在开放授权这一点上做的如何呢?

一个简单的答案是:三者目前没有一个采用开放授权。

而这也就自然意味着目前三者在数据发布上,只能算作更好地进行了数据公开(采用机器可读格式发布),但称为开放数据还为时尚早。

那么三个数据门户目前是如何对数据使用进行授权的呢?

首先,对于单个数据集而言,目前三个数据门户均没有明确授权协议。如果你访问一个单独的数据集,你无法立刻明确该数据集是否采用了开放授权,你也无法从数据下载页面得知下载了数据后,可以如何使用,是否有一定的限制等等。

其次,对于数据门户本身而言,目前上海、北京都能找到明确的用户协议对数据的使用进行了一定的规定。而统计局的国家数据目前则没有相应的说明。

再来看一看上海北京两个门户的用户协议,我们针对免费、商业使用、平等使用三个最重要的点来进行分析:

首先,对于数据是否免费可获取这一点,目前是采取默认是免费这样的做法来发布数据的。但是,如果你认真读一下北京门户用户协议的话,你会发现它其实注明了

现阶段,用户有权免费获取本网站所提供的所有政务数据资源,享有数据资源的非排他使用权

这句话其实也就说明官方仍旧保留将来对数据获取进行收费的权利,而只是在现阶段这个测试期,进行免费,后续还未知。

其次,对于商业使用,北京的用户协议也非常有意思:

用户不得有偿或无偿转让在本网站中获取的各种数据资源。

在这一点上,北京的用户协议毫无疑问已经违背了开放授权的精神,对用户的使用目的进行了限制。而且,「转让」一词如何界定?如果第三方基于数据搭建API,对API进行收费,API的使用者通过API将所有数据提取,那么这是否属于「有偿转让」?故而基于此,北京门户也就已然不能作为开放数据门户了。

而除此之外,三个门户均未明确用户在商业使用、转让、演绎上的权利,这就给数据使用者留下了一个大大的问号。

最后,针对平等使用。虽然用户协议中并没有明显造成不平等的条款,但是北京门户很中国特色地规定:

用户在发布其APP应用之前,本网站有权对该应用予以审核,决定是否同意发布该应用

这造成了一个非常有意思的问题,究竟官方秉持怎样的原则来进行应用审核?如果这个标准本身不够透明、公正,如何能保证其审查不影响数据使用的平等?

开放授权:数据价值的催化剂

对于中国的数据门户而言,开放授权还是个继续研究的课题。然而,开放授权真的那么重要吗?

答案是一定的。因为开放授权是保证开放数据价值得以充分发挥的基础。

对于任何开放数据的使用者而言,清晰的授权条款明确了他们可以做什么,不可以做什么,从而他们就可以有法可依去使用数据,对其进行加值。在授权条款未明确的情况下,就造成了数据拥有者和数据使用者在数据具体能够如何使用上没有清晰的共识,在今后出现问题时,就很难保障一方的相应权益。

进一步而言,开放数据的商业发展是非常依赖于明确的开放授权的。比如,一种常见的开放数据商业模型就是利用了开放授权协议中「以相同方式授权」来开展的。较为著名的例子是英国创业公司,OpenCorporates,这家公司致力于提供全球企业信息数据,这些数据有的本身开放,有的需要通过技术手段或这信息公开手段获取。OpenCorporates 在搜集并整理大量数据后,将其数据授权在「署名-以相同方式授权」的开放授权协议下,这样任何人都可以使用这个数据来进行创新。但是,对于一些商业公司而言,「以相同方式授权」是一个比较不能接受的条款,因为这意味着他们在使用数据进行演绎后,新的内容也要开放授权。对于不愿意接受这一限制的商业公司,OpenCorporates 就针对他们特别设计了一个付费服务,允许他们付费后,获得一个特别的仅要求「署名」的开放授权。

未来走向

在文章最后,对中国开放数据门户的授权问题列一个许愿列表:

  1. 希望中国开放数据门户能够都采用开放的授权
  2. 希望中国开放数据门户能够采用相同的开放授权,尽量少用各地方、各部门、各单位自身定制的个性化协议
  3. 希望开放授权协议的语言能够清晰、易懂、简练,用图示说明允许做什么,不允许做什么(参考:英国开放政府授权协议
  4. 希望能够明确中国政府机构所采集与发布的数据的版权问题,比如:政府是否拥有版权,数据是否可以归入公共领域等
漫谈开放数据与发展
Web note ad 1