开放数据的那些迷与思：小记上海开放数据专题活动

两周前有幸在上海的 TED Meetup 做了一场关于「开放数据」的活动，拖拖拉拉到今天总算有时间写一下这场活动中一些精彩的讨论。

开放数据是否会造就终极「老大哥」？

活动一开始先是播放了万维网之父 Sir Tim 在2009年做的一场 Ted 演讲，其实这场演讲本身并不单单是说「开放数据」，而是涉及了他本身对下一代万维网——语义网的设想。语义网的设想核心之一是链接数据（Linked Data），即能够互相超链接的数据，而其发展过程中的重要一环就是去将数据开放，使得更多数据得以被链接。

而基于此理念，现场的讨论也就集中在了开放数据，不单单政府开放而且各级机构、单位、甚至个人都开放数据，最终是否会最后使得政府拥有更大的能量来监控一切。特别是考虑到像美国NSA计划的曝光，是否开放数据会为政府机构提供免费NSA？谁来监管对这些数据的搜集和使用？

对于这一点，小伙伴们主要讨论了未来个人隐私数据的控制。有人提到，对于个人数据，首先要想办法从服务提供商处取回自己的数据，以进行监管。这一点在近几年来都有一定的初步计划，比如美国政府的 Green Button 和 Blue Button 就将个人的能源使用数据和健康数据返还给个人自由下载利用，Google 也有相应的计划将用户使用数据返回给个人。

但这也仅是第一步，更长远的来看，我们需要改变的是目前用户与服务提供商之间的关系。现在的模式是我们自愿将数据完全交给服务提供商来换取服务，而未来，我们需要完全掌控自己的个人数据，服务提供商如果想要利用我们的数据，那么就需要至少取得我们的许可，甚至需要付费访问。而这种模式也将会有利于个人去开放一些自己的隐私数据（比如基因数据等等）供研究机构使用，甚至供商业公司使用。

当我们对自己数据有着更好的掌控之时，至少老大哥对个人隐私的窥探可能会受到一定的阻碍，但还有更多是需要我们去努力改变从而确保万维网的更链接、开放不会导致数据寡头出现，从而威胁到我们对万维网的自由使用。

开放数据在中国，开放有何难？

活动的第二部分是由我介绍了中国开放数据运动现状，整个的演讲围绕着「中国大陆开放数据运动时间线」开展，介绍了国内对开放数据理念的认知情况，政府相关工作情况以及民间社区发展情况。

在演讲后的讨论中，有人提问，数据开放对于政府部门而言不是很简单吗？他们本身就有那么多数据在网上公开可以找到，现在只是要他们拿出开放格式的，为什么进程那么慢？这里实际而言有两个问题，一是对于开放数据，不是简单将数据拿出来就结束了。这涉及到开放数据的法律体系和文档完善的问题。所谓法律体系，这里指的便是开放数据所应有的开放授权协议，即一个授予所有人无限制使用与分发该数据的权利的协议。这一协议的建立决定了开放数据运动的成败，需要各政府部门认同相关理念并有良好的法律、政策框架来确保开放授权协议的运作。其次，对于开放数据而言，为了使用者能理解和正确使用数据，必要的文档是非常需要的。这里说的文档需要阐述数据的收集方式，数据的编码方式，数据涉及的年度范围等等。缺失这些元信息，数据即使开放，也无法真正被使用。

另一个非常有意思的问题涉及了政府不开放数据的常用理由（其他常见理由，可参见这里，这里，这里和这里）：我们害怕人们误读数据而造成负面影响, 所以我们要等人们有足够能力和素质来正确理解数据才开放我们的数据。针对这一问题，其实很久之前加拿大的开放数据专家 David Eaves 就曾经撰文指出，类似于过去是否要造图书馆让人们获取知识一样，现在开放数据是为了更好地让人们具备处理和理解数据的能力。所以应当在人们具备数据解读和运用能力之前，就大规模开放数据。然而，在中国，我们获取要考虑另一个问题，那就是人们往往对于政府的作为都是情绪化的。比如，对于空气质量数据，就曾经被指责和美使馆数据相差太多，而被人们怀疑造假。但实际上，之前已经有人做过相关的研究，发现国内空气质量数据其实比美使馆的数据来得更靠谱，因为国内的数据是从多个监控点搜集回来再综合得到的结果。因此，这里如何让人们更为理性地去使用数据，以及政府应当如何更好地和人们沟通数据背后的故事（采集方法等），则成为一个需要好好研究的问题。

虽说国内开放数据运动的路还很长，尚有很多工作要做，但随着国内开放数据的呼声日益高涨，国内无论是政府还是民间社区目前都应当开始准备好迎接开放数据的时代。

最后编辑于：2017.11.26 21:56:31

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 156,630评论 4赞 359
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 66,405评论 1赞 289
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 106,382评论 0赞 237
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,548评论 0赞 203
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 51,853评论 3赞 285
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,276评论 1赞 209
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,638评论 2赞 309
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,350评论 0赞 195
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,015评论 1赞 238
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,309评论 2赞 240
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 31,836评论 1赞 256
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,206评论 2赞 251
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,767评论 3赞 231
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 25,972评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,715评论 0赞 192
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,319评论 2赞 269
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,222评论 2赞 258

开放数据的那些迷与思：小记上海开放数据专题活动

开放数据是否会造就终极「老大哥」？

开放数据在中国，开放有何难？

推荐阅读更多精彩内容