万万没想到 11月18日Day 10

一个关于转世的流行病学研究

很多人相信人死之后,其意识并不会立即消失,而是以灵魂的形式飘荡一段时间,并且有可能再次转生为人。这个说法没有任何直接的科学证据:灵魂活动似乎根本没办法用仪器测量,而且现代科学认为人的一切意识都是凭借大脑的硬件实现的,根本不允许脱离肉体的意识存在。而在我看来更重要的一点,则是现有的科学理论已经能够很不错地解释整个世界,似乎并没有哪些事情非得用人有灵魂来解释不可。

或者,除了某些“小事情”之外。我们经常在网上论坛看到一些灵异事件的“经历贴”,其中描述的灵异事件似乎只能用真有鬼来解释。在以宣传无神论为己任的科普人士看来,这些经历就算再离奇,背后也一定有一个科学的,甚至是简单到可笑的解释。但这样的态度显然没有让所有人信服。比如最近刘衍文老先生在上海书评连载《寄庐志疑》,其中提到很多灵异事件,就对“科普们”对这些事件的可能解释表示了不屑一顾。

其实之所以长期以来都是“科普们”而不是科学家关注灵异事件,一个重要原因可能不是科学家傲慢,而是这些事件实在很难认真对待。科学研究的第一步是证据。而鬼,如果真有的话,他们的出现具有很强的随意性,几乎没法搞实验。网上的经历贴事实是否成立都不好验证,就算有科学家真信了,兴冲冲跑到现场,鬼不来了又怎么办?或者就算鬼还是来了,可只有你能看见我看不见,仪器测不到,我又怎么办?再或者就算有科学家拿着仪器真的在某个凶宅里拍摄到了不正常的“影子”,那么这段录像到底有没有技术错误又是一个问题。除非能够大规模地重复验证一种灵异现象,才有可能让科学家认真起来。

研究

一个纽约警察,化名约翰(John),经常跟自己的女儿,化名多琳(Doreen),说,“不管发生什么事情,我都会照顾你。”1992年,约翰在一起抢劫案中中枪而死。他一共被击中六枪,其中致命的一枪从后背进入,割破了左肺和心脏,并导致肺动脉破裂。

五年后,多琳生了个儿子,化名威廉(William)。威廉一出生就有缺陷,他的肺动脉隔膜发育不全,血液有时候不能进入肺;他的一个心室也没发育好。几次手术之后威廉仍然要终生用药,但除此之外他是个相当正常的孩子。

威廉三岁的时候有一天多琳让他不要闹,否则就会打他。可是威廉说,“妈妈,当你是小女孩,而我是你爸爸的时候,我从来没打过你!”起初多琳没当回事,但后来威廉不断告诉她他曾经是约翰。他陆陆续续谈过很多约翰的事情,其中包括那次枪战。他记得多琳小时候家里养过的猫,他的一些习惯也与约翰相同。但是最让多琳震撼的是有一次威廉对她说,“别担心,妈妈。我会照顾你。”

这种儿童回忆起自己“前世”的案例并不算特别稀奇,可能每个人都时有耳闻。这里面没有什么鬼魂的直接出现,相当于是没有灵异现象的灵异事件,反而比较适合作为研究对象:“转世儿童”和他们的家人,乃至他们“前世”的家人,就在那里,研究人员可以随时过去拜访。弗吉尼亚大学医学院有一个知觉研究部(Division of Perceptual Studies),专门研究此类事件。该机构的研究人员吉姆·塔克(Jim Tucker)在2005年出了一本书,《前世生活:关于儿童回忆来前世生活的科学调查》(Life Before Life: A Scientific Investigation of Children's Memories of Previous Lives),向我们介绍了他们取得的成果。

在医学界和心理学界,如果科学家想要研究某个因素对人的影响,比如吸烟是否有害健康或者受虐待儿童长大以后是否犯罪率更高之类,往往无法直接做实验,而只能采取搜集案例做统计分析的办法,这个方法称为“流行病学(epidemiology)”。流行病学的结果远远不能作为最后的科学结论,但是这个方法仍然是科学的方法,也可以说是在你没有别的办法的时候所能使用的最科学办法。塔克等人研究儿童的转世回忆,采用的就是这个办法。他们总共搜集了超过2500个案例。

转世

这些儿童大多在两到四岁之间开始跟家长说自己有一个前世(根据科学精神这里应该使用引号,但为行文方便以后引号一律省略)。他们往往会给出前世生活的诸多细节,甚至包括具体的地点和名字,他们要求家长带领自己去寻访前世的家庭。如果根据孩子的论述真的找到了其前世的家庭,研究人员就把这个案例称为“告破(solved)”,否则就是“未告破(unsolved)”。一旦得知有这么一个事件,研究人员就会设法尽快赶到。很多案例发生在亚洲国家,尤其是印度、斯里兰卡和泰国,这样美国的研究者需要在当地设立线人来随时通报新案例。在绝大多数情况下等研究者知道的时候,案例已经被告破了。但也有一些案例,是研究者跟着这个儿童今世的家庭一起去寻访其前世家庭,这样的案例显然更为可靠。

前面威廉这个案例的一个特别重要之处在于,威廉的出生缺陷正好和约翰的致命伤在同一个地方。事实上,研究者一共搜集到了225个有前世回忆,并且又有先天缺陷——更常见的是有胎记——的案例。如果他们的前世死于暴力,那么这些儿童的胎记或先天缺陷就恰好与其前世受的伤是在同一个地方。另一种情况则是有些亚洲地区有在死者身上用颜料做个记号的习俗,而其转世的孩子会在做记号的这个地方恰好有一个胎记。跟回忆和叙述相比,胎记和先天缺陷是硬邦邦的物理证据,所以研究者特别重视这样的案例。他们会亲自查看儿童,并且去当地机构寻找其前世死亡时的医生证明,并且把这两个东西对比。有时候随着儿童慢慢长大,胎记的位置会发生些许变化,颜色也会变淡,不过对应得仍然很明显。

有些儿童对前世的家庭有强烈的感情依赖,他们甚至会要求前世亲人定期来看自己。有的保留了前世的生活习惯,比如烟酒爱好,而今生家人均无此爱好。有的会做出前世工作时候(比如打铁)的动作。有的甚至在游戏中模拟自己前世死亡的过程,包括拔枪自杀!在印度有个出生于低种姓家庭的孩子认为自己的前世是高种姓,从小拒绝吃家里的食物,邻居帮着用高种姓方法做了一年饭才改过来。有好几个出生于缅甸的孩子声称自己前世是二战时期死在这里的日本兵,他们喜爱日本式的食物,拒绝穿当地的服饰,而且非常害怕飞机。前世是非正常死亡的,35%表现出对该方式的恐惧——尤其是水,53个淹死的中,有31个怕水,有的甚至必须由两个人按住才能洗澡。有一个女孩前世因为躲避一个公共汽车而掉到池塘里溺水而死,结果今世既怕汽车又怕水。在转世过程中改变性别的,表现为“很不适应”,比如女孩强烈要求当男孩。

而所有这一切,不管是转世回忆还是前世对今生感情的影响,大都会在七岁以后慢慢淡化乃至忘记。这些孩子长大以后跟别的孩子没有任何区别。有个女孩刚会说话的时候强烈要求父母找到了前世的家人,包括丈夫和儿女,她要求他们必须每周都来看她,以至于她前世的丈夫及现在的妻子都不干了。然而等到这女孩七岁以后,她反而觉得前世的家庭成了她的累赘。但是也有一个极其罕见的案例,一个男孩找到了前世的妻子,一直到长大以后仍然跟她保持着感情,并且不顾年龄差距再次与之结婚!

质疑

怎样合理地解释这些事件?一种可能性当然是这一切纯属偶然。小孩子什么话都有可能说,如果当了真并且按照他们说的去找,也许真的就能找到这么一个死去的人,正好符合他说的。书中提到英国赫特福德郡(Hertfordshire)大学的心理学家理查德·怀斯曼(Richard Wiseman)就持这种观点,并且组织了一个实验来验证。他找到几个孩子来编造他们的前世,然后寻找能与之对应的死亡记录。理查德·怀斯曼得到的最好案例是一个三岁的小女孩说自己的前世三岁时被怪物咬死。理查德·怀斯曼找到的是一个被绑架并被杀害的女孩,这个女孩和被编造的那个前世有相同的头发和眼睛颜色,甚至都穿粉色带花的衣服,并且都住在海边。

但跟转世研究者的案例相比,理查德·怀斯曼的编造案例缺乏一些重要的东西,比如说具体的人名和地点。实际上有些儿童不但说出了前世家人的名字,而且回到前世家里之后还能指出一些别人不可能知道的物品的存放地点。有时候他们不经询问就告诉前世家人自己死之前家里情况跟现在的不同。在一个案例中,儿童向他前世的兄弟指出自己曾经送给过他一把枪,而这把枪的型号在当地非常罕见,更何况事情只有兄弟二人知道。在一个有研究者陪同下指认的案例中,儿童不但说对了前世村子里所有的人,而且遇到一个其死后才搬来此地的人,并表示不认识这个人。在很多情况下今世家庭与前世家庭根本不认识,有些寻访前世家庭的工作是今世家人委托第三方去办的,这种有多人参与的案例可信性就更高。真正有价值的案例都有这样一个特点:儿童说出了他根本不可能知道的信息。

那么有没有可能是儿童家人的错误记忆呢?比如说也许这一家人很愿意相信转世,孩子其实说过很多话,但家长却对那些印证了的话记得特别深刻,甚至自己主动脑补,把没说对的也算成说对了的。但有三十多个案例是家长写下孩子对前世的陈述,然后拿着这个文字记录去寻找并且被告破了的,这就大大减少了错误记忆的可能性。研究者对比了有文字记录的案例和没有文字记录的案例,发现其中孩子事前陈述的准确度分别是76.7%和78.4%,非常接近,而且有文字记录的平均陈述条数不是更少,而是更多。这个70%多的准确度似乎是可以接受的,就算我们这些成年人回忆早年的事情,没有生死之隔,也未必能100%说准。

为避免记忆错误,研究者还想了另一个办法。他们会在时隔几年之后让另一个研究人员,在不看原来案子记录的情况下再次访问这个家庭。如果是记忆错误,那么随着时间推移,这个案例的强度会被加强(因为一厢情愿相信转世的家人会往“强”的方向上编),但是结果恰恰相反,时间推移以后案例反而变得不那么鲜明了,就好像是真实的记忆一样。

还有一个可能就是造假。但造假对有回忆儿童的家庭来说似乎没什么好处。研究者不会给他们提供任何“采访费”,而他们却不得不在家里不厌其烦地接受陌生人的询问。在绝大多数情况下,今世家庭没有向前世家庭提出任何财物的要求。而在很多情况下,今世家庭根本不愿意去寻找什么前世家庭,往往是孩子强烈要求才不得不去。有一个例子中一个女孩的前世是某个手艺人的妻子,地位较低,而其今世家庭地位较高,这导致她的父亲极其反感她谈论前世。

当然,也有可能是研究者在造假。我们完全可以想见从事这种研究不可能获得什么真正的学术声望,而研究者们的确也不是什么学界大牛,他们发表论文的期刊也不是“国际主流刊物”。也许他们——不是一两个人,而是一整个部门——为了出名或者获得经费(这个项目的经费来自私人捐款,并非政府拨款)而伪造了这一切。不过正如作者所说,他们保留了数千份档案。

整个研究还有一些别的可供吐槽的地方。一个弱点是美国的案例太少,相当多的案例来自亚洲国家。可能是因为只有20%左右的美国人相信转世,所以他们不怎么报告,甚至有可能转世不怎么在美国发生。但也有一种可能是亚洲人因为过于相信而自觉或不自觉地夸大了案例。

另一方面,胎记和出生缺陷是相当硬的证据,这个似乎没法用错误记忆之类的理论解释,如果是巧合那就是极其罕见的巧合,如果是造假那就是非常困难的造假。

也许转世回忆这个事情真的值得认真对待。事实上要说反伪科学的“科普们”,卡尔·萨根应该是其中的翘楚,但就在他《魔鬼出没的世界》这本强烈批评迷信的书中,也承认儿童转世回忆也许是个值得认真对待的问题。

那么,我们不妨就以认真的态度来考察一下这些案例。也许我们可以更大胆一点,先假设这些转世案例都是真的,而且都是真的转世。

新知

一个好的研究应该不但能印证人们心中已有的观念,还能告诉我们一些以前不知道的事情。研究者从这些案例中发现了一些相当有趣的结论。

在那些现在已知前世的死亡方式的案例中,有70%是非自然死亡,也就是说死于谋杀或者意外。而在剩下的这30%中,也有很多是死于心脏病突发之类的原因。也就是说这些有前世回忆的儿童,他们中的大多数人的前世不是像一般人那样平平淡淡地、可以预见地死在床上的。另外,全部案例中有75%的人谈论了前世的死亡过程,但对于其中正常死亡的,这个比例则只有57%——暴力死亡者更可能谈论自己的死亡方式。这似乎给“为什么不是每个人都有前世回忆”这个问题提供了一点线索。也许在正常情况下每个人都安安静静地死去,然后会有某种机制(比如“孟婆汤”)抹去前世的记忆,然后再转世。但是那些意外死亡的人因为是“意外”,这个机制被破坏了,以至于出生以后还保留了前世的记忆。塔克对这个问题的一个假说则是可能一般人死了之后不会转世,只有那些由于某种未尽之事想要再回来的人才会转世。但是也没有任何记载说这些人有报仇之类的行为。

我以前看了很多鬼故事论坛的“经历贴”,曾经提出转世有一个“灵魂定域性原理”:也就是说人死了之后一般就近转世。有人对此提出异议,认为应该是每个灵魂由某个中央系统统一安排在世界各地转世,不受地理的限制。但从这本书给的案例来看,“灵魂定域性原理”还是大体成立的。其中提到前世和今世家庭距离最远的一个案例是400英里,但间隔时间超过40年。很多案例都是转世在几十英里范围内临近的村庄,这个距离对印度和斯里兰卡这些国家来说已经远到去一次不容易的程度,但仍能通过第三方接上头。

不但如此,很多情况下两个家庭还有某种关系。书中介绍有一个针对971个案例的统计,发现其中:

· 195个案例是在同一家庭内部转世;

· 60个案例中两个家庭有密切联系;

· 115个案例中两个家庭有微弱联系;

· 93个案例中两个家庭认识,但无联系;

· 剩下的508个案例中两个家庭完全是陌生关系,其中239个是已告破的案例;

· 全部971个案例中有232个是未告破的。

从死亡到转世的间隔时间长短不定,统计发现其中位数(一半人比这个时间长,一半人比这个时间短)是15~16个月。在这段时间内发生了什么?有一个研究的1100个案例中有217个谈论了自己死后到出生前这段时间发生的事情,包括葬礼、受孕和出生这种地球上的事情,以及“另一世界”的事情,比如说天堂。似乎没人提到地狱,也许进了地狱的都未能转世。有的只谈论其中一种或几种经历。其中像葬礼和出生前胎儿状态的描述是有人证实的,所以似乎值得严肃考虑。对比之下,研究者对“另一世界”的言论持非常谨慎的态度,甚至不愿意讨论——不是因为宗教原因,而是因为另一世界的事没办法验证。不过他们还是做了一点统计。

你愿意死后直接就近转世,还是先到比如说天堂这样的地方跟有关人员或者有关部门,见个面再转世?我想可能很多人会选择后者。自然死亡者比非自然死亡者报告“另一世界”经历的可能性略高,比例是19%对13%。而突然死亡的人,报告另一世界经历的可能性则比非突然死亡者小,12%对22%。这个结果似乎比较符合人们心目中“自然死亡是一种福气”的认识。

那么,到底生前是什么样的人有机会前往“另一世界”呢?这个结果恐怕就要让某些宗教人士失望了。研究者尽可能地统计了案例中前世人物的以下特征:

· 他富有吗?

· 他是犯罪分子吗?

· 他是否乐善好施?

· 他是否热衷于宗教活动?

· 他是否是个沉思者(meditator)?

· 他是否过着一种圣洁的生活(saintly)?

结果发现以上所有特征都与是否报告两世之间地球活动无关,而且除了一个特征之外,也都与是否报告“另一世界”经历无关:沉思。只有沉思者更容易报告曾经前往另一世界。

“沉思”这个结果并不说明什么。也许大家的机会都差不多,只有沉思者的观察比较细且记性比较好。但更关键的是这个统计的样本实在太少了,只有一部分案例中的前世人格被统计下来,比如在1100个案例中其实只有33个沉思者。但热衷于宗教活动的人士并不比犯罪分子更有可能前往天堂这个情况,仍然相当引人注目。

我们这些俗人更关心的一个问题是前世对今生有什么影响,也就是说,这辈子需要做些什么,下辈子才能出生得好一点呢?研究者也考察了前面各项与今世这个儿童所在的家庭的经济地位和社会地位之间的关系,结果是:前世圣洁的生活,对今世出生的经济地位很有“帮助”,并且对今世出生的社会地位有一定帮助。但是这个经济和社会地位,是指实质地位,而与印度社会的种姓无关,也就是说圣洁生活不能确保下辈子生于高种姓之家。至于其他所有各项,均没有关系。这样,那些相信这辈子乐善好施会导致下辈子出生于富贵之家的人可能要失望了。

从这些极其有限的统计结果来看,亚洲人普遍相信的“因果定律”似乎没有起到作用。不但如此,我们还从案例中看到有好几个日本侵略者在缅甸就地转世为人(而没有进入“地狱”或成为“兽类”),自杀者照样转世,这些都与某些宗教人士的说法不同。另外塔克在书中提出胎记和出生缺陷这个情况也不符合因果:为什么是受害者,而不是杀人者,下辈子带着胎记和出生缺陷?也许这里起作用的不是因果定律而是某种自然定律,比如意识影响身体之类。

议论

这些研究也许会使有些读者更加相信转世的存在,但它们远远不能“证明”转世。我们不知道有什么机制可以让意识脱离肉体存在,这件事完全不能用现有的任何科学理论解释。流行病学研究通常不涉及机制,但这些案例数目就算按流行病学的标准也不够强。

也许更重要的一点是,正如本文开头所说,现有的科学理论对世界的解释已经相当不错了。一个没有转世现象的世界观并没有让任何科学家感到不安。我觉得如果转世存在,那么就应该无处不在,就算有“孟婆汤机制”,我们也应该能够是用什么手段测量出来“普通人的转世”。更进一步灵异现象也应该无处不在,我们生活中应该时刻都有一些使用现代科学解释不了的现象。而事实是灵异现象都比较罕见。

我非常钦佩研究者们做这个研究的勇气。他们既没有受到“主流科学”的影响,也没有受到宗教的影响,他们既不相信有神论也不相信无神论,他们只看证据。实际上他们似乎也没怎么受到“主流”的打压,也许除了大学同事的背后议论之外。他们使用的是科学方法,这些简单的前往现场验证事实、统计、发现相关性的办法并无出奇之处,但他们做了现有条件下能做的一切,除非做个转世实验。

所以这个研究的一个重大意义就是告诉人们:哪怕你关心的是“灵魂转世”这样的问题,你唯一正确的判断办法仍然是科学方法。

摆脱童稚状态

中国民间有一个“七十三,八十四,阎王不请自己去”的说法,说在这两个年龄上的人更容易去世。这个定律从直觉上就不太可能是对的。我们设想,应该是因为孔子和孟子分别死于这两个年龄,人们认为这是人生中的两道大关,然后每当听说有人在这个年龄去世都会进一步加深印象,以至于总结了这个纯粹是错觉的定律。但有人不满足于直觉分析。

一篇网上流传的文章认为这是一个“科学家验证”了的规律:“科学家的回答是肯定的”。这篇文章说“科学家们经过了反复的研究”,发现“人的生命有一个周期性的规律,大致是7~8年为一个周期”,而73岁和84岁正是这个周期的低潮。我不知道这个周期学说是哪个科学家的理论,也许来自某人解读的《黄帝内经》吧。问题是,这篇文章把“能找到一个理论解释”,当成判断一个学说是否科学的标准——如果能用理论解释,它就是科学验证了的吗?

绝学与证据

不管你用来解释的理论对不对,这都是一个错误的判断标准。能用理论解释的结论未必正确,不能用理论解释的结论未必错误。古代文人的思维习惯,是遇到无法判断对错的局面就查经典,想获得理论上的指导。而科学家的方法则要朴素得多:你直接用事实验证一下不就行了吗?我们根本不需要任何学派的任何医学知识,甚至不需要什么逻辑推理,只要随便找个死亡年龄分布数据就会发现73岁和84岁并不比其临近年龄更容易让人死亡。这个工作是如此简单,据说连北京电视台都做过。

古人说“为往圣继绝学”,很多现代人也追求用某种特定理论来指导实践,好像不用这个理论就对不起别人一样。科学家不从绝学出发,而选择从证据出发的根本原因不仅仅是科学尚未达到找到绝学的程度(物理学家仍未找到统一理论),更是因为就算有绝学也无法解决所有问题。就算我们完全知道人脑中每一个原子,进而到每一个大分子,进而到每一个细胞是怎么回事,也无法从中计算出心理学来——因为这是不同尺度上的问题,这种跨尺度的计算量大到了即使是科幻世界里也不可能的程度。

科学家强调事实。科学放弃了从一套最基本的哲学出发推导所有结论的尝试,改为在每一个领域内就事论事地搜集事实。有人指责科学家说你们相信现代科学理论难道不也是一种迷信吗?但科学家其实不迷信任何理论——很多情况下他们完全用不上什么绝学,唯一做的事情就是把事实搜集在一起,就好像集邮一样。只要有证据,反驳一个理论是非常简单的事情。

但是要想用证据建立一个理论,则要困难得多。只有运气好的时候,科学家才能在大量事实中发现一些有趣的规律,以至于可以向形成科学理论的目标前进一步。

相关性思维

最简单的规律叫做“相关性”。人是如此复杂的东西,我们根本没办法精密计算各种物质致癌的概率,比如说吸烟对肺癌的作用。科学家常用的是没有什么技术含量,不需要任何高科技仪器,更谈不上什么门派的办法:他们直接调查吸烟人群和不吸烟人群的肺癌发病率。

这种研究要把被调查的人分组,比如分成两组:得了这种病的患者一组(叫病例组,case),没有这种病的人一组(对照组,control)。然后考察这两组人在生活习惯、饮食、吃药方面有什么不同。如果你发现患有肺癌的人中烟民比例显著地高于没有肺癌的人,你就得到了肺癌与吸烟的一个正的“相关性”。这个方法很简单,得到的证据却是强硬的。睡眠时间与判断力的关系,孕妇焦虑与小孩任性的关系,出生季节与平均寿命的关系——我们看到的大量科学新闻本质上都是相关性研究。

相关性研究只是科研的初级阶段。但就是这样它也已经超越了我们的思维本能。某些人只要被某地区生产的产品坑过一次,就会认为这个地区的所有产品都不好,他们的发现连相关性都算不上。我们每天看到铺天盖地的各种营养品的广告往往都能找到几个用户出来现身说法,可就是没有一个疗效相关性的数据。“一朝被蛇咬十年怕井绳”,是人这种动物的最自然思维,而使用大规模统计发现实在的相关性这个最简单的科学方法,是我们摆脱童稚状态的第一步。

绝大多数人没有相关性思维。比如在一篇讨伐网瘾的文章中,作者援引“戒网专家”陶宏开的数据说:

中国80%的青少年犯罪与网瘾有关,中国20%的网瘾少年有违法犯罪行为。

在另一篇文章中则有人进一步指出:

济南在押的1500名少年犯中,80%是“网瘾”造成的,北京更是有90%的青少年犯罪案与“网瘾”有关。

我们能否根据这些数字得出结论说网瘾人群比没有网瘾的人群更容易犯罪呢?

不能。我可以构建这么一个国家,这个国家80%以上的青少年有网瘾,而这个国家的所有青少年,不管有没有网瘾,都有20%的犯罪概率。这个虚拟国家完美符合以上数据,但是它的犯罪与网瘾完全无关。实际上,如果你把“网瘾”改成“钱”,甚至“空气”,那么我们可以说“中国百分之XX的青少年犯罪者都缺钱/需要空气,中国百分之YY的缺钱者/需要空气者有犯罪行为”,而缺钱和需要空气不是毛病。

这个错误就是没有建立对照组。我们缺少的关键数据是没有网瘾的青少年的犯罪率,以及没有犯罪的青少年的网瘾率。这是一个非常常见的错误。这就好比说列举再多“发达的民主国家”,也不能说明民主与发达的相关性,你还必须统计那些不发达的民主国家、不民主的发达国家、和既不发达也不民主的国家。

怎样发现因果

发现相关性,已经是一个足够发表的科学成就,但相关性结论并不能指导实际生活。假设我用无可置疑的统计事实告诉你“吸烟的人更容易得肺癌”,而你不想得肺癌,那么你是否能推论出应该因此戒烟呢?

还是不能。因为你无法从“吸烟的人更容易得肺癌”和“肺癌患者大部分都爱吸烟”这两个统计得出“吸烟导致肺癌”这个结果。也可能肺癌导致吸烟,比如说也许癌变的肺会使人对烟产生需求。也可能存在某种基因,这种基因会使得一个人天生就容易得肺癌,而这种基因同时还让一个人天生就喜欢吸烟。也可能吸烟的人往往是喜欢深夜工作的人,是深夜工作导致肺癌。也可能吸烟的人往往是经济状况比较差的人,其居住环境和营养不行,是贫困导致肺癌。

有相关性未必有因果关系,这是一个非常重要的思维。中国青少年网络协会和中国传媒大学调查统计研究所发布的《2009年青少年网瘾调查报告》是一份值得发表的研究,因为其中给出了一些明确的相关性数据,比如:

对自己学习成绩评价越不好的在校学生中,网瘾青少年的比例越高。认为自己“成绩较差”的学生中,网瘾青少年的比例达到28.7%,认为自己“成绩一般”的学生中,网瘾青少年的比例为14.5%。而自我评价“成绩很好”和“成绩较好”的学生中,网瘾青少年的比例均在11%左右。

那么,根据这份报告我们能否得出结论说网瘾是个坏东西呢?

不能。也许并不是因为网瘾导致青少年成绩差,而是那些成绩差的青少年更容易得网瘾。报告没有统计网瘾与犯罪率的关系,但就算真的是越有网瘾的人群越容易犯罪,我们仍然不能说网瘾导致犯罪。比如我可以提出这么一个假说:

我认为网瘾是个好东西,因为它可以减少青少年犯罪。在任何国家的任何时候,都有一帮青少年对学习不感兴趣,整天无所事事。他们喜爱在街上游荡,都是潜在的犯罪者。因为网络游戏的出现,相当一部分这样的人被留在了家中和网吧里,他们的野性在游戏中得到了发泄,以至于减少了出去犯罪的欲望和时间。

报告和前面提到的所有统计数字都无法反驳我的这个假说。我甚至可以用这份报告支持我的假说。报告中提到一个有意思的统计是“在社会经济发展水平低的城市,网瘾青少年的比例更高”,这正好可以说明无所事事的人更容易得网瘾。

想要明确证明吸烟导致肺癌,唯一的办法是做实验。找完全相同的两组健康的人,让其中一组吸烟另一组不吸,其他各方面生活都完全一致。20年之后如果吸烟组中的肺癌患者数高于不吸烟组,那么鉴于这两个组的唯一区别就是吸烟,我们就可以断定是吸烟导致了肺癌。

可是现实世界中根本不存在“完全相同”的两组人,这种理想实验无法进行。好在科学家有一个退而求其次的巧妙办法:找一群人,然后完全随机地把他们分为两组去做实验。在样本数足够大的情况下,随机性可以保证任何不同因素都可以大致均匀地分配到两个组里。这就是在关于人的研究中最重要,也是最可靠的办法。然而世界上不存在绝对完美的随机实验,比如为了让实验结果具备推广价值,样本应该尽量多样化,男女老幼,各种收入状况,各个种族都有才好,但这其实很难做到。很多实验心理学家选择的样本全是在校大学生,他们的结果能推广到所有人吗?有人对此讥讽说他们研究的心理学应该叫“大学生心理学”。

更大的困难在于,大多数情况下你不能拿人做试验,比如不能逼人吸烟。这时候就只能被动地集邮,而通过纯粹的被动调查来做研究的方法叫做流行病学(epidemiology)。最容易的流行病学研究是所谓回顾性(retrospec-tive)的问卷调查:先找到病人,然后询问并比较他们的生活方式。这种调查的难度在于病人对自己以往生活的回忆常常不准确,甚至是有偏见的。他们可能会自己推断出一种病因,然后刻意地强调这种病因。就好像想要讨好医生一样,那些得了肺癌的人可能会夸大自己的吸烟史。一个更可靠的办法是前瞻性(prospective)调查。比如说科学家想知道核辐射对人体的损害,现在日本地震导致核泄漏之后哪些地区的哪些人受到了辐射是非常明确的,根本不用对他们进行问卷调查,自然也就没有偏见。有了干净的初始数据,科学家只要长期跟踪这些被打了核辐射标签的人群,再跟正常人对比,就可以知道辐射对人体的影响。可是这里的困难就在于“长期”,核辐射的影响也许几十年才能看出来,那时候也许病人还没死科学家已经先死了。

比如“孕妇焦虑与小孩任性的关系”这个研究,唯一可行的办法就是流行病学的调查,你不可能拿孕妇做实验。一篇2008年的论文是回顾性的,研究者找到一个治疗儿童多动症(ADHD)诊所的203个6~12岁的孩子,研究员询问他们的妈妈怀孕的时候是否有过心理压力,结果发现怀孕时心理压力越大的妈妈,其孩子的症状更明显一点。这就是一个不太可靠的研究,有谁准确记得自己6年前的心态?多动症儿童的妈妈很可能会为了配合一个理论而高估自己当初的焦虑。

而一篇2011年的论文则是前瞻性的。研究者先锁定了澳大利亚某地的2900名孕妇,在怀孕的时候记录下离婚,搬家之类容易让人产生压力的事件。等她们的孩子长到2岁以后,再看其中哪些孩子有多动症。这个研究就可靠得多了,而可靠的代价是研究要进行多年。

要想从流行病学研究中发现因果性,就必须尽可能的统计各种影响因素。怀孕压力与小孩多动症的相关性数据并不能直接说明压力导致多动症——也许那些在怀孕期间离婚的女人本身生活就不靠谱,是她们的不靠谱导致了孩子的多动症。所以这两篇论文都统计了一些其他的因素,比如孕妇是否吸烟喝酒啊,怀孕年龄啊,收入状况啊这些数字,然后使用统计方法把这些因素考虑进去,最后的结果才更有参考价值。可是你不可能统计所有的可能性,实际上两篇论文统计的项目就并不一致。这就需要把一系列论文放在一起综合分析。

不管调查到什么程度,都只是对真实世界的管中窥豹。科学研究的是有限的真理。当一篇论文说什么东西可能或者不可能导致什么疾病的时候,它说的其实是在这次研究所调查的这帮人里面有这么一个结论。这个结论能推广到所有人群吗?记者一定比科学家更乐观。

科学的目标

得到因果性远远不是科学家的目标,科学不是一本写满什么东西会导致什么现象的菜谱。好的科学除了能证明因果关系之外,还必须有一个机制,得能解释为什么会有这种现象。比如二氧化碳增多导致全球变暖,其机制是二氧化碳是一种温室气体,它能够吸收从地面反射回空中的红外线,再把这个能量辐射出去促使大气温度升高。

相关性思维和因果性思维只是思维方式的转变,科学研究的真正关键在于发现机制。你必须说明是吸烟导致肺变黑,而变黑的肺容易得癌症,还是烟草中有什么化学物质可以直接致癌(正确答案是后者)。机制提出来之后,这个机制中的每一步也必须是可以验证的,一个课题只有做到这个程度才算超越了集邮阶段。也只有到了这个程度,才真正谈得上把各种不同机制综合在一起建立模型去预测未来。

有时候这个过程会反过来,也就是用现有的机制理论推导一些现象,再去寻找证据证实。但探索未知最基本的科学方法是证据,然后谋求建立因果关系,然后是提出机制。仅仅是对其中一步作出很小的贡献,就可以发论文。大部分这样的论文事后会被证明没有太大意思,甚至是错误的。比如研究孕妇焦虑与儿童多动症的论文虽然有好几篇,但它们说的其实是一个非常微弱的效应,也许将来我们会发现儿童多动症的真正原理根本就不是孕妇焦虑。但科学就是这么一个不断试错的过程。

每一篇论文都是我们从个人感觉到客观事实,从客观事实到因果关系,从因果关系到能推广使用的机制,这个过程中的一小步。这个过程的每一步都不是完美的,但只有这么做,我们才能摆脱童稚状态。

***

谨以此文标题纪念王小波。他曾经在这个标题下讲述过类似的道理。可惜大多数人只记住了他文章的结论和价值取向,而没有学会他使用的方法。

怎样才算主流科学?

“主流科学”在很多情况下并不是一个好词儿。科学记者眼中的主流科学界也许是一座可以威慑众生的殿堂,而对那些敢想敢干的年轻人来说,你跟他说主流科学认为这件事应该是这样的,他的第一反应是怎么证明这是错的。“主流科学”,在某种意义上是故步自封甚至以权压人的代名词。比如2011年诺贝尔化学奖得主谢赫特曼,在做出其获奖工作(发现准晶体)后相当长的一段时间内,就曾经饱受“主流科学”的打击。据《新京报》一篇文章报道:

他面对的是来自主流科学界、权威人物的质疑和嘲笑,因为当时大多数人都认为,“准晶体”违背科学界常识。“当我告诉人们,我发现了准晶体的时候,所有人都取笑我。”,谢赫特曼在一份声明中说。

这个报道不能算说错。谢赫特曼本人的一个采访视频说的可能没有这么夸张,但仍然有点悲愤的情绪。准晶体被发现了,主流科学界却没有接受。既然如此,那么现在主流科学界拒绝接受的很多东西,将来是否也都有可能被证明是正确的呢?“主流科学”到底是不是一个贬义词?

本文试图通过仔细分析这个事件,来说明一个关于科学进步的道理。当然根据孤证不举的精神,你不能讲一个故事就说明一个道理,所以我们讲三个故事。

在谈论诺贝尔奖之前,我们先看主流科学是怎么让一个著名理论得不了奖的。

大陆漂移学说的故事

在《难以忽视的真相》纪录片的一开头,戈尔说了一件相当令人感叹的事。他说他六年级时候的一位同学,曾经在课堂上面对世界地图当场指出南美洲大陆似乎曾经跟非洲大陆是一体的。这其实就是大陆漂移学说,现在已经成了科学常识。然而戈尔上小学的那个年代这个学说还没有被“主流科学”接受,以至于他的老师立即告诉学生这纯属无稽之谈——根据戈尔说的戏剧性结局,后来这位具有非凡眼光的学生成了一事无成的毒瘾者,而老师却成了布什政府的科学顾问。

也许某些教育专家会痛心疾首地说“你看,天才就这么被扼杀了”。可是如果你是一个科学老师,你会怎么样呢?不管别人提出什么新奇的想法,你都鼓励“是啊,这真是个有意思的想法,我认为它有可能是对的”吗?可是这样一来你所能提供的有效信息其实等于零。“一切皆有可能”,就是一切都不太可能。真正的科学家应该敢于直截了当地告诉别人哪些想法不可能正确——总统科学顾问更得有这个气质。哪怕最粗暴的判断,也比廉价的鼓励值钱。

早在1912年,也就是戈尔的小学同学出生之前,魏格纳(Alfred Wegener)就提出了大陆漂移假设,认为地球大陆最早是连成一片的。传说他也是看地图得到的灵感,但魏格纳并不是用小学生思维搞科研。除了各个大陆的形状看上去似乎能合在一起,他还有其他证据。一个很有说服力的论点是各大陆发现的古生物化石惊人地相似,乃至一些现代生物也是如此。鉴于这些生物不太可能渡海走那么远,唯一的解释似乎就是原始地球上这些大陆本是连在一起的。更进一步,人们发现几个不同大陆上有相同的岩石构造。不但如此,漂移学说还可以解释一些此前人们想不通的问题,比如说南极大陆上为什么会有煤——要知道煤是古代植物累积形成的,南极那么冷怎么会有这么多植物?

面对这么多证据,一般人也许会认为大陆漂移是显然的。但科学家不是一般人。卡尔萨跟说,“Extraordinary clainms require extraordinary evidence”。超乎寻常的论断需要超乎寻常的证据。生物化石最多只能算间接证据。而一个论断想要被科学界全面接受,除了要求超乎寻常的证据,还必须有一个机制。

关键是,科学家想不通大陆是怎么漂移的。比如分裂大陆需要极大的能量,这些能量从哪里来?魏格纳曾经提出几个假说,都被一一否定了。结果大陆漂移学说在半个世纪内都是被主流所否定的。一直到后来人们发现地质板块边缘火山喷发和地震可以提供能量,并且的确发现了火山曾经在不同时期喷发的证据。再加上其他证据,比如发现海底岩石比陆地岩石年轻,才以“板块构造理论”承认了大陆漂移。这时候魏格纳已经死了。如果今天论功行赏,魏格纳提出的东西只能叫做“假说”,甚至连科学理论都不算。

这还是听起来合理的理论。而那些听起来不合理的理论,则就算你有证据也不太容易被接受。当然,好消息是这样的理论一旦被接受,没准就是诺贝尔奖。

诺贝尔化学奖的故事

历史就好像非诚勿扰舞台上的女嘉宾。你离着很远看,和把她领回家细看,看到的东西都是真实的,但你可能会有不一样的人生感悟。新华社的报道相当简略。我们如果把谢赫特曼的讲话视频、一篇被广泛转载的英文报道、一个背景知识的介绍以及以色列某杂志的一篇写得非常牛的长篇报道放在一起看,就会看到一个更有意思的故事。这个故事的每一步都值得深思。

谢赫特曼于1982年在国家标准局的本职工作并不是去探索晶体科学的新突破,而仅仅是为航空工业寻找合金材料。不但如此,当时晶体理论已经相当成熟,什么样的原子对称结构能形成晶体是明明白白地写在教科书上的。人们根本没指望发现新的晶体形态,就算发现也轮不到谢赫特曼。

某天上午,谢赫特曼用电子显微镜测定了他自己合成的一块铝锰合金的衍射图像,发现是一个正十边形的对称结构——对寻常晶体来说这是一个不可能的对称性,因为从数学上很容易证明你不可能用正十边形(或者简化到正五边形)去周期性地铺满平面。谢赫特曼认为这是一种全新的晶体,它的特点就是只具有准周期性,也就是“准晶”。

如果我们只看简单的新闻报道,下面的故事就是谢赫特曼跟每一个同事通报这个新发现,但是没人相信他,人们都认为晶体就应该是周期性结构,实验组领导指着教科书说他胡扯,然后把他赶走了。但这里有一个问题:衍射图像是明摆着的,难道他的同事们连十都不会数吗?

事实上,同事们对他的这个衍射图像有一个解释:孪晶。人们早就知道孪晶可以出现类似正五边形旋转对称的衍射图像,但并不是一种新晶体。谢赫特曼进一步观察,他找不到孪晶,坚持说这是新晶体。现在的局面是同事们相信这种衍射图像有一个解释,谢赫特曼不接受这个解释。但不利的是,他也不能提供别的解释。

科学要求解释。你不能说“我看到这个现象,而你们解释的不对,所以它一定是个新东西”。全世界的实验室中可能每天都会产生一些看上去不太对的实验结果,它们中的大多数是……不对的。一个有个人荣誉感的科学家不会看到什么都发文章,你得给出一个理论。1983年,布勒希(Ilan Blech)帮谢赫特曼搞出了一个数学模型,两人这才决定发表论文,结果被APL编辑拒稿。接下来谢赫特曼回到国家标准局,在卡恩(John Cahn)的帮助下进一步完善了数据,然后找到一位真正的晶体学家丹尼斯(Denis Gratias)入伙,最后文章被PRL发表。

到这一步,“准晶”这个发现才算被正式的提了出来。谢赫特曼在论文中详细说明了这个特殊合金的制备过程,使得很多实验组重复验证了他的发现。然而一直到这一步,仍然只有少数科学家接受这是一种新晶体。

关键在于,谢赫特曼实验使用的是电子显微镜,而晶体学界的标准实验工具是更为精确的X射线,他们不太信任电子显微镜的结果。不能用X射线的原因是生长出来的晶体太小。一直到1987年终于有人生长出足够大的准晶体,用X射线拍摄了更好的图像,科学家中的“主流”才接受了准晶的发现。这才是真正的转折点。等到人们在实验室中又发现各种别的准晶体,乃至于在自然界发现了天然准晶,准晶就已经是绝对的主流科学,谢赫特曼也开始什么奖都能拿了。

回顾整个过程,我们并没有看到所谓“学术权威”在其中能起到什么打压的作用。的确有个两届诺贝尔奖得主至死都反对准晶,但并没有听说他有什么徒子徒孙为其马首是瞻。搞科研不是两个门派打群架。科学家之所以从一开始就质疑,恰恰是因为证据还没有达到“超乎寻常”的地步。而当X射线图像一出来,不管那个诺奖大牛怎么说,“主流”立即就接受了。

被主流科学“打压”,一般不会上升到人身攻击的地步,除非你的理论侮辱了“主流科学家”。比如说要求他们洗手。

洗手的故事

1840年代欧洲医院受到产褥热的困扰。1841年到1846年,维也纳最好的一家医院里,产妇死亡率居然达到十分之一,到1847年甚至是六分之一。青年医生塞梅尔魏斯(Ignatz Semmelweis)决心找到解决办法。他判断,当前这帮所谓“主流医生”根本不知道是什么导致产褥热。有些医生声称他们知道,而且还头头是道地列举原理,但他们就是解决不了问题。

塞梅尔魏斯的办法是索性抛开主流医学,干脆直接上数据分析。通过大量统计,他发现一个最不可思议的事实:如果产妇在家里生产,她的死亡概率比去医院至少低60倍!哪怕最穷的女人,在街上生了孩子再被送到医院的,也没有得产褥热。这使塞梅尔魏斯怀疑导致产褥热的不是别的,正是医院。

塞梅尔魏斯所在的医院有两个分开的病房,其中一个主要由医生负责,另一个则是助产士负责,产妇则被几乎随机地分配到这两个病房。塞梅尔魏斯暗中统计,发现医生负责的病房,产妇死亡率是助产士负责病房的两倍。难道是医生让产妇得病的吗?他对这个问题百思不得其解。直到一个教授在指导学生解剖尸体的时候被学生的手术刀划到,然后患病死了,症状与产褥热相似,塞梅尔魏斯才获得灵感。他推测,是医生们离开解剖室直接进病房把致病的“尸体颗粒(cadaverous particles)”带给了产妇。

而当时医院无比热衷于解剖,病人死了之后立即,这可能就是为什么之前的时代没有这么流行产褥热。

于是塞梅尔魏斯要求医生解剖后必须洗手,结果产妇死亡率马上降到了百分之一。

如果现在哪个医生能有这样的成就,说他是华佗再世也不为过,但塞梅尔魏斯的结局是直接被主流医生“逼”疯了。塞梅尔魏斯不能解释“尸体颗粒”是什么东西,当时的医学并没有微生物传播疾病这个概念。塞梅尔魏斯摆平了自己的医院,但其他医院的医生根本不买账,尤其反感他把病因归罪于医生。在塞梅尔魏斯看来这些医生是在迫害自己,他甚至自诩弥赛亚,最后居然得了精神病,死得很惨。

一直到二十年以后,医学界才接受“微生物能传播疾病”这个理论。而塞梅尔魏斯?没人拿他当科学家,科学史只记载了发现微生物的人。顺便指出,一直到现在,医生仍然不怎么爱洗手,至少不如护士洗得多。

一个道理

在以上三个故事中,主流科学到底做错了什么?我的答案是什么都没做错。谁说对的理论一出来别人就得马上承认?

如果“主流科学”是一个人,他既不是仙风道骨的中国世外高人,也不是充满圣洁光辉的西方牧师,更不是温柔妩媚的小姑娘。他是一个淳朴实在的中年汉子。他认为任何事情背后都必须有明确的答案,明确到他可以把这答案原原本本地写在纸上让你看懂。他从来不让你“顿悟”,他从来不让你“信则灵”,他从来不让你“猜”。他有什么说什么,不跟你打机锋,不跟你玩隐喻,不跟你玩暗示。他不敢肯定自己的答案一定正确,但他敢用最明白的语言跟你辩论,一直说到你服为止。

或者你把他说服。科学研究是一个充满争论的过程。科学家要是不争论,科学就死了。比如几年前有实验号称发现了超光速中微子,就引起了科学家的巨大争论,有人甚至提出各种理论解释,最后被证明不过是实验错误。统计出来的东西尤其不能作为成熟理论,而只能作为科学研究的缘起。科学研究就是这么一个把新思想逐渐变成主流的过程。从这个意义上讲也许真正活跃的科学根本就没主流,或者说主流科学都是死的科学,更严格的说是凝固了的科学。

怎样才算主流科学?你必须得能用现有的理论去解释你的新理论。如果主流科学是一棵大树,你的新理论不能独立于这棵树之外。你必须告诉别人这棵树的这几个位置可以长出这么几个树枝来,而这些树枝可以连接到我的新理论上去——这样你的理论就成了这树的一部分。有时候你甚至可以宣布某个树干的真实形态其实不是人们之前想的那样,但你不可能宣布这棵树整个长错了。

凯文·凯利(Kevin Kelly)在《科技要什么》(What Technology Wants)这本书里提到,早在哥伦布去美洲之前,美洲大陆就已经有人了,可是为什么我们说是哥伦布“发现”了美洲呢?因为是哥伦布把美洲大陆这个知识和人类科学的“主流知识”联系在了一起。“孤岛式知识”是不行的。

只此一家,别无分店。什么新东西都得从我这儿长出去,这就是科学的态度。这种态度干掉的错误想法比正确想法多得多,比如“水变油”、永动机、黑洞发电之类。只有这样的态度才能建立一个高效而严谨的学术体系。也只有这个体系才能确保一个实验结果可以经得起在任何时间任何地点的重复,一个技术可以随便复制使用,既不要求使用者道德高尚、人格完美,也不要求他掌握什么不可言传的心法。

如果经络和“气”能用实验证明,诊脉能机械化,阴阳运行能用数学方程描写,一直到《伤寒论》能出一个基于现代医学的解释版,那么中医就可以成为主流科学。将来谁能做到这些,谁就“发现”了中医。也只有这样,中医才能抛开掌握绝学的少数老师傅,变成像青霉素那样任何一个医院都能随便使用的有效技术。

如果“主流科学”真是小姑娘的话,向她求婚并得到许可并不容易。有时候可能你是对的,但她就是不理解,你悲愤也没用——可是你也不能因此就说她不是女人啊。

推荐阅读更多精彩内容

  • 传说 传说 “河图”、 “洛书”是华夏文化的源头。 《易·系辞上》说:“河出...
    赵荣斌阅读 515评论 8 26
  • 现代科学通过高精度高分辨率的太空望远镜,发现了整个宇宙的面貌和我们人类及哺乳动物的大脑神经系统是一模一样的,最后得...
    三圣阳明文化书院阅读 815评论 6 27
  • 【一】 最近,刷抖音变成了每天的必须,有浪费也有收获。浪费的是时间,确实一不小心大把的时间就被一条又一条的吸引人的...
    九根葱阅读 773评论 9 19
  • 大家好,我是江文,今天探讨一下科学的尽头“神” 在我们大多数人的理解当中,神学就意味着迷信,那如果在现在21世纪,...
    江文带你看世界阅读 351评论 3 13
  • 开悟经历 悟道人R的开悟经历(世间法篇) 一、缘起 以前的我,特别抵触传统文化,认为四书五经都是糟粕,认为宗教信仰...
    引柱15367243319阅读 431评论 2 17