201512-对伪心理学说不

这是一本心理学的普及读物。不过他并没有对心理学所取得的成果做多少普及性的介绍。而是把焦点集中在为什么说心理学是一门科学,作为一门科学,它必须满足了怎样的标准。

所以,这本书更应该被看成一本科学方法论的入门书。里面介绍的思维工具,是所有的科学都应该遵循的原则。运用这些原则,我们可以更加清晰地判断哪些是科学,哪些是伪科学。

事实上,科学心理学已经在科学实证的道路上走了很远了。而大众眼中的心理学,还停留在两大类。一是以佛洛依德为代表的精神分析类书籍。二是以张德芬《遇见未知的自己》为代表的励志自助读物。

但是,当你运用本书的原则以后,你会发现,这两大类心理学,都不符合科学的标准,并不是科学意义上的心理学。

你可能要问一个问题,那什么才是科学的心理学?

最简单的答案恐怕要至少包含两点。

一是科学心理学采用的是科学的研究方法,这个研究方法跟其他学科,比如物理、生物并没有什么不同。

二是科学心理学得到的理论大都是概率性的,目前,它还不可能准确预测每一个临床个体的行为。

Over。


附:读书笔记

书本安利完了,然后我根据书本框架的简单的串一下书本的内容。

科学的目的,可以简单地理解为寻找世界上存在的各种因果关系,然后利用这种因果关系,用于预测。它有三个标准。实证主义;公开可重复,经过同行评议;可证伪。

那么如何才能找出真正的因果关系。由于世间的万事万物都有联系,那么为了找出真正的因果,则必须想办法将所要研究的变量分离出来,单独探求该变量对事件的影响。科学上,通常采取控制和操纵实验的方式,来分离变量探求影响。这一套方法,也被叫做科学方法。

任何理论,只有通过这一套科学方法的检验,才可以被称为科学。比如争吵已久的中西医之争,实际上也不是要废中医,而是要将中医用这套科学方法来重新检验,从而找到中医中符合科学的部分。

心理学也一样,必须通过这一套科学方法的检验,才可以被称为科学。

第一章 心理学是一门科学

1.本章指出现代心理学已经是一门科学。是一门用科学方法研究人类行为的科学。

但是这门科学目前还只是许许多多较为零散的理论,还没有一套经过整合的宏大的理论体系(虽然目前,经过心理学家的努力,其理论体系的统一性已经有所增强)。

但是,这个困境并不是心理学所独有,其他科学也尚在整合当中,不断的整合,本来就是科学的进程。

2.零散的尚不成体系的科学也是科学,而科学则有科学的标准。

——科学必须是实证主义的。即科学必须建立在可以观测的现象之上。

——科学必须是公开的。即这种可以观测的现象不能是个人化的,而必须是别人也可以重复的,也就是具备可操作性(实际上,实证主义必然推出可重复和可公开化)。

——科学必须是可以证伪的(实际上,可证伪的基础也是实证主义,因为只有实证的事件才有可能被证伪)。

这有两层含义。一是实证主义。理论预测的,必须是可以观测的事件。因为只有可以观测到的事件才是可以证伪的。二是理论框架本身要是可以证伪的。不能证伪的理论没有意义。比如我提出两条腿的动物都有两条腿,这就是一个自圆其说的理论,不可能被证伪,理论也就没有意义。

3.佛洛依德作为公众心中最著名的心理学家,其实并不代表科学心理学,其代表的精神分析理论已经是100多年前的事了。

他的精神分析理论在以下几点上,并不符合科学的标准。

——理论不能用于预测,但却可以事后解释所有事件,造成理论不能被证伪。

——用个案来证明理论,而不是控制实验。

现实生活中的变量非常之多,除了佛洛依德关注的那个变量以外,还存在许多可能对结果造成影响的变量。

那么仅仅用个案而不是控制实验,就无法排除该结果是由关注以外的某个变量引起的。

——作为一个科学的理论,其研究数据和理论之间的联系是一定要满足某种标准的。而佛洛依德的研究数据和理论的联系并不满足该标准。当然,本书并没有细说这种标准是什么,以及佛洛依德的数据为什么不够支持他的理论(但是本书给出了该说法的参考文献)。

第二章 科学的一个重要标准 可证伪性

本章对科学标准之一,可证伪性做了具体分析,并举了一些例证。

可证伪性,要求理论必须可以做事前预测,并且预测的是可以被观测到的事件,以便随时被证伪,然后被修正,然后用修正后的理论再次预测。

佛洛依德精神分析理论之所以无用,是因为其虽然有着庞大的理论框架,但是只能用于事后解释,而且可以解释所有事件。既无法事前预测,又可以事后解释所有事件,使得该理论不可证伪,缺乏科学性。

第三章 科学的一个重要标准 操作主义

本章指出科学的另一个标准,操作主义。

操作主义实际上保证了科学的另外两个标准——是实证主义并且公开可重复的。

1.操作主义。科学是操作主义,而不是本质主义的。即科学没有办法回答“本质上是什么”(本质主义)这个问题,科学概念的定义是不断演进的,但是每个阶段都必须与现阶段可以被观测到的事件相联系。

我们用可以观测到的事件来定义科学概念(实证主义),而这种可观测的事件,是每个人都可以重复观测、操作的,这就使科学概念从一种他人无法复制的个人化感觉中分离出来,变得标准化和公开化。

2.我们在用操作主义定义科学概念的时候,必须注意两个标准,效度和信度。

信度。即与该科学概念相联系的事件比较很稳定,也就是说当你用一套操作标准去测量该概念,得到的结果必须很稳定。比如用同一套IQ测试题去测某个人的IQ,每次得到的分数都应该差不多。

效度。即该操作标准能够测量你所要测量的概念。测身高的仪器拿去测IQ,无疑很稳定,但是完全无意义。

3.图灵问题是可操作主义的一个绝好例子。

——本质主义者试图尝试从本质上定义什么是智能。

——操作主义者则放弃了这种努力,直接定义了一种被观测的场景,该机器是否能够和人进行智能对话。我们可以想象有一天,也许有机器能够达到这种操作标准。但兴许我们依然不认为该机器拥有智能,那到那一天,我们就可以将智能的概念进一步演化,提出更进一步的操作化定义。

也许我们永远都不知道智能本质上是什么,但是这个不重要,重要的是在这种操作定义下,机器无疑正在变得越来越智能。

4.在心理学领域,所有我们熟悉的那些词汇,比如智商、焦虑..都有自己科学上的操作性定义。我们需要注意的是,这种操作性定义往往与我们平常所说的这个词汇的意思不大相同。

我们平常所说的那些词汇,往往是个人化的感受,缺乏可操作的标准。比如你理解的智商和我理解的智商,往往不太一样(比如一个数学不太好的画家,能否被称为高智商,每个人的回答都可能不一样)。

只有当一个概念具备可操作性的定义,它才是个有意义的科学问题。比如“动物有感情么”,要使这个问题变成一个科学问题,我们必须对“感情”这个词汇下一个可操作的定义(注意,不是本质上的定义,而是一系列可以被观测到的事件),比如在某个场景下血压会不会升高等一系列生理指标。

也许你不并同意这个操作性定义,没关系,你可以对它进行改进,因为这个操作性定义是可以不断演化的。

但是首先,我们在讨论一个科学问题以前,必须先给它一个操作性的定义,这个操作性的定义让问题变得公开化、标准化,变得具备讨论的基础。

第四章 个案和见证叙述是没有科学性的

本章指出个案和见证叙述是没有科学性的。

1.个案在科学研究的早期是有价值的,因为它可以提示那些变量需要被研究。

但是在试图建立理论的时候,个案是缺乏科学性的。原因有:

——个案缺乏比较,并不能排除其他的可能解释(即不能排除是因为其他变量引起的,因此科学上必须设法对其他变量进行控制)。

——心理学理论是概率性的,因此总是存在于理论相悖的个案。

2.在临床医学和心理学上,个案之所以缺乏科学性,是因为存在“安慰剂效应”和“自愈效应”这个两个变量,而个案没有办法对这两个变量进行控制,不能排除结果可能是由这两个变量引起的。

3.鲜活性效应。由于“鲜活性效应”存在,个案作为并不科学的证据,往往被错误地过分倚重,我们必须要克服这种错误倾向。

对“鲜活性效应”的正确应用,不是在证明理论上,而是在阐述理论上。我们应该用科学的方法来证明理论,然后用生动的个案来阐述理论,让公众接受。

第五章 相关并不代表因果

本章讨论了相关不代表因果的三个原因。

1.方向性

变量A和变量B相关。但到底是A造成B?还是B造成A呢?这是没办法直接从相关性中得出结论的。

2.第三方变量

变量A和变量B相关,但是A和B之间可能没有直接的因果关系。很可能是一个第三方变量C,分别和A相关和B相关。

3.选择性偏差(即因为统计样本被进行了选择,而造成的偏差)

“方向性”和“第三方变量”都是真相关,但是不代表因果。而“选择性偏差”是一种假相关,是由于样本经过了一道自我选择从而不够有代表性造成的假相关,也就更加没有办法反映因果。

4.“选择性偏差”的一个著名例子

二战时有一个飞行分析师,他分析了一些轰炸机归来后,机身的弹孔分布情况,发现某些地方弹孔多,某些地方少或者没有。有些人会以为,应该在弹孔多的地方增加防弹加固板,因为从归来的飞机来看,这些弹孔多的地方肯定容易被击中,所以应该重点防备。

可是这样就犯了选择性偏差的错误。因为你做分析时所用的样本并不具有代表性,已经经过了一道自我选择,一部分飞机已经坠毁。

因此,你仅仅在归来的飞机上(经过选择的样本上)做统计分析,就可能得出错误的结论。

正确的做法是要在无弹孔或者少弹孔的地方加固,因为那些地方中弹的飞机都没飞回来。

5.相关虽然不代表因果,但是相关本身也是很有价值的。比如大数据,事实上,就是一种相关。当我们的目的仅仅是预测,而不是找出因果的时候,有相关就足够了。

第六章 如何从相关性中找出真正的因果

在上一章节的基础上,进一步讨论了如果相关不代表因果,那么如何在相关中找到真正的因果。

1.由于存在“选择性偏差”和“第三方变量”,你要从相关性中找到真正的因果,则必须进行控制和操纵实验。

——控制。即采取各种手段控制其他的变量BCD...的保持不变。比如在选择样本的时候要具有代表性,从而避免选择性偏差。比如在分配实验组和对照组的时候遵循随机原则,从而最大程度保持两组的变量基本一致。

——操纵。即在控制其他变量不变的基础上,操纵你要考察的那个变量A进行变化,看能否得到不同的结果,从而得出A是否与结果具有因果关系。

2.实现控制和操纵的最好办法就是在实验中设置实验组和对照组进行比较。

——随机分配样本,使得实验组和对照组的变量保持一致。

——同时对实验组的变量A进行操纵,并将结果与对照组进行比较。

这也再一次说明孤立的个案和见证叙述,由于缺乏比较,不能控制其他变量的影响,是不具备科学性的。

3.现实生活中,很多变量往往是相互联系的。比如经济水平高的人,往往所处环境更好、营养更均衡、受教育程度更高。

那么为了达到控制和操纵的目的(剔除第三方变量的影响),科学家必须设计一些非自然的实验,从而把要考察的变量分离出来。

第七章 对实验的“人为性”质疑的回应

由于上一章谈到的实验的非自然性(在自然条件下,找不到这样的实验情景),引发了一种质疑,即人为设计的实验得到的因果关系,是否准确,能否应用到真实的生活中。本章对此作出了回应。

1.这种质疑一部分来自于公众对科学研究方法的不了解

实际上,非自然性不是实验的缺点,而是实验的优点。因为在自然条件下,各种变量往往互相联系,也就无法对变量进行分离考察。

正是由于种种设计巧妙的非自然实验,我们才能够把变量分离出来,单独考察它对结果的影响。

2.这种质疑一部分来自于人们对于很多心理学实验取样的非随机性(比如很多实验都用大学生做样本,那么质疑就是大学生能否代表所有的人群)。

实际上,是否随机取样,是取决于不同的实验目标的。

——在某些实验中,我们假设大学生与其他人群的不同变量(比如年龄、经济水平),对实验的最终结果没有影响。

比如在医学中,用某个大学生做实验得到的骨骼构造,也同样可以推广到所有的正常人身上。在骨骼构造这个目的上,并不因为实验样本是大学生,而无法推广至所有人去。

——在某些实验中,仅仅用大学生做样本,确实可能存在一些问题。

但是。

首先,这并不能说明研究出来的结果是无效的,只能说需要更多实验来证明该结果具有可推广性。

其次,即使在推广中得到了与理论不同的数据反馈,我们也不会完全否定该结论的价值,而是会根据该反馈,对理论进行完善。

3.这种质疑一部分来自于公众对科学研究类型的不了解

科学研究可以大致得分为理论研究和应用研究。

应用研究的目的是为了预测具体环境下的事件,那么具体实验情境就会比较重要。

理论研究的目的是为了发展完善理论,那么具体的实验情境就不重要,理论并不会因为你的实验是人工还是自然而有所不同。理论对应用是一种间接的价值。

4.科学界对“人为性”质疑的实质回应。

事实上,科学界是最乐于自我批评的一个领域。某些实验的样本非随机这个问题,早已经被科学界考虑在内。

——比如在不同的群体中进行可重复实验。

——比如在理论模型中加入年龄变量。

——比如在心理学中进行跨文化研究。

——比如巧妙地设计一些自然情景下的实验,最直接回应“人为性”的质疑。

第八章 科学的两个原则——关联性和聚合性

1.关联性。

科学的发展,新理论的提出与旧理论总是关联性的,是在旧理论基础上的进一步发展,而不是对旧理论的否定。

即便是有着巨大飞越的爱因斯坦的相对论,在微观层面上,跟牛顿力学也是吻合的。

关联性也是判断是否是伪科学的一个重要标志。

2.聚合性。

科学理论的发展,往往不是靠某一个完美的实验,而是一堆并不完美的实验聚集在一起所形成的聚合效应。这个聚合效应有两个层面上的意思。

——实验A并不完美,但是它排除了某一种可能的解释。

实验B也一样不完美,但是它可以排除另一种解释。

ABCDE…几个实验聚合在一起,就形成了一个比较完善的理论。然后再等待新的实验出现,理论再进一步完善。

——实验A呈现了某种结果,但是实验A设计上并不完美,可能存在某种缺陷,并且现在也无法确定是不是正在因为缺陷,才导致了这个结果。

实验BCD…也呈现了该结果。但是实验B CD…也不完美,但是因为B CD…的缺陷跟A的缺陷不一样,因为你就不能说该种结果正是由于某种缺陷导致的。

或者说某个实验是有缺陷的,但是这个缺陷却正是其他实验的强项。

因此,在无数个实验的聚合效应下,该结果的说服力就得到了进一步的提升。

所以,通常,对某个具体实验的批评,并不影响这个理论,因为理论的发展是由无数个实验聚合在一起后产生的一种共识。这个具体实验所存在的瑕疵,可能并不是没有被意识到,而是已经其他的实验所弥补。

第九章 人的行为往往不是单一原因决定的

前面探讨了如何讲变量分离出来,以探求变量和结果之间的因果关系。

但是现实生活中,人的行为往往不是单一原因决定的,而是多个原因共同作用的结果。

并且,多个原因之间往往会有交互作用。即一个变量的影响效果因为另一个变量水平的不同而不同。

——比如在儿童精神疾病的研究中,ABCD…均是儿童患病的潜在风险,但是研究发现,仅仅存在一项潜在风险的儿童,其患病的几率并不比正常儿童高。但当潜在风险增加至两项时,其患病的风险就超过原来的四倍(这两个潜在风险起了交互作用)。

这个原则很好理解,但是在现实生活中,由于情绪的影响,人们往往会忘记这个原则。尤其是在争辩的时候,人们往往会以某一个原因为立论依据,去攻击其他的原因。

第十章、第十一章 心理学中的概率和统计思维

1.心理学所揭示的所有人的行为,都是以概率的形式表现的。

这也是个案没有科学性的一个原因,因为既然理论是概率的,你就总能找到与之相悖的特例。比如吸烟致癌,但是你总能找到既吸烟又健康长寿的个体存在。

2.接受错误,以减少错误。

理论只对整体趋势有预测作用。

目前,还没有证据表明,临床能够预测统计趋势是否会在特定个体上出现。因为,现实生活中的变量实在是太多,我们并没有简捷的方法可以一一测量。

对临床预测和统计预测的比较研究表明,我们对个体的预测,并不会优于统计预测。因此,在科学意义上,面试这个事情实际上是缺乏效度的。

如果我们接受不能预测个体这个事实,我们在整体预测上反而可以取得更好的效果。例子见红蓝灯实验。

3.概率很多时候是反直觉的,因为我们需要特别的学习,来破除这种错误的直觉。

我们常犯的一些直觉上的错误包括但不限于以下这些:

——赌徒谬论。在硬币连续抛出正面以后,以为下一次出现反面的概率会加大,事实上,每次都是独立事件,跟其他次是正面还是反面都没有关系。

——忽视样本规模对可信度的影响。比如在接触了几个福建人之后,就匆匆对福建人下了定论。

4.我们会有试图解释一切行为的倾向,但是,事实上,很多事情,真的就是偶然、和巧合。

5.统计和概率是认识世界的一门重要工具,是有一定难度的,不是一般的了解就可以掌握的,必须通过深入的正规学习。建议从基础的书籍开始学习。

第十二章是结束语,所以,正式over。

推荐阅读更多精彩内容