社会心理学的实验怎么了?


存在如此问题的实验,却提供了比较正确的结论,这是“歪打正着”吗?我们为此推出专题《“歪打正着”的实验》,希望通过对这三场经典实验的回顾,反思社会科学实验法的某些困境。


其中,本篇回顾的是“罗森汉实验”和“斯坦福监狱实验”。


图片

1971年,津巴多(右一)和部分研究团队成员。图片来自津巴多所创网站“prisonexp”。


“罗森汉实验”揭示了美国二战后精神诊断体系严重缺乏可靠性——医护人员无法识破伪装的正常人,而一个人只要被贴上“精神病”的标签,其正常行为也会被当作病症;“斯坦福监狱实验”则发现了在强大的情境和角色作用下,一个人可能迅速内化施虐或服从的行为,“好人在此过程中也会变为“恶魔”(被概括为“路西法效应”)。“罗森汉实验”和“斯坦福监狱实验”早在发表不久后都曾遭受批评,不过批评都基于研究方法或研究伦理,比如“罗森汉实验”被指过于粗糙,算不上完整的研究,“斯坦福监狱实验”则因为伦理问题一直陷于争议之中。与这些批评不同,这里要说的是近年来才出现的,针对实验的过程和材料的真实性质疑。


“如果人们要说这是一个骗局,那就由他们去说吧,我也不再打算为之辩解了,其实它(实验)的留存时间就是一种辩护。”

这是津巴多(Philip Zimbardo,1933年3月23日-2024年10月14日)生前的最后一次回应。他是“斯坦福监狱实验”策划者,也是影响最大的社会心理学家之一。多年来,多起经典实验被质疑,他是在被质疑后唯一站出来全面回应的研究者。“罗森汉实验”被质疑时,罗森汉(David Rosenhan,1929年11月22日-2012年2月6日)已经去世,我们无法看到他的回应。


津巴多认为,批评并没有提供实质性证据,不能推翻他的结论。他说实验的“留存时间就是一种辩护”,换言之,只要实验留存于世,就足以反驳对实验的质疑。这个结束语看似寻常,实则耐人寻味。


这得从社会科学实验(以下简称“实验”)的特征说起。


图片

本文内容出自新京报·书评周刊4月3日专题《“歪打正着”的实验》B02-03版。


实验的两个身体


虽然人们赋予了知识许多荣耀,可很多时候,接受知识实在是一个痛苦的过程。这种痛苦可能源于知识的乏味,讲者照本宣科,听者却只管打瞌睡;这种痛苦也可能源于知识对我们本身所持偏见的冲击与否认,让人难以承受,只能骂它一派胡言,什么也不是。


图片

电视剧《围城》(1990)剧照。


当然,有一些知识唾手可得,哪怕我们未必知道它是怎样被生产出来的。


以“效应”结尾的概念是一个例子,我们在谈论观点时只要捎上“马太效应”“破窗效应”或“达克效应”,就好像已经透过现象,在看本质。另一个例子是实验。比如“霍桑实验”,它揭示了人一旦意识到自己被观察,行为就会改变;再比如“从众实验”,它观察了群体行为与态度对个体施加的压力。我们且叫这种有统一后缀的知识为“后缀体”。其特征是,在概念构造上就给人一种笃定的气质:它不是某个偶然的、局部的发现,而是对人或社会某方面规律的普遍概括,是一种法则。


什么是实验或实验研究法?实验,即研究者通过主动操纵自变量、控制无关变量,并在受控环境中观察自变量对因变量的因果效应,从而检验理论假设的一种研究方法。


这个定义使社会科学获得了苦苦追求的,有限的科学性。由于社会科学不可能成功效仿自然科学,做不了一场完全科学的实验,于是退而求其次,有的在实验室进行,有的在现实世界开展,有的引入问卷调查方法,还有的混杂着干预研究。其中被认为最接近科学的,是在实验室进行的实验。研究者征集若干志愿者,将他们请进特定的场所参与测试,编入实验组和对照组,有意识地改变一个变量,观察另一个变量的变化,以此推断“什么导致了什么”。由于因果关系是科学的基础,在研究者那里,实验也就获得了它的第一个身体,这是一个理性的、客观的、绝对的身体。


也由此,我们作为接受者会认为实验结论是可靠的、正确的。只不过这不是我们接受实验的全部理由。


图片

电视剧《非常人力资源》(2020)剧照。


我们都听过职场上的年龄歧视问题,现在,假设有以下研究摆在跟前:

(1)根据检索关键词统计发现,过去一年社交媒体上关于年龄歧视的帖子比前一年多了5%;

(2)从某招聘网站的招聘公告里统计出10%明确提到期望年龄;

(3)通过上街发问卷,调查发现某开发区“25岁-34岁”和“35岁以上”两个人群的求职反馈有显著差异,p=0.03;

(4)根据劳动力成本理论和当前劳动力市场供求关系可推断,科技型企业普遍会将年龄视为一个关键考量;

(5)虚构1000份求职简历,向100家招聘不限年龄的公司发送邮件发现,在工作经历、学历、性别和肖像照片等条件均相同情况下,28岁、33岁和39岁三个年龄组得到的面试率分别为13%、12%和5%。


举这个小例,不是要说哪个方法更可靠,或者效度更高(它们之间确实存在差异),而是说,实验这种方法即便使用了高度抽象的数学和统计,当它被讲述时,都像或者说都可以变为一个故事——有些雇主把对年龄的偏好藏在招聘启事背后,最终经不起测试,被悄悄揭穿。


投递实验性简历是最简单的一种实验研究,在过去几十年,经济学和社会学经常使用此种方法。它有人物,虽然形象极度模糊;它有一些情节,但不多;它因为缺乏戏剧性冲突,不够精彩。一方面,受制于情节、语言和传播媒介,此种简历实验发表后,除了研究者和期刊编辑,可能根本没几个人读。另一方面,要是有人读了,当未来的人谈起我们当下的企业用人标准时,这个人可能早已忘记了数据,却依稀记得当年曾有一些雇主,在简历测试中暴露了对年龄的真实立场。他于是轻轻一笑,感慨那样的职场生态,总算过去了。


这就是实验的第二个身体,它是叙事性的,是可以被感知的。在我们接受它、讲述它和回忆它的过程中,它一直若隐若现,最终因为我们忘不掉它而成形:它成为一个故事。这是社会科学实验的一个特征,无论其研究结论是否正确,是否在“情理之中”。当“斯坦福监狱实验”被质疑存在操控和表演,津巴多(Philip Zimbardo)回应:“如果人们要说这是一个骗局,那就由他们去说吧,我也不再打算为之辩解了,其实它(实验)的留存时间就是一种辩护。”他知道,人们已经不可能忘记这个实验。


接下来,让我们走进情节远比简历实验复杂的“罗森汉实验”和“斯坦福监狱实验”。

精神病院里的“正常人”,

查无此人


图片

电影《飞越疯人院》(1976)剧照。


美国电影《飞越疯人院》的开端是这样的:麦克墨菲本想靠“装疯卖傻”逃避牢狱中的强制劳动,结果被送进了精神病院,因为无法忍受院内的非人待遇,他决定与病友一同向院外逃离。电影于1975年上映,改编自作家肯·克西1962年的同名小说。在这部小说问世与电影上映之间,还有一件关于精神病院的轰动性事件——这就是“罗森汉实验”。


1969年某天,一个叫“戴维·卢里”的男子走进了美国宾夕法尼亚州一家医院,他告诉医生耳边飘荡着“砰”等模糊声音。他当场被诊断为“精神分裂症”并收治入院,一周后才获准出院。


他的真名是罗森汉(David Rosenhan),一个社会心理学家,一个聪明的伪装者。他此行是初探精神诊断室。1972年,他邀请7个人并成功说服他们把自己伪装成精神病人,潜伏到医院。为了让伪装不被识破,他们举办了专项训练,比如把药片藏在舌头下方,骗过护士,然后偷偷吐出。随后,包括他本人在内的8个人分头前往5个州的不同医院,向医生描述“我耳边一直有‘砰、砰、砰’的声音”,接着又恢复正常,说听不见奇怪的声音了。


结果令人震惊,最终他们均被确诊。


图片

电视剧《精神病房也会迎来清晨》(2023)剧照。


被收治入院后,他们卸下马甲、停止伪装,还拿起笔写写画画,四处逛,记录各自的经历和观察。本来他们做此事躲躲藏藏,却很快发现多此一举,压根儿没有医护人员发现他们的异样。反倒有一些精神病患者察觉到他们举止奇怪,上前打听,问他们是不是记者,是不是学者。早在出发前,罗森汉担心大家被关在精神病院出不来,无人知晓,还特地雇了律师随时待命,请他必要时进院解救。结果发现这也是多此一举,不到两个月他们就全部出院了,住院时间从7天到52天不等,平均住院19天。没有一个人是因为被识破身份而出院的,被准许出院只是因为院方认为他们病情已经缓解。


罗森汉将此次实验写进了论文《在精神病院里做一个正常人》,刊登在1973年1月的《科学》杂志。他的结论是,当前美国的医疗系统和精神病院根本无法区分正常人与精神病人。


他并不认为医护人员的错误源于恶意或愚蠢,相反,他印象中的医护人员大多关心病人并且有责任感。他尖锐地指出,症结在于医护人员所处的医疗体制和文化中。不仅是正常人被误诊,若是一个人被贴上“精神分裂症”的标签,那么这个标签就会永远附在其身上,掩盖所有其他行为和心理特征。


罗森汉戳破了精神病院所编织的医疗神话,让精神病学一败涂地。精神病学“局内人”斯皮策(Robert L.Spitzer)则讽刺这场实验是“一场尴尬”,结论被夸大,对精神病学造成了不公平的伤害,然而他依然不得不在他主编的1980年《精神疾病诊断与统计手册》第三版(DSM-Ⅲ)中引入了更严格、更具操作性的精神病诊断标准。此事也被认为是“罗森汉实验”的主要贡献,即它推动了美国精神病诊断体系的改革。


图片

《精神病院里的正常人》

作者:[美] 苏珊娜·卡哈兰

译者:赵晓瑞

版本:中信出版集团 2021年7月


又过了小半个世纪。2019年,一本叫《精神病院里的正常人》(2021年出版中译本)的纪实图书横空出世。作者是美国记者卡哈兰(Susannah Cahalan),她因为被误诊为精神分裂症,对精神病诊断历史产生了兴趣,并在这个过程中接触到“罗森汉实验”。罗森汉伪装成精神病人直捣精神病诊断体系的事迹,给了她极大的震撼。然而,奇怪的是,她搜集当年这起实验的档案(包括来自罗森汉家人的材料、《科学》杂志评审记录等),却发现当年那篇论文存在大量的删改和伪造,包括罗森汉删除了其中一位参与者的资料,因为他在精神病院受到了友善对待,这与论文结论不一致。


除了罗森汉和这位参与者,其他参与者,大多身份待核实,而有一半竟然“查无此人”,没有材料支持其人存在。能确认的仅两个人。罗森汉曾经声称他在论文中并未采用自己的入院经历,而卡哈兰则认为论文其实主要是基于他本人的经历。也就是说,这个改写了精神病学的史诗级实验,主体部分可能是一个编造的故事。卡哈兰写下了她的困惑:“他这么做是为了改善境遇,还是只是在利用自己的有利条件?”遗憾的是,罗森汉已经在2012年去世,对这个指控他永远没有机会面对了。


斯坦福监狱的“看守”,

即兴练习


与罗森汉不同,作为“斯坦福监狱实验”的设计者,津巴多在生前看到并回应了关于实验真实性的质疑。这场社会心理学史上影响最大、被多次改编成电影,却在半个世纪后被认为是骗局的实验,是怎样展开的?


图片

改编电影《死亡实验》(2010)剧照。


1971年初夏,有几个美国加州的大学生去监狱观察,回来后产生了一些心理变化。他们的老师、年轻的社会心理学教师津巴多从中敏锐地捕捉到一个研究问题,即善与恶的界限和转换条件是什么,他“想了解监禁下心理动力运作的情形”。只有搭建一个监狱场景才能让他近距离观察。于是在这一年的暑假,他在报纸上刊登广告,征集男性大学生参与一项“关于监狱生活的心理学研究”,报酬为每天15美元(当时美国平均日薪约24美元),实验预计持续1-2周。


图片

津巴多招聘实验志愿者的广告。图片来自津巴多所创网站“prisonexp”。


广告刊登后,津巴多和他的研究助理共计收到70余人报名,他们用面谈和心理测试等方法,筛选掉不合格应征者,最终选出24个志愿者,其共同特征是“心理稳定、身体健康、无犯罪记录”。入选的这24个人被随机分为两组,囚犯组、看守组各9人,另外6人为候补参与者,两个组各备3人。津巴多担任“监狱长”,他的研究生担任实验研究员和值班主管。


根据津巴多创办的“prisonexp”(即“斯坦福监狱实验”)网站介绍,实验地点是斯坦福大学心理学系大楼的地下室。走廊被改造成三间小牢房,还有一间“禁闭室”和一间狱警值班室。摄像头和麦克风被秘密安装在各处,用于全程监控和记录。


8月14日,实验启动。


图片

囚犯组志愿者被戴上手铐。图片来自津巴多所创网站“prisonexp”。


津巴多与斯坦福大学所在地帕洛阿托的警方合作,当天清晨,他们前往囚犯组志愿者住所,以“入室盗窃”或“持械抢劫”等名义给志愿者戴上手铐,“押送”到实验现场。入“狱”后,志愿者都经历了一番完整的入狱程序,包括脱衣搜身、消毒除虱等,穿上囚服,被分配编号(如8612、416等),从此只能用编号称呼。“看守”志愿者的待遇则大为不同,为他们配备有卡其色制服、警棍、手铐、口哨,以及反光墨镜(防止“囚犯”与“看守”进行眼神接触)。此组得到的实验指令是维持监狱的秩序,防止“囚犯”逃跑,不能使用暴力。


刚开始,两个组的志愿者面面相觑,不知道如何扮演角色,有人开玩笑,有人手足无措,看起来并未“入戏”。变化是当天晚上发生的。到了半夜,看守组的志愿者忽然吹哨,把囚犯组的志愿者从睡梦中叫起来,让他们集合报数。有的志愿者报不出自己的编号,立马被罚就地做俯卧撑。也就是从这个时候起,囚犯组志愿者变成“囚犯”,看守组志愿者变成“看守”,整个地下室“监狱”的气氛逐渐紧张起来。


第二天早上,有一个“囚犯”带头撕下编号标牌,用床堵住牢房门,取笑不知所措的“看守”。换班后的“看守”则采取了一系列强硬手段,他们夺门而入,扒掉带头“囚犯”的衣服,将其关进“禁闭室”,强迫其他跟着起哄的“囚犯”做俯卧撑。有的“看守”甚至骑到做俯卧撑的“囚犯”身上。接着,“看守”持续升级惩罚手段,不让上厕所、徒手洗马桶,一到夜间就把他们反复拉出来点名。“囚犯”的精神崩溃持续,第三天、第四天、第五天,各有一名“囚犯”因严重情绪反应而被提前“释放”。到第六天,过半的“囚犯”离场。实验不得不终止。


图片

电影《斯坦福监狱实验》(2015)剧照。


“斯坦福监狱实验”证明了情境而非人格是决定人行为的关键因素。此后,实验被列入几乎所有的心理学和社会学教材。2015年好莱坞电影《斯坦福监狱实验》上映;2001年德国电影《死亡实验》也是基于此实验改编。


2011年,有志愿者公开声称受到了津巴多的诱导。更大的转折发生在2018年,这一年6月,一位当年参与实验扮演“看守”的匿名人员接受《Medium》杂志网站采访透露,他当时把它当成了一次即兴练习,“我以为自己当时是在做研究人员希望我做的事”。报道记者布鲁姆(Ben Blum)拿到实验的一段录音,津巴多的研究生明确告知“看守”要表现得强硬,否则实验不能成功。同年,法国学者特克西尔(Thibault Le Texier)的《调查斯坦福监狱实验:一个谎言的历史》(英译本于2024年出版,暂无中译本)面世,他通过查阅未公开的档案、录音和访谈,指出“看守”是被研究人员教导如何制造敌意的,并且鼓励他们羞辱“囚犯”。这与津巴多“情境自然发生”的经典叙述完全相反。


像一根刺,扎进了人心


“罗森汉实验”和“斯坦福监狱实验”的研究结论错了吗?


图片

《20世纪最伟大的心理学实验》

作者:[美] 劳伦·斯莱特

译者:郑雅方

版本:北京联合出版公司|湛庐文化 2017年4月


据劳伦·斯莱特(Lauren Slater,著有《20世纪最伟大的心理学实验》)等人记载,“罗森汉实验”引发轰动后,当时坊间还传言,有一家医院扬言“我们从未误诊过”,此话传到罗森汉耳里,他说将在随后3个月派几个正常人去这家医院接受诊断,且看他们能否识别出来。医院在这3个月共接诊了193位病人,声称已经识破了诡计,其中有41个病人。哪知罗森汉根本没有派人去,只是口头一说。医院和它所依靠的精神病诊断体系,确实被嘲讽得无地自容。


二战后,美国精神病院收治的病人数量激增,公立精神病院的病人在1955年已经达到了55.9万,占全国医院床位总数的50%。在这个惊人数字的背后,既是战争导致的士兵和家人精神创伤,也是20世纪初“优生运动”(精神疾病等患者被认为携带“劣等基因”)在半个世纪后的直接遗产。人们对“仓库式”精神病院感到恐惧,对“非自愿治疗”感到愤怒,对“标签化”诊断感到不满。随后又因为美国发动越南战争,年轻人“装疯卖傻”,希望通过精神疾病诊断来免除兵役。对怎样区分正常人和病人,诊断体系显然无能为力,而精神病学权威也就此崩塌。


卡哈兰在揭露“罗森汉实验”学术造假时,还是在她的《精神病院里的正常人》这本书中承认罗森汉向世人揭示了一个重要的事实,她引用了电影《飞越疯人院》的一句话:“即使没有发生过,那也是事实。”


图片

电影《飞越疯人院》(1976)剧照。


再来看“斯坦福监狱实验”。实验刚结束,距离实验现场不远的加州圣昆廷监狱就发生了一场暴动,囚犯在越狱时杀死了3名狱警和2名囚犯,随后被击毙;三周后,在纽约州阿蒂卡监狱,也爆发了导致43人死亡的暴乱。2004年5月,美军虐待伊拉克阿布格莱布监狱囚犯的影像被公之于众,据津巴多回忆,他在影像里目睹了“年轻的美国男性和女性,用令人无法想象的方式虐待他们应该保卫的人民”,而此事直接促使他把当年的实验写成《路西法效应》一书。他回忆说:“我曾经在我自行指导设计的计划中看过类似的恐怖景象:赤裸、戴上镣铐的犯人头上套着袋子、俯卧撑时狱卒踩着他们的背、用性暗示羞辱他们,让犯人承受极端的苦痛压力。”他所描述的,的确是他在斯坦福大学那个地下室所见到的情景,不过这些情景却被证明不是自然推进。


图片

《路西法效应》

作者:[美] 菲利普·津巴多

译者:孙佩妏 陈雅馨

版本:生活·读书·新知三联书店 2024年12月


涉嫌造假的实验却能得出正确的结论,这是一个棘手的,也是让人为难的悖论。它不仅让罗森汉和津巴多的追随者为难,也让无数关心人心本质的人为难。


大概只能说,这并不是“歪打正着”的结论,而是这些结论本来就存在,甚至隐藏在我们内心的某个隐秘角落,只不过可能未被描述,未被总结。在“罗森汉实验”之前,1961年,萨斯(Thomas Szasz)的《精神疾病的神话》、福柯(Michel Foucault)的《疯癫与文明》已经对精神疾病的诊断提出了更激进的批判。萨斯和福柯的理论也并非纯粹是他们本人创造。人不是被动等待被认识的物体,而是进入初民社会以后,一直在总结其思考。当我们读奥尔森(Mancur Olson)的《集体行动的逻辑》,也会想起中国那句更直白的俗语:一个和尚挑水吃,两个和尚抬水吃,三个和尚无水吃。问题只在于,关于同一个问题的俗语或者其他流传于人间的思考有很多,究竟哪个得到当下经验支撑,又在何种语境或在多大概率上成立,为何是此而不彼。以前是靠谁的嗓门大,哪个说法传播得广;自19世纪末以来,社会科学把任务接了过来。


图片

短片《三个和尚》(1980)画面。


为了取得学科的正当性,社会科学不断向自然科学吸取科学法则,所以罗森汉告诉世人他把假病人送到12家不同资质的医院,控制了医院类型这个变量,津巴多也告诉世人他用掷硬币的方法把24个志愿者随机分为两组,控制了可能由身高、性格等变量引发的影响。既然社会科学以人及其社会为研究对象,就不可能有统一的法则、结论。前些年英国伦敦有人重做了监狱实验,发现“看守”和“囚犯”能和平相处,以此反驳津巴多,其实也不能说反驳成功了。过去讲“公说公有理,婆说婆有理”,社会科学则把结论问题改造成了一个关于“概率”的问题。最接近科学的实验法反而不甘于此,它还保留了人类古老的、由来已久的故事修辞。


津巴多说,实验在读者那里的留存时间就是一种辩护。他错了,这不能为“斯坦福监狱实验”辩护,也不能给“罗森汉实验”以及所有存在问题的实验辩护。实验尤其是实验室的实验,其本身就具备融入记忆的能力。实验有两个身体,一个科学的,一个叙事的。后者是一个故事,有人、有情节、有冲突,它像一根刺,一旦扎进了人心,与人的某个感受呼应,就不可能轻易被忘掉。


这是实验的力量,也是实验的危险。这是实验的诱惑,它要求研究者对人心和人之行为必须审慎。


作者/罗东

编辑/李永博、何安安、西西、张婷

校对/翟永军 刘军