第13章
启发式、偏差与噪声

本书是对横跨半个世纪的关于人类直觉判断研究的延续,也就是所谓的“启发式和偏差研究项目”(heuristics and biases program)。《思考,快与慢》一书对该研究项目前40年的研究内容进行了回顾,探讨了能够解释“直觉思维的奇妙与缺陷”的心理机制。该项目的核心思想是,当回答一个难题时,人们会使用简化的思维操作系统——启发式。通常来说,由快速的直觉思维(系统1思维)产生的启发式是非常有用的,并且能够得出适当的答案,但是有时候它们也会产生偏差,我们称之为系统性的、可预测的判断错误。

启发式和偏差研究项目关注的是人们的共性,而非差异。研究结果表明,导致产生判断误差的心理过程是人们共有的。因此,熟悉心理偏差(psychological bias)概念的人往往会认为心理偏差总是会导致统计偏差(statistical bias)。本书所使用的“统计偏差”这一术语,指的是大部分朝同一方向偏离真实值的测量或判断。毕竟,只有当判断者具有相同的心理偏差时,所导致的才是统计偏差。而若判断者以不同的方式在不同程度上出现心理偏差,就会导致系统噪声。当然,无论心理偏差引发的是统计偏差还是噪声,都一定会导致误差。

诊断偏差

我们通常是通过参考真实值来确定判断偏差的。在做预测性判断时,如果误差主要偏向同一个方向而非其他方向,偏差就出现了。例如,人们在预测完成一个项目需要多长时间时,他们估计的平均值通常比他们实际需要的时间少得多。这种常见的心理偏差就是计划谬误(planning fallacy)。

广告:个人专属 VPN,独立 IP,无限流量,多机房切换,还可以屏蔽广告和恶意软件,每月最低仅 5 美元

不过,在做判断时我们往往没有真实值可以拿来比较。我们曾强调过,只有知道真实值时才能检测到统计偏差,那么,在真实值未知的情况下应该如何研究心理偏差?答案是,研究者如果观察到本不应该影响判断的因素对判断产生了统计效应,或是本应该影响判断的因素没有对判断产生统计效应,那么就可以证实判断过程存在心理偏差。

让我们再次用射击的例子阐明上述方法。想象一下,A、B两支队伍完成了射击,而这一次我们请你隐去靶子(见图13-1)。在这个例子中,你并不知道靶心究竟在哪里(即真实值未知),因此,你不知道这两支队伍的子弹落点偏离靶心的程度分别有多大。但是你被告知,在左图所示的情况下,两支队伍瞄准的是同一个靶心;而在右图所示的情况下,A、B两队瞄准的是不同的靶心。

阅读 ‧ 电子书库

图13-1 隐去靶子后观看射击结果以验证偏差

尽管靶心未知,但两种射击结果都证明了系统性偏差的存在。在左图所示的情况下,两支队伍的子弹落点在不同的区域,尽管它们本应该在相同的区域。这种模式就类似于你在实验中,观察两组投资者阅读内容完全相同的商业计划书,只是打印计划书所用的字体和纸张不同,如果这些无关紧要的细节影响了投资者的判断,就表明存在心理偏差。我们不清楚究竟是那些被圆滑的字体、光洁的纸打动的投资者判断得过于积极,还是那些阅读纸张较粗糙的计划书的投资者判断得过于消极,我们只知道他们的判断是不同的,尽管他们不应该这样。

右图所示的情况说明了相反的现象。由于两个队伍瞄准的是不同的靶心,因此两个队伍射中的区域应该是不同的,但落点却集中在了同一区域。例如,假设向两组人提出第4章中关于迈克尔·甘巴迪的那个问题,但问题有所不同:其中一组像你一样,被要求估计甘巴迪两年内仍能留任的可能性;另一组则被要求估计他三年内仍能留任的可能性。按理说两组应该得出不同的结论,因为三年内不能留任的可能性显然比两年内的更高,但是证据表明,两组人所估计的概率相差很小,小到可以忽略不计。答案本应该是有显著差异的,但事实并非如此,这意味着本应该影响判断的因素被忽略了。这种心理偏差被称为范围不敏感(scope insensitivity)。

判断的系统性错误已在许多领域中出现,“偏差”一词现在已被广泛用于多个领域,包括商业、政治、政策制定和司法。由于该词的普遍使用,它的含义也变得很广泛。我们在此处使用的是这个词在认知层面的定义,指的是一种心理机制和这种机制通常会产生的误差。除此之外,这个词还经常用于暗示某人对某个群体有偏见,如性别偏见或种族偏见。它也可能意味着某人支持某个特定的结论,例如,我们有时候会读到:某人因利益冲突或政治见解而产生偏见。所有这些心理偏差都会引起统计偏差和噪声,因此我们在讨论心理学的判断误差时,会将上述这些类型的偏差、偏见都包含在内。

我们强烈反对这个词的另一种用法——将代价高昂的失败归因于无特定所指的“偏差”,而在承认错误的同时,承诺努力消除我们的决策中的偏差。这些表述无非是说“错误已经铸成”“我们将努力做得更好”,再没有其他意义了。可以肯定的是,某些失败确实是由与特定心理偏差相关的可预见性误差引起的,我们也相信采取某些干预措施来减少判断和决策中的偏差和噪声是可行的,但是,将所有不好的结果都归咎于偏差,是毫无价值的解释。我们建议,只有在描述具体、可以识别的误差以及产生这些误差的机制时,才使用“偏差”一词。

替代偏差,我们常常用一个问题代替另一个问题

要体验启发式的过程,请你尝试回答如下问题,这个问题阐明了启发式和偏差的几个基本的主题。像之前一样,如果你能给出自己的答案,你将从中收获更多。

比尔今年33岁。他很聪明,但缺乏想象力,且大多数时候比较无趣。学生时代,他数学学得很好,但是社会研究和人文科目学得很差。

下表列出了8种可能发生的“比尔的现状”。浏览以下各项,然后从中选出你认为最有可能发生的两项。

□ 比尔是内科医生,爱好玩扑克牌。

□ 比尔是建筑师。

□ 比尔是会计师。

□ 比尔爱好演奏爵士乐。

□ 比尔爱好冲浪。

□ 比尔是记者。

□ 比尔是会计,爱好演奏爵士乐。

□ 比尔爱好爬山。

现在,请你再浏览一遍,然后选择两个与比尔最为相似的描述。你的选择可以与上次的相同,也可以不同。

几乎可以肯定的是,你所选择的最可能的类别与最相似的类别是完全相同的。我们如此肯定的原因是,已经有许多实验表明:人们在这两类问题上会给出相同的答案。但是,相似性和可能性实际上是完全不同的。例如,你可以自问,如下哪种说法更合乎情理呢?

· 比尔符合我心目中爵士乐爱好者的形象。

· 比尔符合我心目中爱好演奏爵士乐的会计师的形象。

这两种陈述都不完全符合,但其中一个显然看起来没那么糟糕。相比于爵士乐爱好者,比尔与“爱好演奏爵士乐的会计师”有更多的共同点。现在考虑一下:以下哪个陈述更有可能发生?

· 比尔爱好演奏爵士乐。

· 比尔是会计,且爱好演奏爵士乐。

你可能会选择第二个答案,但是这样做是不合逻辑的。比尔爱好演奏爵士乐的可能性必然高于他是一个“爱好演奏爵士乐的会计师”的可能性。回想一下文氏图(Venn diagram)(7),如果比尔是爱好演奏爵士乐的会计师,那么他必然是个爵士乐演奏者。在描述中添加更多的细节只能使所描述内容发生的可能性降低,尽管添加细节能够使它变得更具代表性,而且更符合情况,就像当前的案例一样。

根据判断启发式理论,有时候人们会用一个简单问题的答案来回答一个较难的问题。因此,哪个问题更容易回答呢?是“比尔与一个典型的爵士乐乐手有多么相似”,还是“比尔有多大可能性成为一名业余爵士乐乐手”?众所周知,相似性问题更容易,因此人们在评估概率时,更可能给出与之相关的相似性问题的答案。

现在你已经体验到了启发式和偏差计划的核心思想:回答一个难题的启发式是去寻找一个简单问题的答案。用一个问题代替另一个问题会导致源于可预见性心理假设的误差,我们称之为心理偏差。

在比尔的例子中,心理偏差很明显。当相似性判断代替概率判断时,误差必定会发生,因为概率判断受限于特定的逻辑。也就是说,文氏图适用于概率,却不适用于相似性,正因如此,许多人都会犯源于可预见性心理假设的逻辑错误。

再说一个忽略统计属性的例子。请回想一下你在第4章中对甘巴迪是否成功问题的看法。大多数人对甘巴迪成功可能性的评估完全基于例子中给出的关于他的信息,并会尝试将关于他的描述与成功CEO的形象进行匹配。

你是否考虑过一个随机选择的CEO有多大可能在两年后仍然留任呢?你很可能不会考虑这个问题。你可以将这种基准概率信息(base-rate information)视为衡量一个CEO留任难度的方法。如果这种方法看起来很奇怪,那么请试想一下你会如何估计某个学生通过考试的概率。考试不及格的学生比例当然是很有价值的一个指标,因为它可以反映这场考试的难度。同样的道理,CEO的留任率对甘巴迪问题也是至关重要的。这两个问题都是采用我们所谓的外部视角的例子:当你采用外部视角时,你会把该学生或甘巴迪想象成一群相似案例中的一员。你会用统计思维来看待这个群体,而不是用因果思维去分析具体的案例。

采取外部视角可以扭转乾坤,防止出现重大错误。花几分钟进行一些调研你就会发现,美国企业的CEO离职率大约为每年15%。这一统计数据表明,一位新上任的CEO平均约有72%的概率在两年后仍然处在该职位上。当然,这个数字只是一个方面,在甘巴迪的案例中,那些具体信息都会影响你的最终估计。但是,如果你只关注被告知的与甘巴迪有关的信息,那么你会忽略一项关键信息。我们举甘巴迪的案例,原本是为了说明判断充满噪声,可我们花了几个星期才意识到,这个案例本身就很好地体现了我们现在介绍的这种偏差,我们称之为忽略基准概率偏差(base-rate neglect)。可见,即使是本书的作者也不能比其他人更自然地想到基准概率这件事。

用一个问题替代另一个问题不仅限于相似性和可能性之间的替代,另一个例子是将概率判断替换成在脑海中获取案例难易程度的判断。例如,人们对飞机失事或发生飓风的风险认知会在此类事件被媒体广泛报道后短暂上升。从理论上讲,风险判断应基于长期平均值,但实际上,近期发生的事件会被赋予更高的权重,因为它们更容易被人想起。用例证在脑海中出现的难易程度来替代频率判断,被称为“可得性启发式”(availability heuristic)。

用简单的判断替代困难的判断并不仅限于这些例子,实际上,替代是很常见的。我们常常会把回答一个较简单的问题视作一个“通用程序”,并以此来应付一个可能难住我们的问题。请思考一下,我们在回答下列问题时,往往会用什么比较容易的问题替代(例子中每个问题下方都提供了一个可能的选项)?

· 我相信气候变化吗?

我相信那些说它存在的人吗?

· 我是否认为这位外科医生有能力?

这个人说话充满信心和威严吗?

· 项目会如期完成吗?

现在项目已经按计划在执行吗?

· 核能是必要的吗?

我会闻核色变吗?

· 我对自己的生活感到满意吗?

我现在的心情如何?

不管问题是什么,将一个问题替代为另一个问题,都会导致你在给出答案时无法对证据的不同方面赋予恰当的权重,而错误地对证据赋予权重会不可避免地产生错误。例如,要想得到你关于生活满意度问题的确切答案,需要询问的显然不仅仅是你当前的情绪,现在也已经有相关研究证据表明,情绪实际上是被过分重视了。

同样,用相似度代替概率会导致忽略基准概率偏差,而基准概率在判断相似度时是完全不相关的因素。比如,在评估一家公司的价值时,应当很少或完全不考虑诸如公司计划书的美观度这类不相关的因素。这类因素对判断产生的任何影响都可能反映出你对证据赋予权重的不当之处,并导致错误的产生。

结论偏差,我们常常依结论寻找证据

在写《星球大战》(Star Wars)第三部的电影剧本《绝地归来》(Return of the Jedi)的关键时期,该系列电影的制作人乔治·卢卡斯(George Lucas)与他出色的合作者劳伦斯·卡斯丹(Lawrence Kasdan)展开了激烈辩论。卡斯丹强烈建议卢卡斯:“我认为你应该‘杀死’卢克·天行者并让利娅公主接手。”卢卡斯当即拒绝了这个建议。卡斯丹又建议,如果让卢克活着,那么另一个主角就应该死掉。卢卡斯再次拒绝,并补充道:“你不要光想着‘杀人’。”于是卡斯丹真心诚意地说出了自己对电影本质的看法。他向卢卡斯解释道:“如果你喜欢的人在旅途中遭遇了不幸,这段旅途才显得更有吸引力。这将使这部电影的情感分量大大增加。”卢卡斯的回答迅速而明确:“我不喜欢那样,也不相信那一套。”

这里的思维过程与你在考虑比尔是不是爱好演奏爵士乐的会计师时所经历的思维过程完全不同。再看一下卢卡斯的回答:先是“不喜欢”,然后是“不相信”。卢卡斯对卡斯丹的提议自动地做出了回应,这种自动化的回应有助于激发他的判断力,事实证明,他是正确的。

这个例子说明了另一种类型的偏差,我们称之为结论偏差或者预判。像卢卡斯一样,我们经常在判断过程初期就对某个特定结论有了一种倾向性。当我们这样做时,我们让自己头脑中的快速、依赖直觉的系统1思维给出结论,然后,我们要么绕过收集和整合信息的过程直接得出结论,要么转而动员系统2思维进行审慎性思考,找到支持我们预判结论的论据。在这种情况下,证据就是有选择性且失真的由于证实性偏差和期望偏差,我们倾向于有选择地收集和解释证据,以支持那个我们已经相信或希望成真的结论。

人们通常会为自己的判断找到一些看似合理的解释,并且真的认为这是他们的信念的根据。验证结论偏差的一个很好的方法是,想象一下如果那些看起来支持我们信念的论点突然被证明是不成立的,情况会如何。回到前面的例子,卢卡斯向卡斯丹明确指出的“你不要光想着‘杀人’”并不是什么令人信服的论点,《罗密欧与朱丽叶》(Romeo and Juliet)的编剧应该不会同意卢卡斯的观点,如果《黑道家族》(The Sopranos)与《权力的游戏》(Game of Thrones)的编剧决定不再“杀人”,这两个剧集很可能播完第一季就会被下架。然而,我们敢打赌,这些强硬的反驳观点都不会改变卢卡斯的想法,相反,他很可能会提出其他的论点来支持他的判断,比如“《星球大战》是与众不同的”。

无论我们从哪个方面看,预判都是显而易见的。就像卢卡斯的反应一样,预判通常带有感情色彩。心理学家保罗·斯洛维奇(Paul Slovic)称其为情感启发式(affect heuristic):人们通过询问自己的感受如何来决定自己如何思考。对于我们喜欢的政治家,我们会爱屋及乌,而对于不喜欢的政治家,我们连他们的外表和声音也都不喜欢,这就是那些聪明的公司要付出那么多努力使其品牌与积极情感产生联结的原因之一。教授们经常注意到,如果某一年他们获得了较高的教学评分,学生也会对课程所用的教材给予好评;而如果某一年学生不太喜欢这个教授,他们会给相同的教材差评。即使这一过程不涉及情感成分,相同的机制也会起作用:无论你的信念的真正来源是什么,你总会倾向于接受任何看起来支持该信念的论点,即使推理是错误的

结论偏差的一个更精妙的例子是锚定效应(anchoring effect),它是指一个任意数字对人们的定量判断产生的影响。在一个典型的演示实验中,你可能会看到许多不容易猜出价格的物品,例如一瓶陌生的葡萄酒,实验人员会要求你写下自己社保号码的最后两位数字,并问你是否愿意为那瓶酒支付同等金额的费用。最后,你需要说出你愿意为葡萄酒支付的最高费用。结果表明,利用社保号码所设定的锚点会影响你最终的购买价格。一项相关研究发现,那些因社保号码产生较高锚点的人们愿意支付的价格(超过80美元)比那些锚点较低的人们愿意支付的价格(不到20美元)要高出3倍之多。

显然,你的社保号码本不应该对判断葡萄酒价格产生影响,但事实就是如此。锚定效应是一种非常强大的效应,谈判中经常被刻意用到。无论你是在集市上讨价还价还是进行复杂的商业谈判,先下手为强总是理智的选择,因为接收锚定信息的人会不由自主地去思考你的报价在哪些方面可能是合理的。人们总是会试图理解他们所听到的,当人们遇到难以置信的数字时,他们会本能地想要去尽力消除这种难以置信的感觉。

过度一致性偏差

有一个实验可以帮助你体验第三种偏差。你将读到关于一位高管候选人的描述,该描述由4个形容词组成,分别被写在一张卡片上,并且这叠卡片刚刚做过洗牌处理。前两张卡片的描述如下:

聪明,执着。

按理说,你应该等到获得完整信息后再进行判断,但事实并非如此:此时你已经对候选人进行了评估,并做出了判断,但你无法控制这一过程,你的判断过程根本无法暂停。接下来,翻开后两张卡片,现在你获得了关于这位候选人的完整的描述:

聪明,执着,狡猾,没有原则。

这时,你的评价可能就没有那么积极了,但是变化应该不会太大。作为比较,请你再考虑如下的描述,这可能是洗牌后的另一种情形:

没有原则,狡猾,执着,聪明。

第二种描述是由相同的形容词组成的,但是由于形容词出现的顺序不同,对我们来说,第二种描述的吸引力显然比第一种描述小得多。“狡猾”一词在“聪明”和“执着”之后出现时只有轻微的贬义,因为我们仍然(毫无道理地)相信这位高管总体上是好的。然而,对于第二种情况,由于出现在“没有原则”之后,“聪明”和“执着”也不再是积极因素了,反而可能会使坏人显得更加危险。

这个实验说明了过度一致性(excessive coherence)偏差我们能迅速形成一致性印象,但要想改变一致性印象,过程却很缓慢。在上述例子中,我们仅依据很少的信息,就立即对候选人建立了积极的印象。证实偏差指的是当我们有预判时,我们会完全忽略那些与我们的预判相冲突的信息,这会使我们对后续信息的重视程度过低。描述这种现象的另一个术语是光环效应(halo effect)——候选人是在积极的第一印象的“光环”笼罩下被评估的。在本书第24章中我们将看到,在招聘决策中,光环效应是一个非常严重的问题。

再来看另一个例子。在美国,政府会要求连锁餐厅标明食物的热量,以确保消费者能看到他们想要购买的芝士汉堡、牛肉汉堡和沙拉等食物的热量。然而,看到这些标签后,消费者真的会改变他们的选择吗?从现有证据来看,这一话题是存在争议的,但有一项研究能给我们一些启示,该研究发现如果将标签放置在食品的左侧而不是右侧,消费者就更有可能受到热量标签的影响。当热量标签在左侧时,消费者会先接收该信息,显然他们会在看到食物之前就先想到“热量很高”或“热量不算太高”。他们最初的积极或消极反应将极大地影响他们的选择。相比之下,如果人们先看到食品,显然他们就会在看到热量标签之前先想到“美味”或“不太好吃”,同样,他们最初的反应将极大地影响他们的选择。针对希伯来语使用者的研究也支持了这一假设。希伯来语使用者是从右向左阅读的,热量标签在右侧会比在左侧时对希伯来语使用者的影响更大。

也就是说,我们总是会直接下结论,然后坚持己见。我们认为我们的观点是有依据的,但是我们所认为的依据和我们对它的解释很可能是扭曲的,至少在某种程度上是为了和我们的草率判断相匹配。这使得我们保持了出现在脑海中的故事的一致性。当然,如果结论是正确的,这个过程倒也无妨,但是,如果最初的评估是错误的,那么面对矛盾的证据也依然坚持己见就很可能会放大错误。而且这种影响很难控制,因为我们无法忽略自己听到或看到的信息,很多时候甚至很难忘记。在法庭上,法官有时会要求陪审团忽视他们所听到的那些未经许可就呈现的证据,但这种要求是不切实际的。不过,这种要求可能有助于陪审团的审议,因为其明确了基于这种证据提出的论点可能会被驳回。

心理偏差引发噪声

到目前为止,我们简要地介绍了三种偏差,它们的运作方式是不同的:替代偏差会导致我们对证据不正确地赋权;结论偏差会导致我们要么绕开证据,要么以曲解的方式考虑它;而过度一致性偏差则会放大初始印象的效果并减少矛盾信息的影响。当然,以上三种类型的偏差都会产生统计偏差,也都会产生噪声。

我们先从替代偏差说起。如之前的例子,大多数人都会判断比尔的形象与典型会计的形象有多相似,以此来判断比尔有多大可能性是会计师,在这个实验中,偏差是共性的。如果每一位受访者都犯同样的错误,就不会有噪声,但是,替代偏差并不总是会产生这种一致性。当把“气候变化是真的吗”这一问题替换为“我要相信那些说气候变化为真的人吗”,很容易看出答案是因人而异的,它取决于这个人的社交圈、偏爱的信息来源、政治面貌等因素。这样一来,同一种心理偏差就产生了不同的判断和个体间的噪声。

替代偏差也可能是情境噪声的来源。如果根据自己当下的心情来回答有关生活满意度的问题,那么同一个人的答案也必定因时而异。比如,一个人在早晨可能是快乐的,而在下午可能是痛苦的,情绪会随时间变化,这可能导致受访者反馈的生活满意度随调查者询问的时间不同而发生变化。在第7章,我们已经回顾了源于心理偏差的情境噪声的例子。

预判也会产生偏差和噪声。回想一下我们在引言中提到的那个例子:法官们批准庇护申请的比例差异惊人。如果一位法官只批准了5%的申请人,而同一法院的另一位法官的批准率却高达88%,那么我们可以肯定地说,他们在不同方向上存在偏差。从更宽泛的角度来看,偏差的个体差异会导致大量的系统性噪声。当然,系统也可以使大多数甚至所有判断者都产生相似的偏差。

最后,过度一致性也会产生偏差或噪声,这取决于所有(或大多数)判断者获取信息的顺序以及对信息赋予的含义是否相同。例如,一个长得漂亮、有吸引力的候选人会给大多数招聘者留下良好的第一印象。然而,如果应聘者所应聘的职位与外貌无关,那么积极的光环效应就会导致共同的错误,也就是偏差。

另外,做复杂的决策通常需要收集信息,而人们获取信息的顺序实际上是随机的。回想一下第2章中的索赔调解人,对于不同的调解人来说,不同的案件、索赔数据的获取顺序都是随机变化的,这会导致他们对不同案件的初始印象随机变化。过度一致性偏差意味着初始印象随机变化将使最终判断随机扭曲,这就是系统噪声所带来的影响。

总而言之,心理偏差是一种普遍存在的心理机制,它们经常导致共性的错误。但是,当偏差的个体差异较大(不同的预判)或偏差的效应取决于情境(不同的触发因素)时,噪声就会产生。

偏差和噪声都会导致错误,这意味着减少心理偏差能够提高判断力。我们将在本书的第五部分讨论如何消除偏差这一主题。在那之前,我们还要继续探索判断的过程。