{"text":[[{"start":7.94,"text":"作为先后接受过哲学和心理学教育的学术研究人员,罗宾•道斯(Robyn Dawes)是个实干派。他会讲起上世纪50年代末在精神病房工作时经历的一件事。“有个患者得了妄想症,他觉得自己长出了乳房。”该男子被安排在一间封闭病房里,精神病医生们试图找出是什么原因导致了如此稀奇的妄想症,他们推测最大的可能是,双亲中的一方在近期猝然离世给他造成了创伤性影响。"}],[{"start":37.99,"text":"过了六周后,有人让该男子脱掉衬衫。原来他得了一种遗传性疾病,而不是妄想症。“千真万确,他长出了乳房。”"}],[{"start":48.84,"text":"由此得出一个教训:即便是专家——不,应该说特别是专家——也会被高深的思想牵着鼻子走,从而忽略了简单、直接的方法。也难怪道斯会被特德•萨尔宾(Ted Sarbin)和保罗•米尔(Paul Meehl)的研究成果所吸引,这两位心理学家研究发现,简单的统计预测运用在临床诊断或评估学业表现等方面有出人意料的效果。"}],[{"start":71.2,"text":"例如,萨尔宾运用一个线性回归——几乎是能想到的最简单的统计法则——来预测临近毕业大学生的成绩,即平均学分绩点(GPA),依据的是他们在高中时的班级排名以及他们考大学时的分数。这种方法比起临床心理学家依据包括这些数据在内的大量资料作出的评估还要准确。关于简单的统计法则胜过专家的诊断或预测,米尔发现还有许许多多的例子。"}],[{"start":98.88,"text":"但这些统计法则会简单到什么程度呢?一个标准的线性回归基于多个自变量的组合来预测结果。例如,一名罪犯再次被捕的概率或许是年龄、性别、有过几次前科、以前所犯罪行的严重程度等因素的函数。各项因素的权重由一个数学公式来决定,以最大程度拟合历史数据。"}],[{"start":122.85,"text":"然而道斯建议使用他所称的“不规范”线性回归,即权重没有优化,而是任意选取——也许权重都相等,甚至是随机选取的。"}],[{"start":132.38,"text":"要挑一个适合英国《金融时报》的例子,就拿构建一个最优投资组合来说。投资组合的回报是结果;在不同资产间恰当配置,我们就可以在给定的风险水平下让预期的回报最大化。1990年诺贝尔经济学奖得主之一哈里•马科维茨(Harry Markowitz)在上世纪50年代曾证明在这样一个完美组合中如何选择各项权重。罗宾•道斯思想流派则认为不用费事。只要遵守“把你的钱平均地投资到前50家最大上市公司”,甚至“一半投资股票、一半投资债券”诸如此类的法则就可以了。"}],[{"start":171.34,"text":"这是不可能行得通的,对吧?嗯,在马科维茨发表他的理论后找的第一份工作中,他必须决定怎么配置他的养老金缴款。他选择了一半投资股票,一半投资债券。这对你来说不是恰当的权重。但不能确定马科维茨做错了,尽管他自相矛盾:维克多•迪米基尔(Victor DeMiguel)、洛伦佐•盖勒普(Lorenzo Garlappi)和拉曼•尤博尔(Raman Uppal)在2009年发表的一篇论文提出,在一组资产中进行平均投资的简单策略有着出人意料的成效。"}],[{"start":203.28,"text":"在一次学术会议期间,道斯参加完一个小组讨论后在喝饮料时,同小组的一名成员问他:“你能……使用你的不规范线性模型来预测我和我妻子关系如何吗?”"}],[{"start":214.83,"text":"道斯认为他可以。他有几名同事一直在收集关于性与关系的数据,他提出了这种并没有精准分配权重的预测方法:如果一对夫妻的性生活次数多于吵架的次数,那么这对夫妇可能会形容他们的关系“是幸福的”,如果吵架的频率多于性生活的频率,那就是“不幸福的”。"}],[{"start":234.79000000000002,"text":"两个自变量,权重相等——肯定有比这更准确的模型吧?然而这套无比简单的理论与实际证据相契合。他的一名同事收集了12对不幸福夫妻的数据;全都是吵架次数多于性生活次数。在30对幸福夫妻中,有28对都是性生活次数多于吵架次数。之后的小规模研究得出了同样的结论。"}],[{"start":261.47,"text":"(一点重要说明:要先问夫妻俩关系如何,后问性生活和争吵频率,否则算完以后可能就是一场自我实现式的危机。一名女性计算了性生活次数、争吵次数,然后决定是时候申请离婚了。)"}],[{"start":277.03000000000003,"text":"“结论是,如果我们彼此之间爱多于讨厌,我们就是幸福的;如果我们之间讨厌多过爱,我们就是不幸福的,”道斯在1979年一篇文章中写道,文章标题是《不规范线性模型在决策中的实在之美》(The Robust Beauty of Improper Linear Models in Decision Making)。他补充说,“这个结论从心理学和统计学上来讲都不算深刻。其意义在于,这种十分粗略的不规范线性模型能预测一个十分重要的变量。”"}],[{"start":303.99,"text":"为什么这些简单到几乎好笑的模型能用呢?一个答案是,虽然权重是随意分配的,但在选择变量放进组合中时已经夹带了一些相关知识。比如道斯本来也可以说,婚姻美满是尼日利亚月均降雨量的函数;也是一个简单模型,但不是一个好模型。"}],[{"start":324.23,"text":"还有一个答案是,看起来复杂的结果往往反映了各变量之间相当简单的组合。如果一名罪犯有过多次前科,那么不管其他因素如何,这十之八九就是一个不好的征兆。而不管以一对夫妇的关系为主题的心理剧如何展开,如果夫妇俩性生活频繁,那大概就是好的信号。"}],[{"start":345.6,"text":"但还有第三个因素,一般的数据集只捕捉到一部分实情。婚姻美满与否是很难准确衡量的。风险是很难准确衡量的。即使是性生活频率可能也比表面上看起来更难衡量——谁算的,他们认为怎样才算?除了这些噪音以外,还有一点是所有事情都会改变。"}],[{"start":368.23,"text":"随着时光流逝,数据越来越多,原本看似最优的估计最终可能被证明有过度自信之嫌。一种更简单、更粗略的方法也许稍稍更能经得住考验。维克多•迪米基尔和他的同事们估计,在一个包含50项资产的投资组合中,要使据称最优的估计可靠地胜过简单的等权配置法则,分析师需要掌握5个世纪的数据集。"}],[{"start":393.95000000000005,"text":"这并不是说简单的——“不规范的”——分析总是最佳的,而只是说,这是一个出奇靠谱的基准。既不是瞎折腾,也不过于自夸。可以在酒吧里的一张餐巾纸上推演,或者记在医生的便签纸上。在搬出大套的高明分析理论之前,有时候不妨要求检查一下衬衫底下的情况。"}],[{"start":416.81000000000006,"text":"译者/何黎"}]],"url":"https://audio.ftcn.net.cn/album/a_1780052010_2813.mp3"}