平均

时间:2024-11-30 20:26:09

尼古拉斯·克里斯塔基斯(Nicholas A.Christakis):哈佛大学医学博士,社会学学者,合著有《大连接》。

平均

一百年前发明的具有里程碑意义的多元统计技术,使我们可以正确地比较两组平均数之间的差异,自那以后我们就一直误以为这种差异是显著的,而且,通常一组数据只存在一种重要的差异,但事实上我们都被自己欺骗了。我们花了一个世纪的时间观察和解释这种差异。我们沉迷其中不能自拔,现在是时候应该停止这种行为了。

我们可以肯定地说,从平均水平来看,男人比女人高,挪威人比瑞典人富有,第一个出生的孩子比第二个出生的孩子更聪明。我们也可以通过实验的手段来检测不同组别之间的微小差异,或检测不同组别之间是否存在特别的不等位基因。但用这样的方法看待自然世界,也未免太简单太狭隘了。

我们是时候放弃对平均数的关注了。即使还是要继续关注,也应该暂时放一放。在不考虑平均数的这段时间里,我们应该抓紧时间关注那些曾被忽略了的组别之间的其他差异:我们应该集中精力比较一下不同组别之间方差的差别,这样可以得到差值、范围以及测定值等。

我们之所以会将更多的精力集中于平均数研究上,有一部分原因是由于计算和比较平均数的统计工具都非常简单且成熟。而比较某一组的方差与其他组的方差是否有区别则非常困难。这让我想起了一个关于醉汉找钥匙的笑话:醉汉跪在路灯下寻找钥匙,只是因为那儿的光线比较好。我们沉醉于统计功效中,并且说服自己分布均值是最重要的。但事实往往不是这样的。举个例子,我们将关注点放在不同组之间的财富差异上。比如,美国是否比其他国家富有,是什么原因导致了这种差异?银行家是否比顾问赚的钱多,这又如何影响了即将毕业的大学生对职业的选择?但在解释群体和个人的结局和选择时,群体中财富的分配可能与不同群体之间的财富差异同样重要。即使美国和瑞典的国民平均收入相同(只是一个粗略的说法),但美国国民收入的方差却高得多(美国国民之间的收入差值更大),而这一事实是任何组别之间的平均数差异无法体现的,方差有助于解释当前中国民众的现状。例如,这可能对群体的平均发展以及群体内部每个人的发展都更为有利,即使平均收入有所降低,也有利于群体形成一种更平等的收入分配。我们可能希望在财富的支出上更加平等。

这里有一个假设的例子,是关于不平等的另外一种态度。当要为一艘帆船组织一队水手时,以下哪种选择最好?所有的10名水手都具有相同程度的近视,且他们的平均视力为0.1;或者,10名水手中有9人视力非常糟糕,但是剩下的一个人视力非常好。这两组水手的平均视力相同,但是为了安全地航行和生存,不平等的情况当然是越多越好。在视力这方面,我们可能会希望有更多的不平等。

或者再来思考一个医学方面的例子,看看差异有多么重要。在对待艾滋病晚期患者和肝硬化晚期患者时,可能会有两个条件相等的平均值预测,但对于艾滋病患者,医生提出“停止抢救”的概率可能更高。很多人会认为医生出于歧视而有意避免抢救艾滋病人。但真正的原因是艾滋病患者中幸存者的方差更高,比起肝硬化患者,艾滋病患者中有更多的人在患病不久后就离世了。医生面对的是这样的一个事实,而不是这两个群体之间的平均生存率;而对于肝硬化患者,医生可以稍晚再为他们提供拒绝心肺复苏术同意书(DNR)。

熟悉方差可以使我们弄清楚一些著名的颇具争议的假设。比如,为什么在重点高校中男性数学教授更多?男性和女性的数学天赋从总体上看平均值是相同的,但男性中的方差可能更高。如果是这样,那就意味着有更多的男性是处于统计分布的底部(事实上,男孩可能患有智障的概率是女孩的三倍),但也有更多的男性处于统计分布的顶端。

当主要专注于均值时,我们会错过世界上一些既有趣又重要的事情。一个受限制的视角对于实际生活或科学研究都有不利的影响。难道我们想要一个更富有的但不平等的社会吗?我们希望通过一些教育项目来增加考试分数的平均值吗?如果存在一种抗癌药物,虽然它可以使一些患者活得更长,却导致更多病人更快速地走向死亡,那么像这样对平均存活率没有任何影响的药物,医生也要优先使用吗?要真正了解这些决策的相关性,我们需要的不仅仅是平均值这种数据,还需要将注意力放在方差上。

注:本文作者尼古拉斯·克里斯塔基斯的《大连接:社会网络是如何形成的以及对人类现实行为的影响》已由湛庐文化策划,中国人民大学出版社出版。