可复制性是评估个人与公共政策不可或缺的工具

时间:2024-11-30 07:26:08

布莱恩·克努森(Brian Knutson):

斯坦福大学心理学及认知科学副教授。

可复制性是评估个人与公共政策不可或缺的工具

因为造访的老师们提出了互相矛盾的哲学观,村民们只好去问佛他们应该相信谁。佛说:“你必须自己去思考……这些事情自然会成为你的福祉让你感到幸福,由此,你也可以自在地行事和生活。”很难想象,这样具有经验性的回答来自一个宗教领袖,而非一个科学家。

“亲自看一看”是不言自明的科学信条。进行实验并报告结果是不够的,其他重复这个实验的人必须能获得同样的结果,可以重复的实验被称为具有“可复制性”(replicable)。尽管科学家内心都很敬重可复制性,但是通常不会明确奖励它。

在某种程度上,忽视可复制性是非常自然的。人类的神经系统旨在对快速的变化进行反应,无论是微弱的视觉频闪还是具有冲击性的狂喜。着眼于快速变化才具备适应性,因为我们不需要为那些已经过去的机会或危险费神。但是,面对慢慢变化的问题,固着于变化将是灾难性的,“温水煮青蛙”就是一个例子。

文化会影响我们对变化的关注。在科学中,一些影响力很大的期刊乃至整个科学领域都非常强调新颖,通常都热衷于复制一大堆没有意义、无法发表的成果。更形式主义的是,科学家常常根据它们的新颖性而不是可复制性进行评价。日渐流行的“h指数”用数字量化了它们的影响力。如果某个人发表了5篇论文,且每一篇都被引用5次以上,那么这个人的h指数就是5。某些领域的影响因子具有相关性(比如物理),问题就会出现。比如:某博士可能会通过发表一些具有争议而非可复制证实的研究成果,来获得很高的影响因子。

为什么不创造一个可复制性指数“r”来对影响因子进行补充呢?“r指数”可以用来表示某位科学家首先发现了r个独立效应,而且这些效应被r个研究独立复制证实过。如果某人发表了5种独立效应,每一种效应都被复制证实过5次以上,我们就说其r指数是5。复制指数肯定比引用指数要低,因为文章必须首先发表才能被复制,但它们体现了研究质量的不同方面。除了引用指数之外,复制指数可以应用到杂志和研究领域,抵御并衡量发表作品中的偏差。

复制指数可能对非科学工作者来说更有用。大多数泡在实验室的研究者都会本能地觉得,大多数观点,以及那些偶然产生或解释不严谨的观点都是行不通的。然而,他们知道可复制性意味着他们已经有所收获了。但对公众来说并非如此,公众面对的都是经过可怕的媒体过滤后的科学发现。结果,一般大众和记者一再发现,最近的某个违背直觉的研究结果又被更奇怪的研究结果推翻了。可复制性的测量可以将大众的注意力引导到那些持续进步的研究成果。有了这样的限制,在公共政策中使用可复制性标准就会很有趣,有望以此改善健康、教育状况,并遏制暴力。使用可复制性对优化个人习惯也是非常有利的,如更有效的饮食、锻炼和工作等。

我们应该支持复制,而不是诋毁它。大家总是理所当然地认为复制是偶然,而不应该是一种规则。正所谓水滴石穿,所以,可复制性才能造就最可信的成果,无论是科学研究、媒体报道,还是其他领域均是如此。更广泛地说,可复制性是评估个人与公共政策不可或缺的工具。正如《卡拉玛经》说的那样,复制甚至能让我们知道应该相信谁。