汤姆·格里菲思(Tom Griffths):加州大学伯克利分校计算认知科学实验室、认知与脑科学研究所主任,心理学副教授。
持有偏见看起来是件糟糕的事情。直观地说,我们将理性等同于客观。面对难题时,一个理性主体似乎不应该倾向于某种答案。如果一个用于在图像中查找物体或诠释自然语言的新算法会产生偏差,那么它听起来就不是个好算法。而当心理学实验结果显示,人们所做的决定和判断都有失偏颇时,我们就开始质疑人类的理性。
然而,偏见并非总是无益。事实上,对于某些问题而言,提供更好答案的唯一方法就是有所倾向。
人们解决的最具挑战性问题中的大部分都是归纳性的。根据现有的证据无法得出确切的答案,从图像中找物体和阐释自然语言就是其中两个经典例子。图像为二维排列的像素——一组可以显示位置亮暗或蓝绿等信息数字,而物体则是三维形式,许多不同的三维形式结合在一起,可以产生一组像素和相同模式的数字。观察特定的数字模式,无法知道我们看见的到底是哪一个形式,我们必须根据现有的证据做出猜想。同样,从人类语言的原始声音模式中提取单词,也需要对一个人所说的某句话进行适当猜测。
成功解决归纳性问题的唯一办法就是有所偏好,因为根据现有的证据不足以确定正确答案,你需要依赖于证据之外的某些东西。你在多大程度上能解决问题,即你猜想的准确率有多高,都依赖于反映不同答案可信度的各种偏向。
人类非常擅长解决归纳性问题。在图像中寻找物体和阐释自然语言两方面,人类做得依旧比计算机好,原因在于人类思维在此过程中精心调整了自己的倾向。
在许多视错觉(导致人类的片面猜测和实际物体之间差异的图像)中,人类视觉系统所产生的偏差是非常明显的。真实生活中视错觉十分罕见,这表明了偏差的实用性。通过研究人类视觉系统易受影响的各种幻象,我们可以识别那些引导感知力的偏见,并将其实例化,用于计算机算法。
打电话或曲解歌词时,我们可以看到人类在阐释语言方面的偏见,也能轻易在语音识别软件中发现。有一次,我锁好门之后离开办公室去开会,回来时发现有陌生人闯进过,在我的电脑中输入了一些诗意的句子。这个人是谁?这条信息又是什么意思?我既害怕又困惑,几分钟后,我意识到自己走的时候忘了关语音识别软件,这几行字就是它对窗外树叶沙沙声的意思猜测。但是,这些相当易懂的英文句子反映出软件所带的偏见,它甚至都没有考虑过声音的来源是风而非人。
人类所擅长的语言和视觉在很大程度上取决于我们对特定答案的偏向,能成功解决这类问题的算法也具有相似的倾向性。所以,看到人类在其他方面也有偏见,我们也不必意外。这些偏见未必说明人类不够理性,而是反映出待解决问题的难度。促使计算机更好地处理这些问题的一种方法便是确切了解人类对于不同问题的倾向。
我认为偏见并不总是坏事,但不是说它一定是好事。客观性是我们在道德层面所追求的理想状态,比如评价他人。具备的时间与信息越多,就越客观。但这种客观性并不常见,因为在有限的时间和证据下,很难得出正确的结论。处理归纳性问题时,有所倾向也是可取的。