冗余度压缩和模式识别

时间:2024-11-30 16:53:02

理查德·道金斯(Richard Dawkins):进化生物学家,牛津大学教授,英国皇家科学院院士,著有《自私的基因》《道金斯传》。

冗余度压缩和模式识别

什么是深邃、美妙而优雅?一个理论之所以简洁优雅,其中一半的功劳要归于它以小明大、见微知著的威力。说到此,只有达尔文的自然选择学说力拔头筹。自然选择学说所包含的内容犹如恒河沙数,数不胜数,该理论阐释了一切与生命相关的事物,包括生命的复杂性、多样性,甚至包括被精心设计出的错觉等,这些阐释都被细化到了微渺之处,而且这些微渺需要进行假定,因为随机变化的基因通过地质时间而非随机地存活了下来。在人类认知领域中,从未有过一个理论能像自然选择学说一样,可以在如此少的假设中,阐释出这么多事实。它真是深邃且优雅,其深度之深,直至19世纪末期,人类都未曾探知。另一方面,对某些人而言,自然选择学说太具破坏性、太奢侈浪费、太残忍不堪,因此很难与“美妙”二字相提并论。但通常情况下,我相信还是会有人选择达尔文的学说。那我就先来谈谈达尔文曾外孙的理论,最后再回过头来讨论达尔文的自然选择学说。

英国皇家学会会员霍勒斯·巴洛(Horace Barlow)先生是霍勒斯·达尔文爵士(Sir Horace Darwin)最小的外孙,而霍勒斯·达尔文爵士则是查尔斯·达尔文最小的儿子。如今,霍勒斯·巴洛先生虽已有90岁的高龄,但依然是威名赫赫的剑桥神经生物学家。今天我想讨论的这个理论是关于冗余度压缩和模式识别的,巴洛先生在1961年发表的两篇论文中曾经提及过。因其深远的影响力和重要性,这个理论在我今生的研究生涯里始终激励着我。

神经生物学理论中有一个神秘的“祖母神经元”,又名祖母细胞。当某个极为特定的图像,比如美国神经生物学家杰里·莱特文(Jerry Lettvin)的祖母的头像出现时,这个或这组细胞就会激活并映射在视网膜上(莱特文与巴洛先生一样,从事的是青蛙视网膜的研究工作)。问题的实质在于,莱特文祖母的头像仅仅是由大脑识别出的无数图像中的一个而已。如果人类拥有一个可供我们识别万物的特定神经元,不仅仅是莱特文的祖母,而是众多其他人的脸庞、物体、字母、花朵,并且每一个都能从众多的角度和距离见到,那我们人类面对的将是一个组合式大爆炸。如果感官识别是依靠“祖母原则”来运行的,那么特定识别的神经元数量,即用于神经脉冲的所有可能组合数量将超过宇宙中原子的数量。美国心理学家弗雷德·艾特尼芙(Fred Attneave)曾经进行过推算,人类的脑容量可以以立方光年为单位来测量。巴洛和艾特尼芙二人各自独立地提出了运用冗余度压缩的原理来解释这个问题。

信息论的创始人克劳德·香农(Claude Shannon)提出,“冗余度”(redundancy)是一种信息的倒置。在英语里,紧随“q”这个字母的往往是“u”,于是在不丢失信息的情况下,字母“u”完全可以被省略掉。“u”就可以被称为是冗余的。无论何时冗余出现在一组信息里(这不会是随机的),人们都完全可以更加简洁地记录信息但不丢失信息,虽然在修正错的误能力方面会略有缺失。巴洛认为,在感觉传导路径的每个阶段中,都存在着若干调整机制,以此来清除大量的冗余度。

时间“t”这一点上的世界,与时间“t-1”这一点上的世界并无多大差别。因此,对感官系统而言,没必要对世界的状态进行持续不断的反馈。它们需要的仅仅是“变化”的信号,这种变化能够让大脑处于一种假定状态中,即假定没有被反馈的事物依旧保持着原来的状态。感官适应是感觉系统里最著名的一个特征,这个特征正如巴洛先生所指定的那般精准地显现了出来。举个例子,如果一个神经元正在标志温度,并非如人们天真地设想的那样,即该神经元发射信息的频率与温度成正比。截然相反的是,仅仅在温度出现一个变化时,这个频率才会得以提升。紧接着,它逐步衰减到一个缓慢的、休眠的频率。与此相同的还包括标志亮度、响度、压力等的神经元。通过挖掘世界的时间序列中的非随机性,感官适应获得了巨大的经济效能。

感官适应系统在时间领域里所获取的,与侧抑制(lateral inhibition)固定现象在空间领域里所获取的完全一样。假设将生活中的一幕场景放到一个像素化屏幕里,该屏幕就好比是一个数码相机的后台或一双眼睛的视网膜,放眼望去,大多数的像素全都一模一样。这其中只有落在边缘和边界上的像素看上去与众不同。如果每个视网膜细胞都能够忠实地向大脑报告其光值,那么大脑将会遭到一条巨量的冗余信息的轰炸。但如果大多数到达大脑的脉冲来源于沿着场景边缘的像素细胞,那么大脑就获得了巨大的经济效能。于是,大脑才能假定边缘之间的空间能保持均匀性。

正如巴洛先生所说,以上正是侧抑制获得的结果。举例来说,在青蛙的视网膜上,每一个神经节细胞都源源不断地向大脑传输着信号,在其视网膜表层的特定位置上报告着光的强度。但与此同时,神经节细胞也向其最近的细胞发送着抑制信号。这说明向大脑传输强信号的是那些位于边缘的神经节细胞。与位于边缘区域的细胞不同,因为受到邻近细胞的抑制,位于均匀彩色区域的绝大部分神经节细胞向大脑传输的脉冲信号少之又少。基于此,信号方面的空间冗余就被消除了。

巴洛学派的分析逐渐延伸成为现代的感官神经生物学,包括1981年的诺贝尔生理学及医学奖获得者休伯尔(Hubel)和威塞尔(Wiesel)著名的水平线以及垂直线探测神经元(直线为冗余,从端线重组),以及由杰里·莱特文和其团队发现的青蛙视网膜中的运动“缺陷”探测。在青蛙的世界里,运动呈现出一种非冗余的变化。但如果始终以相同的速度保持着相同的方向,那么运动也是冗余的。毫无疑问的是,莱特文和他的团队在青蛙的研究中发现了一个“奇异”的神经元,只有当运动着的物体做出一些意想不到的行为,比如加速、减速或改变方向时,神经元才会输出信号。这种奇异神经元会被调节,以此过滤掉高阶序位的冗余度。

巴洛先生指出,从理论上讲,通过对一个特定动物的感官过滤器进行研究,可以证实,冗余度存在于动物世界。它们构成了一种可以使用统计特性来描述的动物世界。这也提醒了我,我刚刚说过我要返回来讨论达尔文的进化论。在《解析彩虹》(Unweaving Rainbow)中,我曾指出,一个物种的基因库是一本“基因的度亡经”(Genetic Book of the Dead)。这本经书根据来自远祖世界的编码描述所撰写,而那些在远祖世界里的物种基因,则是经历过地质年代留存至今的。自然选择其实是一台标准的计算机,在这个生生不息的世界里,它自始至终都在进行着冗余度,也就是重复模式的检测,这样,各类物种才得以留存和传承;所有物种中,50%是两性繁殖,另50%则是无性繁殖。试问我们能否把巴洛先生的感官系统神经元理论,运用到对基因库里自然胜出的基因进行平行分析呢?如果能做到,它就将被称为深邃、美妙而优雅的科学理论。

注:本文作者理查德·道金斯的《道金斯传》(全2册)已由湛庐文化策划,北京联合出版公司出版。