听觉的特性首先是由音高(pitch)决定的。它始终与乐音(clang)相联系,这种乐音是音调感觉(tone-sensation)的特色。我们从两者中区别出噪音(noise),它是一种声音印象(sound-impression),其中音高或者只能被不确定地感知到,或者一点也感知不到。
在听觉的这三种形式中,最简单的要数音高了,尽管事实上音高不可能与乐音相分离,因为只有在乐音中方可觉察出特定的音高来。然而,这并不妨碍我们暂时不去考虑为音调提供其特定乐音特征的每样东西,而仅仅去注意我们称为音高的音调特性。确实,对感觉的心理学分析要求做出这样一种分解,因为心理学分析的任务是去不断地分解每一种感觉印象,直到分解成最终的元素,这些最终的元素是无法再分的。现在看来,音高是很容易与一种乐音的其他元素相分离的。音高可以保持不变,而感觉印象的乐音特征却在变化。这种情况是经常发生的,例如,当我们在若干不同的乐器上打击出同样的音调时,便会产生这种情况。另一方面,音高也可以变化到一定程度,而听觉印象的乐音特征却保持不变。这种情况发生于当我们在同一件乐器上弹奏相邻的音调时。然而,当两种听觉印象的音调音高十分不同时,乐音特征一般说来随之变化,这种情况很容易通过比较而观察到,例如,在同一架钢琴上弹奏相距甚远的两种音调时。
古人就已知道,音调在客观上由发声体的振动所组成,也由传播声音的空气振动所组成。确实,在非常深沉的音调情形中,这种振动实际上可以为肉眼觉察。同样的情况是,发声弦的振动也可以容易地为肉眼观察到。证明音调来源于振动的最佳方法是由警报器提供的。警报器是为此目的而特别构建的物理仪器。它由一个圆盘组成,圆盘上面置有一系列圆孔,圆盘穿过气流而运动,以至于在任何特定时间内气流经常由于圆盘未打孔的部分和打孔部分的交替而被阻断(图5)。通过调节圆盘转动速度,我们可以随心所欲地发出高音或低音。能够引起一种音调感觉的最低空气振动率是一秒钟大约16次,尽管在有利条件下可能会降到8次。产生这些十分低沉的音调的最佳方法是由大型音叉或振动钢杆提供的。然而,当我们接近知觉的阈限时,音调会变得非常微弱,以至于不管振动如何广泛,也只能在很近的距离内被听到。音乐音阶上最低沉的音调是1秒钟内振动32次到100次之间。随着振动次数的增加,音高便稳步上升。当振动率增加到大约4万次时,音调也随之中止了,我们听到的只是嘶嘶噪声。
只有在音调十分低沉的情况下(这些音调不能用于音乐的目的),我们才能分辨出与它们的振动相对应的空气节拍(air beats)。因此,在较高音调的情况下,我们关于振动率增加的知识并不依赖于对振动的直接知觉,而是依赖于另一种与其密切联系的观察。早在古希腊哲学家毕达哥拉斯(Pythagoras)时代,人们熟悉的事实是,将一根弦缩短一半长度,它的振动率便是原来未缩短时的弦的二倍;当缩短到原来长度的1/4时,其振动率便是原来的四倍,如此等等。现在,对1/2长度的弦来说其音调比原来的高八度音;三度音程部分的音调,就是这八度音的五音;四度音程部分的音调,便是双八度音了。因此,在一根弦的长度与其振动率的一致性关系之定律中包含着另一条重要定律,那就是那些被理解为和谐的音调关系是与振动率的简单比例相对应的。
音调的和谐关系最初是通过它们在音调系列中所产生的更加令人愉悦的特征而从不和谐的关系中被区分出来的。齐唱与齐奏比合唱与和声出现得更早。但是,一旦风俗习惯促使人们使用不同音域的几种声音来演奏一首曲调时,便显露出其他的现象来,它们与音调的同时发音相联系,并且与不同速度的空气振动的同时发生相联系。那就是说,我们不仅能把单一的音调与几种音调组成的一种乐音相区别,而且还能容易地听出这种乐音来,假定这种乐音是和谐的、分离的单音调。这是一个直接的知觉问题,例如,普通的C大调三和弦是由c、e、g三种音调组成的。无论何时,当一种组合的乐音是和谐的时,分离的、同时发生的振动便联合起来产生一种空气的共同运动,它本身由十分简短和一致的循环发生的乐段(period)所组成。图6表明了这种情况,即由一个音调加上它的八度音、它的五音和它的大调三音组成的三个复合乐音。一个新乐段开始的点在每一情形里是用垂直的虚线表示的。在八度音中,联合起来形成复合乐音的两个振动率(vibration-rates)在每个乐段中其比例为1∶2;在五音中,比例为2∶3;而在大调三音中,比例为4∶5。业已发现,类似的简单乐段也会重新出现在其他和谐的双乐音(two-clangs)中;组成振动率的比例在四音的情形里是3∶4;在小调三音中为5∶6,在六音中为3∶5。由于所有这些复合振动率的乐段像单一振动率的乐段一样经常重复,我们便可以理解一种和谐的复合乐音对我们产生的印象如何与单一的音调那样保持一致。事实上,我们在其中区分出一种以上的音调,但是这些音调组合起来形成一种完整的感觉,并以完善的均匀性运作着。
然而,当两种音调在一起发音时,它们的振动率并不代表任何一种简单的与和谐的比率,而是相互之间存在一种更为复杂的关系,这时情况就会十分不同。在这样一种情形里,不可能产生在很短的时间间隔中循环发生的一致乐段,对此现象,我们可以在和谐的复合乐音中找到。作为这种现象的结果,振动的相互作用导致了感觉的一致性过程的失调。正如图7所示的a和b那样,无论何时,当同一方向的两种运动重合时,它们彼此增强;如果两种重合的运动具有相反的方向,正如在m点上那样,那么两种运动便相互削弱。当然,这种情况有赖于振动率的差异,也有赖于空气粒子的前后摆动是否相互一致。如果一种音调恰好在一秒钟内比另一种音调多振动一次,那么在每秒钟内将会发生一次这样的增加或减弱。这是因为,假如在某一秒钟的开始,如在a点开始,两种振动在同一阶段发生,它们将在那一秒钟的中间(如在m点)相遇。这时,一种波的前进运动和另一种波的倒退运动使两种波彼此抵消;可是在那一秒钟的末端,如在b点上,两种波重新以同一方向前进,从而将互相增强。很清楚,如果两种音调的差别是大量振动的差别,那么同样的情况便会发生;也将有许多的增强和减弱(像许多节拍一样),在一种情形里比在另一种情形里存在更多的振动。如果差别很少,例如在几秒钟的过程中只有一次振动的话,那么就几乎不会被注意到,音调的渐弱和渐强会连续地和逐渐地发生。如果这种变化在相当长的时间里传播的话,那么它就不会被觉察出来。但是,如果在一秒钟内发生一个节拍或者几个节拍,那么很清楚它们能被觉察到;如果节拍数增加到10次或者10次以上,那么它们的快速继续将像十分难受的呼吸声被感知到。
可以被感知的不和谐音调的速度之限度无法在任何确切的程度上被确定。这是因为,首先,当节拍一个接着一个越来越快地出现时,就会产生一种刺耳的印象。这种情况或多或少可以与一种粗糙的表面所产生的触觉相比;当速度变得更快,而音调不能作为和声被听到时,节拍甚至乐音的粗糙感也消失了。至于这种刺耳声仍然能被区分的极端限度,看来在一秒钟大约60次节拍左右。
现在看来,对不和谐复合乐音的观察意味着在感知节拍和我们按照音调的振动率而在上述系统阐述过的一些定律之间存在一种矛盾。这是因为,业已发现,当音调振动率差异达到每秒60次以上时,音调仍然能够产生清楚可知的节拍。例如,如果我们从纯平均律(pure temperament)音阶的较低区域或中间区域取出两种相邻的音调c和d,并且将这两种乐音一起敲击,我们便能得到很响的节拍。这种情况在我们上述的例子中是完全可以理解的。因为,如果音调c在一秒钟内振动128次,音调d′经过一秒钟的间歇而增高,则d将振动9/8×128次,即144次。两种音调在一秒钟内将发出16次节拍。但是,如果我们用c敲击高八度音d′,而不是d,我们便会发出2×144次或者288次振动的音调来。它与c的差别达到160次振动。尽管要听清一个接着一个如此快速的节拍是不大可能的,但是,这种复合的乐音不仅不和谐,而且还清楚地伴随着与两个音符(这两个音符实际上是单一的完整音调的拆开)的打击中产生的那些节拍相似的节拍(如果不是像后者一样有力的话)。更高的d′用c打出节拍,而音调c′或者g,八度音或纯平均律音阶上的五音,它们的振动率与c的振动率之差别较小,却不发出引人注意的节拍来,产生这一事实的原因是什么?原因可以从下述简单实验中找到。
当我们弹奏钢琴或吉他时,钢琴或吉他的琴弦伸展在发音板上,其结果当然是一种音调。如果我们在琴弦中央放一块琴马,从而使得只有半根琴弦在振动,其结果是音调上升了一个八音度(octave),正如我们已经说过的那样。首先弹奏基音(fundamental),然后弹八音度,我们就可以见到后者实际上包含在前者之中。它发音,尽管发出的音很微弱,但是却随着基音一起发音。如果首先拨动整根弦,然后拨动1/4琴弦,情形也是一样。可以看到,这里双八音度(double octave)随着基音一起发声,尽管声音很弱,如此等等。如果我们训练我们的耳朵去比较乐音,那么,我们将能够听出这些较高的音调,即泛音(overtones),也就是说,可以从基音中听出泛音来。业已发现,我们的乐器的每种音调和人声的每种音调均包含大量的泛音,因此严格地讲,我们无法感觉一种简单的音调,而是始终感觉几种同时发声的音调。不过,其中一种音调,也即基音,比其他的音调都要强得多,以至于我们通常听不到其他的音调。泛音现象在下述事实中找到了它的物理解释,在音调刺激(tonal stimulation)的大多数形式中,空气中建立起来的声波运动是一种复合运动。例如,当拨动琴弦时,不仅整个长度的琴弦都振动,将基调(ground tone)传播到空气中,而且琴弦的任何一半也振动,尽管振动不是那么的强烈,但确实由于其自身的原因而振动,于是产生了八音度。运用同样的方式,当弦的每1/3或者每1/4振动时,也发生同样情况,从而产生了高八音度的三音,双八音度,并在日益减弱的系列中循环往复地继续下去。这些分离的音调保持着,犹如彼此之间独立的几种乐器同时发出声音一样。唯一的区别在于泛音的强度更弱。
现在,我们可以解释这个十分奇异的事实了,音调c不仅与相邻的d一起打出节拍,而且与高八音度的d′一起打出节拍。与基音c同时提供的是八音度的c′,而且与位于它旁边的d一起打出节拍。这些节拍肯定不像c′直接发音那样发音,部分由于泛音较弱,部分由于节拍彼此跟得很快。但是,这些节拍是完全可以清楚地听到的。
基音和泛音可以同时听到的情况之所以重要,不仅因为它明白地显示了在复合的印象中音调的和谐和不和谐,而且还因为它影响了我们对分离的音调的理解。一件乐器的音调和人声的音调不仅具有音高的特征,而且还具有一定的乐音特征。如果所有的音调单纯地依靠振动率,而振动率则决定所有音调的音高,那么,若不考虑可能偶然地陪伴它们的噪声,具有同样音高的每一种音调,不管它是怎样产生的,会具有同样的特征。当然,情况并非如此。同样的音调用笛子、小提琴、单簧管、风琴等不同的乐器演奏声音会十分不同。振动率一定还有其他特性,因为同一种音调随声源(source of sound)而变化。事实上,我们已经发现,泛音经常伴随着音调,并且表现出差异,这些差异有赖于乐音的起源方式。有一些音调,它们中间几乎极少有任何泛音可以被察觉到。一架风琴的笛状管,其音调已经非常接近于绝对的纯音了,而位于共鸣箱上音叉的音调则还要接近于绝对的纯音。如果共鸣空间正好适合于音叉的原始音调,那么所有的次级音调相比之下是如此微弱,以至于在音调停止时它们不会被听到。另一方面,对管弦乐器和人声来说除了基调以外,还有大量的泛音可以被听见。一般说来,泛音的强度随着其音高而减弱。八音度可以比双八音度更清楚地被听到,而双八音度则比三八音度更清楚地被听到,等等。但是,在不同的乐器中具有相当大的差异。有时,高八音度听起来更强,如在钢琴上那样;有时,则是较高的五音和三音听起来更强,如在单簧管中那样;有时,第一批泛音可以在相对一致的强度上被听到,如在管风琴上那样;有时,只有单一的很高的泛音更容易被听到,如在小号和长号中那样。
我们已经探究了各类乐音的特定音色的诸种情况,一般说来,它们部分地依赖于泛音的强度,部分地依赖于泛音中最强音的特征。