其实,“恒定平均值”的出现虽然有重要意义,但依然没有给我们的问题带来明确的答案,假设我们采用某种特殊的方法,找到了我们记忆过程中一致的严谨的平均数值,我们又如何知道我们是否能好好利用它假设一种单纯的有因果作用的条件呢?
物理学家在实验前一般都知道他要解决一种单一的因果集合,而统计学家在实验前知道他要处理大批量的多个因果集合,而这些集合并不容易分析清楚。从最基本的知识中,我们了解到,他们在进行下一步的研究之前就知道了这一实验的属性。
以前,我们所具备的心理学知识太宽泛,细分度非常差,我们根本不知道怎样在实验中固定各种条件或调节各种环境。到了现在,我们已经证实了以前所做的准备工作远远不够,而且,我们在关于记忆的实验中不能确定我们要分析一种单纯的原因集合,还是要分析多个原因、多个作用的整体集合。总而言之,这些问题是要告诉我们,由其他的各种标准把实验环境和条件控制一致所得出的结果,能使我们透彻地了解记忆的本质。
实际上,运用我们现有的先进知识仍然不能得到绝对准确的数值,但却为得出最满意的结果增加了无限种可能性。我们在实验中采用了与物理学相类似的研究方法,即与研究物理常数和物理效果相同的预测,这就是一个好开端,与不借助于原因的、具有许多特性的特别数值环绕中间值进行对称分配是一样的道理。把这些通过计算所得到的数值同真实监测所得到的结果作一个重复的比对,我们就能看出两者存在很大的共性。这样就可以轻松地使结果相一致。
这样的预测,表明现实与结果是非常相近的,它的重点就是,把大量的、以前多次提到过的变动产生的原因中相类似的数值提取出来,并小心地合并,合并后的结果可以用一个数学公式表达出来,就是所谓的“误差率”。
在这里,误差率最重要的一个特点就是它包含的未知数值只有一个。而这个未知的数值就是具有不同特点的个别数值向中间值集中能力强弱的数量测定,它随着观察素材种类的不同而不停波动,但可以由个别数值通过计算来确定。
对于这个公式的具体情况,我们不做详细的讲解,有兴趣的朋友可以查看关于概率算法和误差理论的书籍。当然,对于没有时间看教科书而又对这些理论不熟悉的朋友来说,一个直观的图解比任何公式都更容易让人理解。我们可以假定,在一个实验中观察了1000次,每一次观察的记录材料用一个1平方毫米的区域表示,它具体的数值或者它和这1000次观察所得到的数值的差异性可用图2-5-1来说明:
图2-5-1
如图2-5-1,我们把每一次相对于中心值的观察结果在mn先上画大约1平方毫米,把每一次比中心数值大一个单位的监测结果,在mn线右边1毫米的位置画1平方毫米。对于中心数值X,比其数值高的和比其数值低的监测结果分别画在mn线右边和左边距离X单位的区域。我们把所有监测到的结果都按这种方式规划好后,整个图形的外观就变得非常整齐,小平方形的外角形成了一条左右对称的曲线。如果这些特别的数值实际性质就是如此,那么它们的中心数值就和物理学中的常数是一样的,而曲线的具体外观就和图2-5-1一模一样。我们假设,中间数值是一种统计常数,那么曲线的形式就会多种多样,因为图中的pq线和曲线a、b都包含1000平方毫米,但这要以在水平线和曲线都能够无止境延长为前提。图中,水平线和曲线的两端非常接近,所以,图形两端没有画出来的地方各包含总量的2~3个平方毫米,水平线和曲线并不能无限制地按照一定的规则延伸。
由一组监测所得到的曲线的外感究竟是扁平的还是高耸的?这取决于所监测对象的性质。监测越是精确,每个数值就越接近于中间数值,出现较大偏差的概率就小,曲线的外观就变得高耸。因为形成曲线的各种规则的其他因素都是基本相同的,因此,对于任何一组实验的特定观察,一个人如果有最精密的监测和集中性的测量,那他就可以得到几乎所有的观察数据。例如,精密观察之后,我们可以准确说出相对应的数值发生偏差的具体次数是多少以及在一定的区域内可能发生多少次的偏差。
还有一点,我们可以知道在特定的数值和中间值之间的特别数值是多少,也可以知道,相对于全部的监测结果,它占到了多少百分比。例如,在图2-5-1中,横轴+W和-W两根线之间已经包括了代表全部观察结果空间的一多半。但实际上,我们在更精确的记录和观察中我们发现,+W和-W与mn的距离不足a图的50%。所以,我们只需要准确说出相对距离就可以,这也是监测精确性的一个重要指标。
所以,只要得出一组实验的结果,我们就可以认为每一次实验结果都是由完全相同的原因集合所产生,这些原因集合相对恒定,但还是会受到一些偶然发生的事件的干扰,造成这些结果的数值都是按照误差率进行统一配置的。
这个定理是完全正确的,但却不能反推,也就是说,“得出的数值是按照误差率进行分配的”这句话是不正确的。因为自然现象是复杂多变的,它很可能会用更为难理解和无规律的方式产生各种各样我们无法观察的组合,在实际中,这种情况很少发生,但并不是没有。
对统计学来说,在变化为平均数的所有的数值集合中,至今没有发现哪一种是毫无差别产生一定数量的因果系统。不过不管理论如何,依靠误差率分配总是可以的。
例如,在生育问题上,我们统计的男孩儿与女孩儿在数量上的分配据说就很接近误差率,但是在这些个别的案例中,这些结果是由单纯的生理原因的各种集合造成的,以至于形成了一种特定的数量关系。
所以,我们可以认为,误差率以及与之相关联的各种规律虽然并不十分可靠,但却有相当统一的标准,也能解决我们在实验中的许多难题。我们可以用误差率及其相关规律判断实验中任何形式的平均数的由来过程是否能够作为真正的科学常数来应用,而由于误差率的局限性,它虽然不能为这样的应用提供充足的条件,但却能为实验提供很多有必要的条件。总而言之,必须要依赖误差率来保证一种最基本的研究结果。所以,误差率的准则可以为我们解决很多先前无法解决的问题。现在,我们可以解决先前那个困扰我们的问题,就是“如果我们把实验条件和环境尽可能控制得一致,并且朗读和背诵都应用同样的材料,达到第一次重复出现所需要的平均值,可以作为自然科学意义上的恒定的平均数”?