我在上文说过,可以选择不同监测所得到的数值和代表数值分配的各种公式,为了方便实验,我选择合理应用机误(P.E)。这里的“机误”,就是半数的监测数值和半数的观察数值到不了平均数值的误差,通俗点说就是,在正反两面的区域内,环绕平均值堆成大于或小于平均数的观察数值。从定义中我们可以看出,机误值可以从实验结果中通过一定的记录得出来,当然,精密的计算会使结果更加准确。
我们可以对实验中的一些监测素材进行有目的的计算,把计算得到的数值按照误差率进行分组,然后就能清楚地看出,在机误的倍数和分数的区域之内,围绕中间值对称分布的特殊数值的数量和我们之前的预期完全一样。
例如,在1000次的监测数值之中,计算结果如下:
我们假设实验过程中存在一种一致性,那么,只要我们说出机误值,就可以分析出所有监测数值的分布特征。同时,环绕的中心数值的对称集中性也是一种精确的度量。也就是说,中心数值的可靠度和精确性也可以得到测量。
我们前面所说的特别监测结果的机误,其实就是集中区域或平均数值的机误。如果对相同的现象观察很多次,每次都把同样多的监测素材组合起来计算中心数值,就可以轻松求得机误值。机误值可以为多次反复的观察所得到的平均数值的变动情况做一个简单的说明,同时也能测量和检验所得到的结果的真实度和可靠度。
通常,我们不需要特别清楚机误值计算方法的原理,只需要清楚它存在的意义就可以了。它告诉我们,根据实验数据得到平均数值和素材的属性是完全可以预期的。这是个一对一的关系,这个由计算而得到的平均数和我们预先假设的平均数的差,并不会超过它机误的数值。其实,我们在实验前假设的准确的平均数是指把监测重复足够多的次数所最有可能得到的平均值。
机误在数学意义上说算是最大的误差,没有比它更大的了。我们可以这样说,预期不实现的可能要远远大于实现的可能。我们把上面的列表仔细观察一下就会知道,随着机误数值的不断增长,由较大的误差所产生的预期不可实现的概率大大增加。具体来说就是,得到的平均值偏离真正的平均数两到三倍的时候,预期发生的概率是92/908,也就是10%的机会。如果相差4个机误,预期实现的概率就非常小,为1/142。