某市对当地的城镇居民家庭基本情况进行了调查,包括家庭的人口、就业人口、月收入、可支配收入和消费支出等项目,得到了大量的统计数据。但是,有的数据出现了不可能有的数值,例如家庭消费支出为零,有的数据缺失,有的数据前后矛盾。基于上述情况,对于得到的这些数据,就有必要进行整理,也就是说,在进行研究分析前,需要对调查所获得的资料预先进行整理。
统计资料的整理,是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是从微观到宏观的飞跃,是统计分析的前提。统计数据的整理是指对所收集到的数据进行加工整理,使之系统化、条理化,以符合分析的需要,包括对原始资料的整理和次级资料的整理。对原始资料的整理,例如,将得到的数据中缺失的数据、错误的数据、矛盾的数据等进行剔除,然后计算得到平均每户家庭人口、平均每个就业者负担人数、人均可支配收入等次级资料;对于这些资料的进一步整理便属于次级资料的整理。
统计数据的具体整理过程,包括数据的预处理、分类或分组、汇总等几个方面;而相同的原始数据,采用不同的整理方法,所获得的整理资料可能会完全不同;在此基础上的统计分析,也就可能完全相反。在具体操作的过程中,需要针对不同的调查问题采取不同的整理方法,以便后续工作的进行。