为了反映消费者购买商品和服务而付出的价格变动水平,国家统计局已经持续多年公布居民消费价格指数。通常情况下,国家统计局要公布一些重要城市的居民消费价格指数,就需要对这些城市的食品、烟酒及用品、居住、交通通信、医疗保健和个人用品、衣着、家庭设备和维修服务,以及娱乐教育文化用品及服务等八个部分的消费支出进行统计,也就是要进行数据统计。
统计局进行数据统计,主要是基于两个方面的需要:第一,统计数据是统计研究的出发点,是基础工作,所谓“皮之不存,毛将焉附”。统计数据是统计工作中取得的反映国民经济或社会现象的数字资料,以及与之相关的其他资料的总称,是对客观事物进行计量的结果。第二,数据杂乱无章又浩如烟海,按照不同的标准有不同的分类,如果不进行统计汇总,就很难“挖掘”到有价值的信息。数据按照被描述的对象与时间的关系,分为截面数据、时间序列数据和面板数据;按照计量标准的不同,又分为定类数据、定序数据、定距数据和定比数据。
2009年四大直辖市的GDP截面数据
2009—2014年上海市的GDP时间序列数据
2009—2014年四大直辖市的GDP面板数据
具体来讲,截面数据就是同一时间点上不同主体的数据,比如,将2009年四大直辖市的GDP数据放在一起,就是一组截面数据(见上截面数据表);与之相对的是时间序列数据,如上海市从2009年到2014年的GDP数据(见上时间序列数据表)。以上两者结合在一起就是面板数据,如2009年到2014年四大直辖市的GDP数据(见上面板数据表)。定类数据是按事物的某种属性,对其进行平行的分类或分组,如人口按性别分为男、女两类;按肤色分为白种人、黄种人、棕种人、黑种人四类。定序数据则指用数字表示个体在某个有序状态中所处的位置,例如,“受教育程度”(文盲半文盲=1、小学=2、初中=3、高中=4、大学=5、硕士研究生=6、博士及其以上=7)。定距数据是对事物之间等级差别和顺序差别的一种测度,例如,30℃和20℃之间相差10℃;再比如0等星比1等星亮10倍,-1等星又比0等星亮10倍。定距数据中没有绝对零点(定距数据中的“0”是作为比较的标准,不表示没有)。定比数据就是常说的数值变量,拥有零值且数据间的距离相等是被定义的,包括诸如身高、体重、血压等的连续性数据;也包括诸如人数、商品件数等离散型数据。
在统计数据的过程中,有一个很重要的问题,那就是统计数据质量,它直接关系到统计结果的准确性。统计数据的质量好坏,可以从统计数据的误差中体现出来。统计数据的误差,包括系统误差和随机误差,在数据统计的过程中,要注意尽量消除系统误差。