1、浅谈统计工作中的数据分析统计部门在日常工作中通过各种统计方法所取得的数据,是能够反映国民经济和社会现象的基本情况与基本发展趋势的,我们进行数据分析的目的,就是为了挖掘出数据中隐藏的这些信息,为相关决策的制定提供指导性意见。由此可见,在统计工作中收集数据只是基础,更为重要的是对数据的分析。一、统计工作中数据分析存在的几个问题数据分析在统计工作中的重要性是不言而喻的,要做好数据分析,必须要有良好的数据分析方式,这样才能为相关决策的制定提供有效的参考信息。对于给定的一组数据,倘若使用的方法不恰当、分析得不全面,所得出的结论就会与实际情况有很大差异,因此,数据分析方式的好坏对数据分析的质量有着巨大的影
2、响。在统计工作中,对数据的分析往往存在以下几个较为常见的问题:1、分析方式往往过于偏向使用同比增速同比增速在使用上具有较好的直观性,人们在表达事物的发展状况时,也总习惯于使用同比增速来表示。我们经常能看到类似的分析:我县继续加大能源“双控工作力度,深入推进节能降耗各项工作,形势喜人.我县八大主要耗能行业综合能源消费量为7。16万吨标准煤,同比下降3.5,好于全市平均水平2.1个百分点.其中4个行业的综合能源消费量同比呈下降态势,分别为纺织业同比下降4.8,化学原料和化学制品制造业同比下降6。8,化学纤维制造业同比下降6.2%,非金属矿物制品业同比下降3。0%。对同比增速的使用已成泛滥的态势,然
3、而,同比增速在对事物发展趋势的反映上是片面的,更为重要的是,使用同比增速的提前是两期数据必须口径相同,分析时往往容易忽略这些因素而造成误判。2、分析形势往往局限于使用同比增速人们在判断事物的发展状况时格外地看重同比增速,然而,在一段时期内,如果事物的发展稳定地处于某一水平,那么,在该时期内,使用同比增速不能较好地反映事物的发展状况。日常统计工作中,对形势进行分析时,往往局限于一些指标的同比增速,而忽略了对产业、行业、企业的深入分析,难以正确地把握当前的发展形势,从而使提出的对策缺乏针对性.例如: 近年来,我县万元GDP能耗水平已从0.30吨标煤下降到了0.25吨标煤,然而今年上半年,由于铁路建
4、设项目的开工,目前出现了较大的反弹,万元GDP能耗上升到了0.28吨标煤,万元GDP能耗降低率为12.5,我县节能降耗工作形势异常严峻。上面的分析单从万元GDP能耗降低率一个指标,便判断全县的用能形势不容乐观,然而我们注意到,该县万元GDP能耗水平长期处于0。250。30吨标煤,能将全县能耗水平维持在这样极低的水平,节能降耗工作的形势并不严峻。3、分析数据往往过于主观作为统计工作者,应当客观地看待当前的发展趋势,当形势好时,我们需要分析潜在的问题;当发展不乐观时,我们应当做好预警工作,而不是形势好时浓墨重彩,不乐观时极力粉饰,只有对数据进行客观地分析,才能为相关对策的提出和政策的制定提供有价值
5、的参考,这也是“数海求真”的精神所在。二、做好数据分析的几点建议就统计部门日常工作中的统计分析而言,我认为有几点是需要注意的:1、数据分析需要有维度同比增速主要是为了消除季节变动的影响,用以说明本期发展水平与上年同期发展水平对比而达到的相对发展速度,在方向上,是一种纵向的比较。如图1所示,对某指标进行9月份同比分析,A相对于B增速为正,如果就此而得出结论该指标发展趋势本年优于上年,这显然是不正确的,本年处于下行趋势,而上年处于上升趋势.造成该问题的原因是同比分析缺少横向的比较,因此,在分析中有必要增加环比分析.环比增速一般是指报告期水平与前一时期水平之比,表明现象逐期的发展速度,在方向上,是一
6、种横向的比较.如图2所示,某指标本年度A相对于C增速为负,显示处于下行趋势,上年度B相对于D增速为正,显示处于上升趋势。加入了环比分析之后,我们也就不会再仅凭同比增速而妄下结论了。显然,使用横向与纵向维度相结合的分析方式,有助于减少我们对趋势分析的误判。2、数据分析需要有广度对整体趋势进行研判时,同比和环比的分析很显然在时间的跨度上是不够的,我们还需要将维度拉升,在时间上需要有广度,对数据进行大周期分组比较,采用图表等的方式来展示数据会是比较好的选择。例如:我县某其他营利性服务业企业,2015年12月营业收入550万元,同比增长71。9%,环比增长89。7;2016年1月,营业收入为20万元,
7、同比下降96.4,环比下降92.6。如下图所示:在2015年12月,我们通过同比与环比分析,对该企业的营业收入趋势是极为看好的,然而到了2016年1月,同比与环比的巨幅下滑使我们的判断陷入了极为尴尬的境地。从后面的一段时期的来看,该企业经营状况是稳中有升的,这也使我们清楚地认识到,同比与环比分析在时间上的局限性.显然,结合时间广度的数据分析,有助于我们避免因局部数据的波动而产生的误判。3、数据分析需要有深度我们在维度和广度上对数据进行了分析,这使得我们可以非常准确地对当前的趋势作出研判,做好数据预警和未来发展方向的预测,那么,这样的分析是不是已经到位了呢?这样的分析有没有什么不足之处呢?先来看
8、两个小例子:、有一个男生和一个女生,身高都是1.60米,一年后,两人的身高都长到了1。70米,那谁相对来说长得更快呢?从数据上看很明显是一样快的,而实际上,是女孩长得快一些。通过资料我们了解到男生身高的均值是172cm,标准差是2。8cm,女生身高的均值是164cm,标准差是2。5cm.那么:该男生身高的生长速度=(170cm-160cm)/2。8cm= 3.57个标准差该女生身高的生长速度=(170cm-160cm)/2。5cm= 4个标准差因此,该女生长得更快一些.、有甲、乙两个乡镇,年人均收入水平都是6000元,但是这两地的收入差异却不一样,如果甲乡镇居民人均收入都在6000左右,差异不
9、大,平均收入的代表性较好;而乙乡镇居民年收入差异较大,收入在6000元左右的居民并不多,平均收入水平的代表性比较差;因此甲、乙两个乡镇的收入水平并不完全相同。以上两个例子告诉我们,事物有其自身的特性,事物之间也有差异性,简单地进行表面数据的分析,有时无法了解事物的真实发展状况。我们时常能看到一些县市之间,为了个别指标而你追我逐,似乎指标数据的高低就代表了其经济发展状况的好坏,然而,忽略了各县市自身发展特点和经济基础的差异性,经济发展的好坏又怎能通过一个指标来进行简单地代替呢?最后,值得注意的是维度和广度的分析都是一种外在的、基于图形的分析,对经济运行的趋势也仅是进行初步的预测,还需要进一步通过对产业、行业、企业的深入分析,挖掘数据高低的原因、查找数据运行的短板、了解数据发展的潜力,从而提出有针对性的对策。对数据的分析没有固定的模式,但要尽可能的做到客观和全面,我们进行维度、广度和深度的分析也正是基于这个角度出发的,希望本文能起到抛砖引玉的作用,使广大统计工作者对数据分析能有更多的思考。 课题负责人:吴维宏 执 笔:杨卫5