收藏 分销(赏)

统计资料整理.ppt

上传人:w****g 文档编号:13180888 上传时间:2026-01-30 格式:PPT 页数:56 大小:685.04KB 下载积分:8 金币
下载 相关 举报
统计资料整理.ppt_第1页
第1页 / 共56页
统计资料整理.ppt_第2页
第2页 / 共56页


点击查看更多>>
资源描述
3-,*,经济、管理类,基础课程,统计学,Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,统计资料整理,第一节 统计资料整理的一般问题,一,.,统计整理,统计整理的内容,统计资料的审核和汇总,统计整理,统计整理的概念:,根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,已反映现象总体特征的工作过程,统计整理的内容,资料审核,划类分组,资料汇总,编制统计表、统计图,资料的审核,数据的审核,发现数据中的错误,数据的筛选,找出符合条件的数据,数据排序,发现数据的基本特征,升序和降序,资料的审核,(原始数据),审核的内容,完整性审核,检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全,及时性审核,检查数据是否及时报送,3.,准确性审核,检查数据是否真实反映客观实际情况,内容是否符合实际,检查数据是否有错误,计算是否正确等,数据的审核,(原始数据,审核数据准确性的方法,逻辑检查,从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象,主要用于对定类数据和定序数据的审核,计算检查,检查调查表中的各项数据在计算结果和计算方法上有无错误,主要用于对定距和定比数据的审核,资料的审核,(汇总后的资料),审核的方法,复计审核,对每个指标数值进行复核计算,表表审核,检查不同统计表出现的同一指标数值是否一致,对照审核,表实审核,统计汇总,基本组织形式,逐级汇总,自下而上逐级对资料进行汇总:,GDP,集中汇总,将资料集中在最高机关或指定机构进行汇总,综合汇总,基本资料逐级汇总,其他资料集中汇总,第二节 统计分组,一,.,统计分组的概念和作用,统计标志的选择,统计分组的方法,统计分组的概念,根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。,相对于总体的“分”,个体的“合”,统计分组的作用,区分社会经济现象的类型,、公司、信托 公司、证券 公司等等,反映社会经济现象总体的内部结构,性别结构、学历结构、年龄结构、地区结构,反映社会经济现象之间的依存关系,收入与长相之间的关系、价格与公司业绩的关系,分组标志的选择,根据统计研究的目的选择,选择现象中最具有本质特征的标志,学生:男、女;大学:1本、2本、3本、大专,结合被研究对象所处的 条件合经济状况选择,封建社会与资本主义社会,发展中国家与发达国家,统计分组的方法,分组方法,分组方法,单项式分组,组距式分组,品质标志分组,数量标志分组,品质标志分组,例:对我校学生按品质标志进行分组,按性别分组,按学院分组,按来源地分组,是否可以按照年纪来分组?,分组方法,分组方法,单项式分组,组距式分组,品质标志分组,数量标志分组,单项式分组,(要点),1.,将一个变量值作为一组,2.,适合于离散变量,3.,适合于变量值较少的情况,根据统计研究的目的选择,频 率:某一组单位个数占总体单位的比重,适合于变量值较少的情况,适合于变量值较少的情况,统计分组的概念和作用,例:对我校学生按品质标志进行分组,图3-10 某车间工人日加工零件数的直方图,表3-3 某车间50名工人日加工零件数分组表,检查调查表中的各项数据在计算结果和计算方法上有无错误,适合于变量值较多的情况,等距分组表(使用开口组),适合于变量值较多的情况,相对于总体的“分”,个体的“合”,即直方图(Histogram),等距分组表(上下组限重叠),117 122 124 129 139 107 117 130 122 125,对于没有数字的表格单元,一般用“”表示,五、平均每人实际支出,单项式分组表,(实例),表,3-1,某车间,50,名工人日加工零件数分组表,零件数,(,个,),频数,(,人,),零件数,(,个,),频数,(,人,),零件数,(,个,),频数,(,人,),107,108,110,112,113,114,115,117,118,1,2,1,2,1,1,1,3,3,119,120,121,122,123,124,125,126,127,1,2,1,4,4,3,2,2,3,128,129,130,131,133,134,135,137,139,2,1,1,1,2,2,1,1,2,组距分组,(要点),将变量值的一个区间作为一组,适合于连续变量,适合于变量值较多的情况,必须遵循“不重不漏”的原则,可采用等距分组,也可采用不等距分组,组距分组,(步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按,Sturges,提出的经验公式来确定组数,K,确定各组的组距:组距,(Class Width),是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即,组距,(,最大值,-,最小值),组数,根据分组整理成频数分布表,组距分组,(几个概念),1.,下 限:,一个组的最小值,2.,上 限:,一个组的最大值,3.,组 距:,上限与下限之差,4.,组中值:,下限与上限之间的中点值,等距分组表,(上下组限重叠),表,3-2,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,110,110,115,115,120,120,125,125,130,130,135,135,140,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,等距分组表,(上下组限间断),表,3-3,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,109,110,114,115,119,120,124,125,129,130,134,135,139,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,等距分组表,(使用开口组),表,3-4,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),110,以下,110,114,115,119,120,124,125,129,130,134,135,以上,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,统计分组的形式,统计分组形式,分组形式,简单分组,复合分组,分组体系,简单分组,(举例),表,3-5,某城市居民关注广告类型的频数分布,广告类型,人数,(,人,),比例,频率,(%),商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告,112,51,9,16,10,2,0.560,0.255,0.045,0.080,0.050,0.010,56.0,25.5,4.5,8.0,5.0,1.0,合计,200,1,100,复合分组,(举例),表,3,-,6,某大学在校学生人数表,指标,人数,(,人,),比例,频率,(%),大一,男,女,大二,男,女,大三,男,女,大四,男,女,合计,分配数列的概念和种类,第三节 分配数列,分配数列的概念和分类,数量数列分布表与分布图,次数分布的一般特征,几个概念,1.,分配数列,:,用来反映总体单位在各组中分布状 况的统计数列,2.,频 数:,落在各组中的统计单位个数,3.,频 率:,某一组单位个数占总体单位的比重,变量数列分布表,编制频数分布表的步骤,排列数据,编制频数分布表的步骤,确定组数,计算频数,编制表格,确定组距,次数分布表的编制,(实例),117 122 124 129 139 107 117 130 122 125,108 131 125 117 122 133 126 122 118 108,110 118 123 126 133 134 127 123 118 112,112 134 127 123 119 113 120 123 127 135,137 114 120 128 124 115 139 128 124 121,【,例,3.1】,某生产车间,50,名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,单变量值分组表,表,3-7,某车间,50,名工人日加工零件数分组表,零件数,(,个,),频数,(,人,),零件数,(,个,),频数,(,人,),零件数,(,个,),频数,(,人,),107,108,110,112,113,114,115,117,118,1,2,1,2,1,1,1,3,3,119,120,121,122,123,124,125,126,127,1,2,1,4,4,3,2,2,3,128,129,130,131,133,134,135,137,139,2,1,1,1,2,2,1,1,2,等距分组表,(上下组限重叠),表,3-5,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,110,110,115,115,120,120,125,125,130,130,135,135,140,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,等距分组表,(上下组限间断),表,3-8,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),105,109,110,114,115,119,120,124,125,129,130,134,135,139,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,等距分组表,(使用开口组),表,3-9,某车间,50,名工人日加工零件数分组表,按零件数分组,频数(人),频率(,%,),110,以下,110,114,115,119,120,124,125,129,130,134,135,以上,3,5,8,14,10,6,4,6,10,16,28,20,12,8,合计,50,100,区分社会经济现象的类型,检查数据是否有错误,计算是否正确等,第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴,人均月消费性支出(元),是否可以按照年纪来分组?,试采用单变量值对数据进行分组。,表3-5 某城市居民关注广告类型的频数分布,确定各组的组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即,分组数据折线图(折线图的制作),适合于变量值较少的情况,次数分布图,简单次数分布图示用,Excel,作图,以下图形均由,计算机绘制,!,Excel,STATISTICA,单项式数列次数分布图,(折线图的制作),以横轴代表变量值,以纵轴代表次数。,用折线连接各组变量相应的分配次数所对应的坐标点。即得到分布曲线,(Frequency ploygon),分组数据,直方图,(直方图的制作),以横轴代表变量值,以纵轴代表次数。,以各组组距为宽,以各组次数为高,绘出对应的矩形。,So,各组矩形面积占矩形面积和的百分数与该组频率相同。即直方图,(Histogram),分组数据,直方图(,直方图的绘制),频,数,(,人,),15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数,(,个,),图,3-10,某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在,120,125,之间,!,分组数据,折线图,(折线图的制作),折线图也称频数多边形图,(Frequency polygon),是在直方图的基础上,把直方图顶部的中点,(,组中值,),用直线连接起来,再把原来的直方图抹掉,折线图的两个终点要与横轴相交,具体的做法是,第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴,折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数,(,个,),频,数,(,人,),折线图下的面积与直方图的面积相等!,分组数据,折线图,(折线图的绘制),图,3-11,某车间工人日加工零件数的折线图,累计次数分布,意义:,知道截至某一组变量值以下或以上的对应分配次数是多少,计算:,计算累计次数和累计频率,方法:,以下累计和以上累计,累计次数分布图,人均月消费性支出(元),累计次数,图,3-12,家庭月人均消费性支出累计次数分布图,次数分布的类型,次数分布的类型,对称分布,右偏分布,左偏分布,正,J,型分布,反,J,型分布,U,型分布,图,3-17,几种常见的频数分布,第四节 数据显示,一,.,统计表的构成,二,.,统计表的设计,统计表的结构,表,3-1997,1998,年城镇居民家庭抽样调查资料,项目,单位,1997,年,1998,年,一、调查户数,二、平均每户家庭人口数,三、平均每户就业人口数,四、平均每人全部收入,五、平均每人实际支出,消费性支出,非消费性支出,六、平均每人居住面积,户,人,人,元,元,元,元,平方米,37890,3.19,1.83,5188.54,4945.87,4185.64,755.94,11.90,39080,3.16,1.80,5458.34,5322.95,4331.61,987.17,12.40,资料来源:,中国统计摘要,1999,,中国统计出版社,,1999,,第,79,页。,注:,1,本表为城市和县城的城镇居民家庭抽样调查材料。,2,消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗,保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。,行标题,表头,列标题,数字资料,附加,要合理安排统计表的结构,表中的合计栏可以排在前面,也可以排在最后,如果只列出其中部分项目时,则合计栏必须排在前面,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明,表中的上下两条横线一般用粗线,其他线用细线,通常情况下,统计表的左右两边不封口,表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一,对于没有数字的表格单元,一般用“,”,表示,必要时可在表的下方加上注释,统计表的设计,圆形图(补充),(由,Excel,绘制的圆形图),其他广告,1.0%,房地产广告,8.0%,商品广告,56.0%,金融广告,4.5%,服务广告,25.5%,招生招聘广告,5.8%,图,3-,某城市居民关注不同类型广告的人数构成,本章小结,统计整理的概念和内容,统计分组的作用及分组方式,分配数列,用Excel,作,次数分布表和图形,统计表的编制,结 束,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服