收藏 分销(赏)

应用经济学课件 第3章统计数据的整理与显示.ppt

上传人:xrp****65 文档编号:13337390 上传时间:2026-03-03 格式:PPT 页数:58 大小:1.41MB 下载积分:10 金币
下载 相关 举报
应用经济学课件 第3章统计数据的整理与显示.ppt_第1页
第1页 / 共58页
应用经济学课件 第3章统计数据的整理与显示.ppt_第2页
第2页 / 共58页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第三章,统计数据的整理与显示,第,3,章,统计数据的整理与显示,主要内容和学习目标,统计数据的预处理,(掌握),统计数据的分组整理,(掌握),统计数据的图表显示,(掌握),一、统计数据的预处理,数据的审核,数据的筛选,数据的排序,1,原始数据的审核,:,完整性 准确性,2,次级数据的审核,:,完整性 准确性,适用性 时效性,逻辑检查,准确性审核的方法,计算检查,数据的审核,1,将某些不符合要求的数据,或有明显错误的数据予以剔除;,2,将符合某种特定条件的数据筛选出来,,不符合特定条件的数据予以剔除。,数据的筛选,数据的排序,1,升序,2,降序,Excel,在统计数据预处理中的应用,利用,Excel,的相关命令可以自动完成数据的预处理,有效性命令,“,数据,”,菜单,筛选命令,(,自动筛选和高级筛选,),排序命令,返回,二、统计数据的分组整理,统计分组的原则,品质型数据的分组整理,数值型数据的分组整理,分组整理的概念,分组整理的步骤,分组整理:,就是按照统计研究的目的和要求,,选择一个或几个变量(标志),将总体分为若干组,并将数据分别列入对应的组内进行汇总。,统计分组的核心:,选择分组标志,统计分组的标志:,品质标志,数量标志,统计分组的结果:,组内具有同质性,组间具有差异性,分组整理的概念,按分组标志的多少,按分组标志的性质不同,按分组的作用和任务不同,统计分组的种类,简单分组和平行分组体系,按年龄分组:,按文化程度分组:,20,岁及,20,岁以下,大专及大专以上,21,35,岁,中专、技工,36,50,岁,高中,51,55,岁,初中,56,60,岁,小学、识字不多或文盲,复合分组和复合分组体系,按经济类型分组,按投资规模分组,国有经济投资:,大型,中型,小型,集体经济投资:,大型,中型,小型,外商经济投资:,大型,中型,小型,其他经济投资:,大型,中型,小型,穷尽原则:,使总体中的每一个单位都有组可归,互斥原则:,使总体中的每一个单位只有一组可归,统计分组的原则,分组整理的步骤,第一步:对数据进行分组,第二步:计算各组的频数、频率、累积频数和累积频率,第三步:编制频数分布表,频数,(,Frequency,,,亦称为次数,),是指落入各组中的数据的个数或次数,频率,(,Relative frequency,,亦称比重或百分比),是指各组中的数据个数或次数占全部数据总数的比例,累积频数,(,Cumulative frequencies,),是将各有序类别或组的频数逐级累加起来,累积方法:向上累积、向下累积,累积频率,(,Cumulative percentages,),是将各有序类别或组的频率逐级累加起来,累积方法:向上累积、向下累积,频数分布表,(,Frequency distribution,),是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列而成的表格,分组,频数,频率(),合 计,100,XXX,频数分布表,品质型数据的分组整理,品质型数据的分组方法:,把每一个变量值作为一组,分类数据的频数分布表可以包括:,分组、频数和频率,顺序数据的频数分布表可以包括:,分组、频数、频率、累积频数和累积频率,某城市居民关注广告类型的频数分布,广告类型,人数(人),频率(),商品广告,112,56.0,服务广告,51,25.5,金融广告,9,4.5,房地产广告,16,8.0,招生招聘广告,10,5.0,其 他 广 告,2,1.0,合 计,200,100.0,某城市家庭对住房状况满意程度的频数分布,满意,程度,户数(户),百分比(),向上累积,向下累积,户数(户),百分比(),户数(户),百分比(),非常,不满意,24,8,24,8.0,300,100,不满意,108,36,132,44.0,276,92,一般,93,31,225,75.0,168,56,满意,45,15,270,90.0,75,25,非常,满意,30,10,300,100.0,30,10,合计,300,100,数值型数据的分组整理,数值型数据的分组方法:,单项式分组和组距式分组,数值型的频数分布表可以包括:,分组、频数、频率、累积频数和累积频率,单项式分组:,把每一个具体的变量值作为一组,适用于变量值较少的离散变量的情况,组距式分组:,将全部变量值依次划分为若干个,数值区间,每一个数值区间作为一个组。,适合于变量值较多的离散变量和连续变量的情况,某,200,名手机使用者目前已更换手机数量的,频数分布表,更换手机数量,人数(人),频率(),0,6,3,1,82,41,2,76,38,3,及以上,36,18,合 计,200,100,组距式(等距)分组的步骤,(,1,)计算全距,R,:,或,R,最大值组的上限最小值组的下限,(,2,)确定组数,K,:,组数的多少以能显示数据分布的特征,和规律为宜。,经验公式:,(,3,)确定组距,d,:,一个组的上限与下限之差,(,4,)确定组限:,应遵循,“,不重不漏,”,原则,为便于计算,组距宜取,5,或,10,的倍数,首先确定最小值组的下限,然后利用,组限和组距的关系依次确定其他组限。,(,5,)编制频数分布表,1,、正确使用间断式组限和连续式组限,间断式组限:保证无数据限落在相邻两组上下限之间,连续式组限:遵循,“,上限不在内,”,原则,2,、正确选择第一组的下限和最后一组的上限,第一组的下限:应略小于或等于最小变量值,最后一组的上限:应略大于或等于最大变量值,3,、正确使用开口组形式,第一组:采取,“,以下,”,最后一组:采取,“,以上,”,确定组限的细节问题,1,、使用间断式组限时,各组的组距本组的上限前组的上限,2,、使用连续式组限时,各组的组距本组的上限本组的下限,3,、开口组通常以相邻组的组距为其组距,确定组距的细节问题,1,、不等距分组时需要计算,频数密度,和,频率密度,频数密度频数,/,组距 频率密度频率,/,组距,2,、组距式分组时通常使用,组中值,作为各组数据的代表值,连续式组限,:,组中值(本组下限值本组上限值),/2,间断式组限,:,组中值(本组下限值后组下限值),/2,3,、开口组组中值的确定方法,“,以上,”,组:组中值本组下限值相邻组组距,/2,“,以下,”,组:组中值本组上限值相邻组组距,/2,其他的细节问题,例题分析,某生产车间,50,名工人日加工零件数原始资料(单位:个),117,122,124,129,139,107,117,130,122,125,108,131,125,117,122,133,126,122,118,108,110,118,123,126,133,134,127,123,118,112,112,134,127,123,119,113,120,123,127,135,137,114,120,128,124,115,139,128,124,121,试采用组距式分组法编制频数分布表,排序表,107,108,108,110,112,112,113,114,115,117,117,117,118,118,118,119,120,120,121,122,122,122,122,123,123,123,123,124,124,124,125,125,126,126,127,127,127,128,128,129,130,131,133,133,134,134,135,137,139,139,解:,最大值,139,,最小值,107,(1),计算全距。,R,139,107140-105=35,(2),计算组数。,取,k=7,为宜。,(3),计算组距。,d=35,7=5,(4),确定组限。第一组的下限取,105,,其他组限依次利用组限和组距的关系确定。,(5),编制频数分布表。经分组整理后,可形成一个采用连续式组限编制的频数分布表,也可形成一个采用间断式组限编制的频数分布表。,组距式分组的解题过程,零件数(个),频数(人),频率(),105,110,3,6,110,115,5,10,115,120,8,16,120,125,14,28,125,130,10,20,130,135,6,12,135,140,4,8,合 计,50,100,连续式组距分组频数分布表,使用连续式组限时:各组的组距本组上限本组下限,零件数(个),频数(人),频率(),105,109,3,6,110,114,5,10,115,119,8,16,120,124,14,28,125,129,10,20,130,134,6,12,135,139,4,8,合 计,50,100,间断式组距分组频数分布表,使用间断式组限时:各组的组距本组上限前组上限,Excel,在统计数据分组整理中的应用,利用,Excel,的相关函数、命令和工具可以自动完成,数据的分组整理,品质型数据:,COUNTIF,、数据透视表和数据透视图,数值型数据:,COUNTIF,、数据透视表和数据透视图,(单项式分组),FREQUENCY,直方图工具,(组距式分组),返回,三、统计数据的图表显示,统计表,统计图,统计表的,构成要素:,表头、行标题、,列标题、数字资料,表外附加,统计表,统计表的结构,2003,2004,年城镇居民家庭基本情况表,项目,单位,2003,年,2004,年,调查户数,平均每户家庭人口,平均每户就业人口,平均每户就业面,平均每人全部年收入,平均每人消费性支出,户,人,人,%,元,元,48028,3.01,1.58,52.4,9061.2,6510.94,50430,2.98,1.56,52.35,10128.51,7182.10,资料来源:,中国统计年鉴,2005,,中国统计出版社。,注:本表为城镇居民家庭收支抽样调查材料。,行标题,列标题,数字资料,表头,附加,统计表的设计原则:,“,科学、实用、简练、美观,”,1,、总标题的表述,2,、行、列标题的排列,3,、计量单位的安排,4,、合计栏的安排,5,、表格线的绘制,6,、指标数值的填写,7,、表外附加的设置,常用的统计图有:,柱形图和条形图、饼图和圆环图、,累积频数分布图和累积频率分布图、,直方图、折线图和曲线图,散点图、气泡图和雷达图,统计图,分类数据的显示:柱形图、条形图、,饼图、圆环图,顺序数据的显示:柱形图、条形图、,饼图、圆环图、,累积频数分布图、,累积频率分布图,数值数据的显示:直方图、折线图、曲线图,两个变量之间的关系:散点图,三个变量之间的关系:气泡图,多个变量之间的关系:雷达图,各种统计图的用途,例,1,某城市居民关注广告类型的频数分布表,广告类型,人数(人),频率(),商品广告,112,56.0,服务广告,51,25.5,金融广告,9,4.5,房地产广告,16,8.0,招生招聘广告,10,5.0,其 他 广 告,2,1.0,合 计,200,100.0,柱形图通常用于显示分类数据和顺序数据的分布特征,以及变量值较少的离散数据的分布特征,柱形图,饼形图只能显示一个总体的结构比例,饼形图,例,2,甲乙两城市对住房满意程度的频数分布表,条形图通常用于显示分类数据和顺序数据的分布特征,以及变量值较少的离散数据的分布特征,条形图,圆环图可以显示多个总体的结构比例,每一环表示一个总体,圆环图,累积频数图用于显示顺序数据和数值型数据的分布特征,累积频数图,累积频率图,累积频率图用于显示顺序数据和数值型数据的分布特征,例,3,某生产车间,50,名工人加工零件个数频数分布表,零件数(个),频数(人),频率(),105,110,3,6,110,115,5,10,115,120,8,16,120,125,14,28,125,130,10,20,130,135,6,12,135,140,4,8,合 计,50,100,直方图和折线图主要用于显示数值型数据的分布特征,直方图和折线图,曲线图主要用于显示组数较多的数值型数据的分布特征,曲线图,温度,/,降雨量,/mm,产量,/kg/k,6,25,2250,8,40,3450,10,58,4500,13,68,5750,14,110,5800,16,98,7500,21,120,8250,例,4,小麦产量与降雨量和温度的数据,散点图是用于展示两个变量之间关系的一种图形,散点图,气泡大小表示产量,气泡图是用于展示三个变量之间关系的一种图形,气泡图,项目,城镇居民,农村居民,食品,37.73,41.59,衣着,9.56,11.75,家庭设备用品及服务,5.67,8.20,医疗保健,7.35,5.06,交通通信,11.75,2.24,教育文化娱乐服务,14.38,8.36,居住,10.21,21.66,杂项商品与服务,3.34,1.13,合计,100.00,100.00,例,5,2004,年城乡居民家庭平均每人全年消费性支出构成(),雷达图是显示多个变量的常用方法,也称为蜘蛛图,雷达图,对称分布,右偏分布,左偏分布,正,J,型分布,反,J,型分布,U,型分布,频数分布的类型,End of Chapter 3,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服