收藏 分销(赏)

社会统计资料的整理.pptx

上传人:w****g 文档编号:4336160 上传时间:2024-09-07 格式:PPTX 页数:57 大小:665.54KB 下载积分:14 金币
下载 相关 举报
社会统计资料的整理.pptx_第1页
第1页 / 共57页
社会统计资料的整理.pptx_第2页
第2页 / 共57页


点击查看更多>>
资源描述
一、考核知识点一、考核知识点(一)统计分组的原则与标准(一)统计分组的原则与标准(二)统计表(二)统计表(三)变量数列的编制(三)变量数列的编制(四)统计图(四)统计图二、考核要求二、考核要求(一)统计分组原则与标准(一)统计分组原则与标准、识记:()统计分组;()频数分配数列;、识记:()统计分组;()频数分配数列;()品质数列和变量数列。()品质数列和变量数列。、领会:统计分组的关键。、领会:统计分组的关键。、应用:在社会统计工作和研究中掌握统计分组、应用:在社会统计工作和研究中掌握统计分组的原则。的原则。(二)统计表(二)统计表、识记:()统计表;()主词与宾词;(、识记:()统计表;()主词与宾词;(3 3)统计)统计表格式;表格式;、领会:简单表、简单分组表、复合分组表和简单设计、领会:简单表、简单分组表、复合分组表和简单设计、复合设计。复合设计。、应用:掌握统计表制作的一般规则。、应用:掌握统计表制作的一般规则。(三)变量数列的编制(三)变量数列的编制、识记:()变量;()频数;()相对频数(频、识记:()变量;()频数;()相对频数(频率);()单项式变量数列和组距式变量数列;()率);()单项式变量数列和组距式变量数列;()等距与异距;()开口与闭口;()上限、下限和组等距与异距;()开口与闭口;()上限、下限和组距;()组中值;()频率(频数)密度;()距;()组中值;()频率(频数)密度;()累计频数(累计频率)。累计频数(累计频率)。、领会:组数、组距和全距三者的关系。、领会:组数、组距和全距三者的关系。、应用:()对离散变量编制单项式变量数列或组距式、应用:()对离散变量编制单项式变量数列或组距式变量数列;()对连续变量编制组距式变量数列;()变量数列;()对连续变量编制组距式变量数列;()掌握频数(频率)密度和标准组距频数(频率)的换算方掌握频数(频率)密度和标准组距频数(频率)的换算方法;()掌握向上(或向下)累计频数(或频率)。法;()掌握向上(或向下)累计频数(或频率)。(四)统计图、识记:()直方图;()折线图;()曲线图;()累计频数(频率)分配曲线;()正态分布和偏态分而;()洛仑兹曲线。、领会:()各种统计图之间关系;()洛仑兹曲线和基尼系数的意义、应用:()学会绘制直方图、折线图、曲线图及累计频数(频率)分配曲线;()学会绘制洛仑兹曲线;()学会计算基尼系数。统计分组的原则统计分组的原则第一节第一节 统计分组的原则与标准统计分组的原则与标准 1分组应使各类别构成之和等于总体分组应使各类别构成之和等于总体 “穷举穷举”“互斥互斥”2分组设计应能反映统计总体的分布规律性分组设计应能反映统计总体的分布规律性 统计分组主要是为了能很好地反映统计总体的构统计分组主要是为了能很好地反映统计总体的构成状况,即反映总体中各单位的分布特征。分组设计成状况,即反映总体中各单位的分布特征。分组设计要适应这一要求,必须在分组后使总体单位总数在各要适应这一要求,必须在分组后使总体单位总数在各组的分配情况能够反映总体的分布规律性。组的分配情况能够反映总体的分布规律性。某社团成员的构成某社团成员的构成 性别性别 人数人数 男男 女女 28 22 人数人数 年龄年龄 3 7 12 18 1055-6535-45 45-5525-3515-25频数分布数列频数分布数列 在统计资料搜集的在统计资料搜集的基础上,按分组原则,基础上,按分组原则,将总体中所有单位依一将总体中所有单位依一定顺序归类整理,即可定顺序归类整理,即可得到能够表明总体单位得到能够表明总体单位总数在各组分配情况的总数在各组分配情况的频数频数(或次数或次数)分布数列,分布数列,简称数列。频数分布数简称数列。频数分布数列是统计分组工作的产列是统计分组工作的产物。物。品质数列品质数列 变量数列变量数列 100名男性青年的身高表名男性青年的身高表 单位:厘米单位:厘米第二节第二节 统计表统计表 166 181 173 171 168 164 178 167 156 194 169 175 183 168 165 180 170 172 167 175 173 169 174 172 171 169 173 184 173 169 170 181 185 168 174 187 167 174 169 165 167 172 174 173 155 179 164 158 165 162 157 175 182 168 176 161 171 163 176 159 171 178 172 169 158 163 166 168 160 178 170 164 160 170 166 178 171 167 162 169 165 171 165 168 176 174 163 177 164 170 161 179 177 162 149 169 166 153 177 164 统计调查搜统计调查搜集来的资料往往集来的资料往往是没有次序的原是没有次序的原始资料始资料(参见右表参见右表),使原始资料有,使原始资料有序化,列表和作序化,列表和作图是两种基本方图是两种基本方法,得到的分别法,得到的分别就是统计表和统就是统计表和统计图。计图。2010年我国城乡人口情况年我国城乡人口情况 按城乡分按城乡分 比重(比重(%)人口数(万人)人口数(万人)12845339.0960.917824150212统计表的格式、内容与种类统计表的格式、内容与种类l格式格式 统计表是表示统计统计表是表示统计资料的表格,在由横行、资料的表格,在由横行、纵栏交叉结合而成的表纵栏交叉结合而成的表格上,它能系统地组织格上,它能系统地组织和合理地安排大量数字和合理地安排大量数字资料。资料。总标题总标题 乡村乡村 城镇城镇100.00合计合计 纵栏标题纵栏标题 统计数值统计数值 横行标题横行标题 表34 离婚案件构成离婚案件构成草草草草率率率率型型型型外外外外遇遇遇遇型型型型猜猜猜猜疑疑疑疑型型型型虐虐虐虐待待待待型型型型再再再再婚婚婚婚型型型型家家家家务务务务型型型型生生生生理理理理型型型型分分分分居居居居型型型型其其其其他他他他型型型型合合合合计计计计离婚案件离婚案件离婚案件离婚案件(件)(件)(件)(件)比重(比重(比重(比重(%)85851414797913136464101044447 744447 7188188313146467 714142 259 59 9 9623623100100l内容内容 主词主词统计表所要说明的对象。统计表所要说明的对象。宾词宾词用来说明主词的标志和标志值。用来说明主词的标志和标志值。如需要,主宾词可互换。如需要,主宾词可互换。简单表简单表简单表简单表 我国城市居民家庭基本情况(我国城市居民家庭基本情况(我国城市居民家庭基本情况(我国城市居民家庭基本情况(20102010年)年)年)年)主要指标主要指标主要指标主要指标单位单位单位单位数值数值数值数值 平均每户家庭人口平均每户家庭人口平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口平均每户就业人口平均每户就业人口 平均每个就业者负担数平均每个就业者负担数平均每个就业者负担数平均每个就业者负担数平均每人全部年收入平均每人全部年收入平均每人全部年收入平均每人全部年收入平均每人可支配收入平均每人可支配收入平均每人可支配收入平均每人可支配收入平均每人消费性支出平均每人消费性支出平均每人消费性支出平均每人消费性支出人人人人人人人人人人人人元元元元元元元元元元元元 3 30404 1 15858 1 19292817781774040770277028080602960298888l统计表按主统计表按主词是否分组以词是否分组以及分组的程度及分组的程度可分为可分为简单分组表简单分组表复合分组表复合分组表简单表简单表 中国人口年龄结构状况中国人口年龄结构状况 单位:单位:%年龄组年龄组19831983年年19941994年年20022002年年20062006年年20092009年年014014岁岁15641564岁岁6565岁以上岁以上 36 363 3 59 593 3 4 44 440407 755557 7 3 36 6 33 336 6 61 615 5 4 49 9 27 277 7 66 667 75 56 6 19 199 9 70 701 1 10 100 0 资料来源|:2010中国统计年鉴第99页。简单分组表简单分组表 复合分组表复合分组表 我国社会福利主要费用情况我国社会福利主要费用情况 单位:亿元单位:亿元项目项目20072007200820082009200920102010(一)优抚对象补助金额(一)优抚对象补助金额(一)优抚对象补助金额(一)优抚对象补助金额国家支出国家支出集体供给集体供给(二)农村传统救济金额(二)农村传统救济金额(二)农村传统救济金额(二)农村传统救济金额国家支出国家支出集体供给集体供给(三)城乡各种福利院支出(三)城乡各种福利院支出(三)城乡各种福利院支出(三)城乡各种福利院支出国家支出国家支出集体供给集体供给68680 032324 435356 6 29 298 8 7 70 0 22 228 820202 210103 39 99 991914 451511 140403 328285 5 7 79 920206 623231 113137 79 94 4 1071076 6 60607 746469 931317 7 8 83 323234 428287 7 19 190 0 9 97 7 108 1081 169695 5 38386 6 29295 5 12 121 1 17 174 440405 526264 4 14 141 1合计合计合计合计 118 1180 0 143 1430 0 168 1680 0 178 1781 1 资料来源|:2010中国统计年鉴第838页。标题部分标题部分标题部分标题部分 1 1、标题置于表格正上方、标题置于表格正上方、标题置于表格正上方、标题置于表格正上方 2 2、总标题所示要点与表中项目一致,在需要时还应表、总标题所示要点与表中项目一致,在需要时还应表、总标题所示要点与表中项目一致,在需要时还应表、总标题所示要点与表中项目一致,在需要时还应表明资料所属的时间和地区明资料所属的时间和地区明资料所属的时间和地区明资料所属的时间和地区 3 3、表次:左、表次:左、表次:左、表次:左 ;单位:右;单位:右;单位:右;单位:右 4 4、对分页的同一表格,在每页上端都要写标题,加、对分页的同一表格,在每页上端都要写标题,加、对分页的同一表格,在每页上端都要写标题,加、对分页的同一表格,在每页上端都要写标题,加(续一)、(续二)(续一)、(续二)(续一)、(续二)(续一)、(续二)栏目部分栏目部分栏目部分栏目部分 1 1、先局部后整体、先局部后整体、先局部后整体、先局部后整体 2 2、若栏目较多,可加以编号;统计数字间有计算关系、若栏目较多,可加以编号;统计数字间有计算关系、若栏目较多,可加以编号;统计数字间有计算关系、若栏目较多,可加以编号;统计数字间有计算关系的,可用计算式表达。的,可用计算式表达。的,可用计算式表达。的,可用计算式表达。统计表的制作规则统计表的制作规则线格部分线格部分线格部分线格部分 1 1、统计表上下两端线应以粗线或双细线标划,表的、统计表上下两端线应以粗线或双细线标划,表的、统计表上下两端线应以粗线或双细线标划,表的、统计表上下两端线应以粗线或双细线标划,表的左右两侧开口。左右两侧开口。左右两侧开口。左右两侧开口。2 2、各栏间用直线标划,大项目间线条较粗,小栏目、各栏间用直线标划,大项目间线条较粗,小栏目、各栏间用直线标划,大项目间线条较粗,小栏目、各栏间用直线标划,大项目间线条较粗,小栏目线条较细;各行间不必划线条。线条较细;各行间不必划线条。线条较细;各行间不必划线条。线条较细;各行间不必划线条。数字部分数字部分数字部分数字部分 1 1、表中数字要对准位数。、表中数字要对准位数。、表中数字要对准位数。、表中数字要对准位数。2 2、不存在某数字时,用、不存在某数字时,用、不存在某数字时,用、不存在某数字时,用“”表示;缺少某项数表示;缺少某项数表示;缺少某项数表示;缺少某项数字字字字时,用时,用时,用时,用“”表示。表示。表示。表示。3 3、数字较大时,加分位点。、数字较大时,加分位点。、数字较大时,加分位点。、数字较大时,加分位点。其他规则其他规则其他规则其他规则 1 1、资料来源写在表格下方。、资料来源写在表格下方。、资料来源写在表格下方。、资料来源写在表格下方。2 2、有说明解释需要时,在表下方注释。、有说明解释需要时,在表下方注释。、有说明解释需要时,在表下方注释。、有说明解释需要时,在表下方注释。3 3、单位有数种时而不能在表右上角划一标注时,分、单位有数种时而不能在表右上角划一标注时,分、单位有数种时而不能在表右上角划一标注时,分、单位有数种时而不能在表右上角划一标注时,分两种情况处理。两种情况处理。两种情况处理。两种情况处理。1.统计表的纵栏标题是用来说明()A统计表的名称 B各组的名称C统计指标的名称 D统计总体2.填统计表时,若某项数据缺失,其符号为()3 统计分组的结果表现为()A组内同质性组间差异性 B 组内差异性组间同质性C组内同质性组间同质性D组内差异性组间差异性4 下面属于按数量标志分组的是()A 企业按经济类型分组B 工人按民族分组C 学生按考试成绩分组D 人口按性别分组5 统计分组的关键是()A 按数量标志分组B 正确选择分组标志C 正确计算组距和组中值D 运用统计体系分组变量数列的构成要素变量数列的构成要素 第三节第三节 变量数列的编制变量数列的编制 在社会统计学中,总体中各单位的分布特征首在社会统计学中,总体中各单位的分布特征首先是用统计表来表示的。能够表示变量分布及其特先是用统计表来表示的。能够表示变量分布及其特征的统计表,即变量数列。它有两个构成要素:征的统计表,即变量数列。它有两个构成要素:变量值变量值 Xi频数频数 fi相对频数相对频数 Pi离散变量数列离散变量数列 离散变量所描述的对象的数量特征,可以按一离散变量所描述的对象的数量特征,可以按一定次序列出它的整数值,相邻两变量值不会出现小定次序列出它的整数值,相邻两变量值不会出现小数,因而能编制出单项式和组距式两种变量数列。数,因而能编制出单项式和组距式两种变量数列。单项数列单项数列 组距数列组距数列 组距组距(hi)=上限上限(ui)下限下限(li)组中值组中值(mi)=或或 组中值组中值(mi)=单项式变量数列单项式变量数列单项式变量数列单项式变量数列数列中每一组的变量值只有一数列中每一组的变量值只有一数列中每一组的变量值只有一数列中每一组的变量值只有一个。个。个。个。单项数列单项数列单项数列单项数列用于离散变量用于离散变量用于离散变量用于离散变量整数值变动幅度较小时整数值变动幅度较小时整数值变动幅度较小时整数值变动幅度较小时。某社区各户人口数统计表某社区各户人口数统计表某社区各户人口数统计表某社区各户人口数统计表人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.00 离散变量单项数列离散变量单项数列组中值(间距间距间距间距组中值组中值组中值组中值()学校数学校数学校数学校数()81481415211521222822282935293536423642 11 11 18 18 25 25 32 32 39 39 2 2 5 51010 8 8 4 4合计合计合计合计 2929 离散变量组距数列离散变量组距数列 某地区小学班级数某地区小学班级数 组距式变量数列组距式变量数列组距式变量数列组距式变量数列离散变量的整数值如果变动幅离散变量的整数值如果变动幅离散变量的整数值如果变动幅离散变量的整数值如果变动幅度较大,而且总体单位数度较大,而且总体单位数度较大,而且总体单位数度较大,而且总体单位数NN又很大,则要编制组距数列。又很大,则要编制组距数列。又很大,则要编制组距数列。又很大,则要编制组距数列。连续变量数列连续变量数列 连续变量因其数学特征,在一个区间可以有无连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只能编制组限多数值,无法按顺序一一列举,所以只能编制组距数列。与离散变量组距数列不同之处在于,根据距数列。与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列中相邻两组的上限连续变量的特征,此时组距数列中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重和下限共有一个组限,即相邻两组交界处的组限重合。至于恰等于某一组限的数据合。至于恰等于某一组限的数据(如下表中身高如下表中身高164厘米厘米)归于哪一组,应该按照归于哪一组,应该按照“上限不包括在内上限不包括在内”的原则处理。这就是说,的原则处理。这就是说,164应归于应归于“164168”这这一组,而不应归于一组,而不应归于“160l64”这一组。有了这一规这一组。有了这一规定,就不会在编制连续变量的数列时,发生违背定,就不会在编制连续变量的数列时,发生违背“穷举穷举”与与“互斥互斥”这两个基本原则的情况了。这两个基本原则的情况了。男青年身高按男青年身高按4厘米的间距分组时的频数分布厘米的间距分组时的频数分布身高间距(厘米)身高间距(厘米)组中值组中值 (X(Xi i)频数频数(f(fi i)频率频率(P(Pi i)148152148152152156152156156160156160160164160164164168164168168172168172172176172176176180176180180184180184184188184188188192188192192196192196150 150 154154158158162162166166170170174174178178182182186186190190194194 1 1 2 2 5 510101919252517171212 5 5 3 3 0 0 1 10.010.010.020.020.050.050.100.100.190.190.250.250.170.170.120.120.050.050.030.030.000.000.010.01合计合计 100 1001.001.00 连续变量数列连续变量数列 对于等距分组且为闭口组的情况,对于等距分组且为闭口组的情况,对于等距分组且为闭口组的情况,对于等距分组且为闭口组的情况,确定组距确定组距确定组距确定组距已有某些数学公式可供参考已有某些数学公式可供参考已有某些数学公式可供参考已有某些数学公式可供参考 但最佳决定还是依据常识和数列使用的目的而但最佳决定还是依据常识和数列使用的目的而但最佳决定还是依据常识和数列使用的目的而但最佳决定还是依据常识和数列使用的目的而定。一般地说,组距应不小于可以忽略的数值之差。定。一般地说,组距应不小于可以忽略的数值之差。定。一般地说,组距应不小于可以忽略的数值之差。定。一般地说,组距应不小于可以忽略的数值之差。注意,在资料被整理成数列时,全距可适当放大注意,在资料被整理成数列时,全距可适当放大注意,在资料被整理成数列时,全距可适当放大注意,在资料被整理成数列时,全距可适当放大(但不能缩小但不能缩小但不能缩小但不能缩小),以便组数,以便组数,以便组数,以便组数(或组距或组距或组距或组距)取整数值。取整数值。取整数值。取整数值。3.确定确定组距和组距和组数组数l异距分组异距分组 异距分组异距分组异距分组异距分组主要在变量变动并不是均匀的、有急剧上主要在变量变动并不是均匀的、有急剧上主要在变量变动并不是均匀的、有急剧上主要在变量变动并不是均匀的、有急剧上升或突然下降之类情况发生时考虑。升或突然下降之类情况发生时考虑。升或突然下降之类情况发生时考虑。升或突然下降之类情况发生时考虑。标准组距频数标准组距频数标准组距频数标准组距频数的换算方法的换算方法的换算方法的换算方法:(1 1)选定某一合适的组距为标准组距;)选定某一合适的组距为标准组距;)选定某一合适的组距为标准组距;)选定某一合适的组距为标准组距;(2 2)用标准组距除以各组组距,得到折合系数;)用标准组距除以各组组距,得到折合系数;)用标准组距除以各组组距,得到折合系数;)用标准组距除以各组组距,得到折合系数;(3 3)将各组的折合系数乘以各组的频数。)将各组的折合系数乘以各组的频数。)将各组的折合系数乘以各组的频数。)将各组的折合系数乘以各组的频数。频数密度和标准组距频数计算表频数密度和标准组距频数计算表男青年按身高分男青年按身高分组(厘米)组(厘米)频数频数组距组距频数密频数密度度折合系数折合系数(取标准组距(取标准组距4 4)标准组距频标准组距频数数148156148156156164156164164168164168168172168172172176172176176180176180180188180188188196188196 3 315151919252517171212 8 8 1 18 88 84 44 44 44 48 88 83/83/815/815/819/419/425/425/417/417/412/412/48/88/81/81/81/21/21/21/21 11 11 11 11/21/21/21/2 1.5 1.5 7.5 7.519.019.025.025.017.017.012.012.0 4.0 4.0 0.5 0.5合计合计 100 100 4.累计频数(累计频数(F)n向上累计向上累计以变量数以变量数列首组的频数为始点,逐列首组的频数为始点,逐个累计各组的频数,展示个累计各组的频数,展示小于该组上限的频数和。小于该组上限的频数和。n向下累计向下累计以变量数以变量数列末组的频数为始点,逐列末组的频数为始点,逐个累计各组的频数,展示个累计各组的频数,展示大于该组下限的频数和。大于该组下限的频数和。1.连续变量要求两个相邻组的组限()A 不一致 B 重叠C 间断 D 可取任意值2.在全距一定的条件下,等距分组中组距与组数的关系是()A 组数越多,组距越大B 组数越多,组距越小C 组数越小,组距越小D 组数与组距无关系3 在分组时,凡是遇到某个体的变量值恰好等于相邻两组上下限数值时,一般是()A 将此值归入上限所在组B 将此值归入下限所在组C 将此值归入上,下限所在组均可D 另立一组4.对离散变量进行统计分组()A 只能用单项分组 B 既可用单项分组也可用组距分组 C只能用组距分组 频数分布不但可以用统计表的形式表现,也可以用频数分布不但可以用统计表的形式表现,也可以用频数分布不但可以用统计表的形式表现,也可以用频数分布不但可以用统计表的形式表现,也可以用统计图的形式表现。用统计图表示频数分布,较之用统统计图的形式表现。用统计图表示频数分布,较之用统统计图的形式表现。用统计图表示频数分布,较之用统统计图的形式表现。用统计图表示频数分布,较之用统计表,要直观便捷得多。但缺点是不及统计表精确。统计表,要直观便捷得多。但缺点是不及统计表精确。统计表,要直观便捷得多。但缺点是不及统计表精确。统计表,要直观便捷得多。但缺点是不及统计表精确。统计图的种类很多,本节仅就与频数分布数列相衔接的统计图的种类很多,本节仅就与频数分布数列相衔接的统计图的种类很多,本节仅就与频数分布数列相衔接的统计图的种类很多,本节仅就与频数分布数列相衔接的统计图加以介绍。计图加以介绍。计图加以介绍。计图加以介绍。根据编制好的频数分布数列,可以绘制出相应的统根据编制好的频数分布数列,可以绘制出相应的统根据编制好的频数分布数列,可以绘制出相应的统根据编制好的频数分布数列,可以绘制出相应的统计图,最常用的有频数分布直方图、折线图、曲线图以计图,最常用的有频数分布直方图、折线图、曲线图以计图,最常用的有频数分布直方图、折线图、曲线图以计图,最常用的有频数分布直方图、折线图、曲线图以及累计频数分布曲线。及累计频数分布曲线。及累计频数分布曲线。及累计频数分布曲线。具体方法是:先画直角坐标系,具体方法是:先画直角坐标系,具体方法是:先画直角坐标系,具体方法是:先画直角坐标系,横轴代表分组或各组组限,纵轴代表各组频数或频率,横轴代表分组或各组组限,纵轴代表各组频数或频率,横轴代表分组或各组组限,纵轴代表各组频数或频率,横轴代表分组或各组组限,纵轴代表各组频数或频率,然后再根据相应的分配数列作图。然后再根据相应的分配数列作图。然后再根据相应的分配数列作图。然后再根据相应的分配数列作图。第四节第四节 统计图统计图1.条形图1概念:用等宽直条的长短来表示各相互独立的指标大小的图形。2适用资料:相互独立的资料。相互独立的资料。3分类:分为单式和复式两种。单式适用于只有一组观察资料,复式适用于有若干组观察资料。4绘制要点(了解)5应用:应用:相互独立资料间的比较。相互独立资料间的比较。n适适用用资资料料:相相互互独独立立的的资资料料(资资料料有有明确分组,不连续)。明确分组,不连续)。n分类:分为单式和复式两种。单式适分类:分为单式和复式两种。单式适用于只有一组观察资料(见图用于只有一组观察资料(见图1),),复式适用于有若干组观察资料复式适用于有若干组观察资料 n绘制要点:绘制要点:坐坐标标轴轴:横横轴轴为为观观察察项项目目,纵纵轴轴为为数值,纵轴坐标一定要从数值,纵轴坐标一定要从0开始。开始。直直条条的的宽宽度度:各各直直条条应应等等宽宽,等等间间距距,间间距距宽宽度度和和直直条条相相等等或或为为其其一一半半。复复式式直直条条图图在在同同一一观观察察项项目目的的各各组组之之间无间距。间无间距。排排列列顺顺序序:可可以以根根据据数数值值从从大大到到小小,从小到大,或按时间顺序排列。从小到大,或按时间顺序排列。n应用:相互独立资料间的比较。应用:相互独立资料间的比较。2.圆图(pie chart)n n概念:以一个圆面积为概念:以一个圆面积为100%100%,用圆,用圆内各扇形面积所占的百分比来表示内各扇形面积所占的百分比来表示各部分所占的构成比例各部分所占的构成比例 n n适用资料:构成比资料。适用资料:构成比资料。n n绘制要点:绘制要点:每每3.63.6o o为为1%1%,用用3.63.6乘乘以以百百分分数数即即为为所占扇形的度数。用量角器画出。所占扇形的度数。用量角器画出。从从相相当当于于时时钟钟1212点点或或9 9点点的的位位置置开开始始顺时针方向绘图。顺时针方向绘图。每每部部分分用用不不同同线线条条或或颜颜色色表表示示,并并在图上标出百分比,下附图例说明。在图上标出百分比,下附图例说明。当当比比较较不不同同资资料料的的百百分分构构成成时时,可可以以画画两两个个相相等等大大小小的的圆圆,在在每每个个圆圆的的下下面面写写明明标标题题,并并用用相相同同的的图图例例表表示同一个构成部分。示同一个构成部分。n n应用:描述各部分的百分构成。应用:描述各部分的百分构成。条件下,很显然各矩形的面积条件下,很显然各矩形的面积与其高度成正比。因此,各矩与其高度成正比。因此,各矩形的面积同样可以用来表示各形的面积同样可以用来表示各组的频数或频率,而且看起来组的频数或频率,而且看起来更形象直观。如果取各矩形的更形象直观。如果取各矩形的总面积为总面积为1,各矩形的面积必,各矩形的面积必定等于各组的相对频数。定等于各组的相对频数。3.直方图直方图(Histogram)(Histogram)直方图是用矩形直方图是用矩形直方图是用矩形直方图是用矩形(或长条或长条或长条或长条)的高度来表示数列各组的的高度来表示数列各组的的高度来表示数列各组的的高度来表示数列各组的频数或频率。对于定类变量和定序变量的分组,矩形频数或频率。对于定类变量和定序变量的分组,矩形频数或频率。对于定类变量和定序变量的分组,矩形频数或频率。对于定类变量和定序变量的分组,矩形(或或或或长条长条长条长条)的宽度是没有意义的,各矩形之间要留出一定的空的宽度是没有意义的,各矩形之间要留出一定的空的宽度是没有意义的,各矩形之间要留出一定的空的宽度是没有意义的,各矩形之间要留出一定的空隙;对于定距变量隙;对于定距变量隙;对于定距变量隙;对于定距变量(和定比变量和定比变量和定比变量和定比变量)的分组,矩形的宽度表的分组,矩形的宽度表的分组,矩形的宽度表的分组,矩形的宽度表示各组组距,各矩形之间一般不留空隙。在等距分组的示各组组距,各矩形之间一般不留空隙。在等距分组的示各组组距,各矩形之间一般不留空隙。在等距分组的示各组组距,各矩形之间一般不留空隙。在等距分组的 其实,在频数分布图中,用面积来理解频数分布状更合适。比如直方图,当处理异距分组时应该用矩形面积而不用矩形高度来显示频数分布。下面是根据表315绘制出的两个直方图。左图用矩形高度来表示各组频数就会产生错觉。右图是按照标准组距频数作出来的,用矩形面积来表示各组频数就避免了不必要的错觉。以后当我们接触正态曲线等曲线后,将进一步体会到用面积来表示频数分布的好处。4.4.折线图(折线图(折线图(折线图(PolygonPolygon)表示频数分布的另一种图形是频数多边形图,简表示频数分布的另一种图形是频数多边形图,简表示频数分布的另一种图形是频数多边形图,简表示频数分布的另一种图形是频数多边形图,简称折线图。直接把直方图各矩形顶部的中点用直线连接称折线图。直接把直方图各矩形顶部的中点用直线连接称折线图。直接把直方图各矩形顶部的中点用直线连接称折线图。直接把直方图各矩形顶部的中点用直线连接起来,并把原来的矩形抹掉,就得到频数多边形图。起来,并把原来的矩形抹掉,就得到频数多边形图。起来,并把原来的矩形抹掉,就得到频数多边形图。起来,并把原来的矩形抹掉,就得到频数多边形图。当变量数列中的组数愈加增多,变量值也非常多当变量数列中的组数愈加增多,变量值也非常多当变量数列中的组数愈加增多,变量值也非常多当变量数列中的组数愈加增多,变量值也非常多时,折线图会逐步过渡到平滑曲线。时,折线图会逐步过渡到平滑曲线。时,折线图会逐步过渡到平滑曲线。时,折线图会逐步过渡到平滑曲线。频数分布曲线图频数分布曲线图频数分布曲线图频数分布曲线图实实实实质上是对应于连续变量的频数分布的质上是对应于连续变量的频数分布的质上是对应于连续变量的频数分布的质上是对应于连续变量的频数分布的函数关系图函数关系图函数关系图函数关系图。5.曲线图曲线图(Diagram)n n概念:以线段的上升或下降来表示事物在时间上的发概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况展变化或一种现象随另一种现象变迁的情况 n n适用资料:连续性资料。适用资料:连续性资料。n n绘制要点:绘制要点:坐坐标标轴轴:横横轴轴表表示示时时间间或或组组段段,纵纵轴轴表表示示频频数数或或率率。纵纵轴轴坐坐标标可可以以不不从从0 0开开始始,因因此此在在看看图图时时要要注注意意纵纵轴轴的起点坐标。的起点坐标。数数据据点点画画在在组组段段中中间间位位置置。相相邻邻的的点点用用直直线线连连接接,不不要要用用平平滑滑的的曲曲线线连连接接。无无数数据据的的组组段段用用虚虚线线连连接接。直线不能任意外延。直线不能任意外延。同同一一张张线线图图上上不不要要画画太太多多条条曲曲线线,否否则则不不易易分分清清。当当有有两两条条或或两两条条以以上上曲曲线线在在同同一一张张线线图图上上时时,须须用用不不同同颜颜色色或或不不同同的的图图形形形形式式加加以以区区分分,并并附附图图例例加加以以说说明。明。n n应用:反映事物的连续的动态变化规律。应用:反映事物的连续的动态变化规律。下表是诺贝尔获奖者的年龄分布表。下表是诺贝尔获奖者的年龄分布表。下表是诺贝尔获奖者的年龄分布表。下表是诺贝尔获奖者的年龄分布表。(1)(1)请根据数据请根据数据请根据数据请根据数据制作直方图和折线图;(制作直方图和折线图;(制作直方图和折线图;(制作直方图和折线图;(2 2)将折线图修匀为一条曲线)将折线图修匀为一条曲线)将折线图修匀为一条曲线)将折线图修匀为一条曲线图,并描述该曲线的特点。图,并描述该曲线的特点。图,并描述该曲线的特点。图,并描述该曲线的特点。年龄年龄年龄年龄获奖人数获奖人数获奖人数获奖人数2525岁以下岁以下岁以下岁以下25302530303530353540354040454045455045505050岁以上岁以上岁以上岁以上1515343470706868535337372828合计合计合计合计305305常见曲线图类型常见曲线图类型 钟形曲线:钟形曲线:“中间大,两头小中间大,两头小”对称分布:对称分布:正态分布正态分布非对称分布:非对称分布:偏态分布偏态分布右偏、左偏右偏、左偏 以横轴为渐近线,与横轴所围的面积为以横轴为渐近线,与横轴所围的面积为以横轴为渐近线,与横轴所围的面积为以横轴为渐近线,与横轴所围的面积为1 1,代表变量,代表变量,代表变量,代表变量X X全部可能取值的概率全部可能取值的概率全部可能取值的概率全部可能取值的概率 婚龄、学生身高婚龄、学生身高婚龄、学生身高婚龄、学生身高近似正态分布近似正态分布近似正态分布近似正态分布 收入分配、资源配置收入分配、资源配置收入分配、资源配置收入分配、资源配置偏态分布偏态分布偏态分布偏态分布 UU形曲线:中间形曲线:中间形曲线:中间形曲线:中间小,两头大小,两头大小,两头大小,两头大 J J形曲线:正形曲线:正形曲线:正形曲线:正J J分布,反分布,反分布,反分布,反J J分布分布分布分布 逻辑斯蒂曲线:变量值分布的次数随变逻辑斯蒂曲线:变量值分布的次数随变逻辑斯蒂曲线:变量值分布的次数随变逻辑斯蒂曲线:变量值分布的次数随变量值增大量值增大量值增大量值增大 而增多或相反,但有上限。而增多或相反,但有上限。而增多或相反,但有上限。而增多或相反,但有上限。6.6.累计频数分布曲线累计频数分布曲线累计频数分布曲线累计频数分布曲线 显然,累计频数分布显然,累计频数分布显然,累计频数分布显然,累计频数分布曲线只有两种形状:或持曲线只有两种形状:或持曲线只有两种形状:或持曲线只有两种形状:或持续增长的或持续减少的。续增长的或持续减少的。续增长的或持续减少的。续增长的或持续减少的。这分别取决于向上累计或这分别取决于向上累计或这分别取决于向上累计或这分别取决于向上累计或向下累计。累计频数分布向下累计。累计频数分布向下累计。累计频数分布向下累计。累计频数分布曲线一般都呈逻辑斯谛曲曲线一般都呈逻辑斯谛曲曲线一般都呈逻辑斯谛曲曲线一般都呈逻辑斯谛曲线形,其斜率最大的地方线形,其斜率最大的地方线形,其斜率最大的地方线形,其斜率最大的地方对应于频数最大的组,其对应于频数最大的组,其对应于频数最大的组,其对应于频数最大的组,其水平的地方对应于空组。水平的地方对应于空组。水平的地方对应于空组。水平的地方对应于空组。7.7.洛仑兹曲线和基尼系数洛仑兹曲线和基尼系数洛仑兹曲线和基尼系数洛仑兹曲线和基尼系数 洛仑兹(洛仑兹(洛仑兹(洛仑兹(Lorenz)Lorenz)曲线乃反映社会收入分配平均程曲线乃反映社会收入分配平均程曲线乃反映社会收入分配平均程曲线乃反映社会收入分配平均程度的一种累计百分数曲线,其特点是在纵轴和横轴上度的一种累计百分数曲线,其特点是在纵轴和横轴上度的一种累计百分数曲线,其特点是在纵轴和横轴上度的一种累计百分数曲线,其特点是在纵轴和横轴上都进行累计。(下凹程度愈大,收入分配愈不平均)都进行累计。(下凹程度愈大,收入分配愈不平均)都进行累计。(下凹程度愈大,收入分配愈不平均)都进行累计。(下凹程度愈大,收入分配愈不平均)基尼系数的
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服