收藏 分销(赏)

统计学--第二章统计数据的描述.ppt

上传人:a199****6536 文档编号:2049641 上传时间:2024-05-14 格式:PPT 页数:164 大小:2.16MB
下载 相关 举报
统计学--第二章统计数据的描述.ppt_第1页
第1页 / 共164页
统计学--第二章统计数据的描述.ppt_第2页
第2页 / 共164页
统计学--第二章统计数据的描述.ppt_第3页
第3页 / 共164页
统计学--第二章统计数据的描述.ppt_第4页
第4页 / 共164页
统计学--第二章统计数据的描述.ppt_第5页
第5页 / 共164页
点击查看更多>>
资源描述

1、第二章第二章 统计数据的描述统计数据的描述 统计先是思维而后才是数学统计先是思维而后才是数学 1n第一节第一节 统计数据的整理统计数据的整理n第二节第二节 分布集中趋势的测度分布集中趋势的测度n第三节第三节 分布离散程度的测度分布离散程度的测度n第四节第四节 分布偏态与峰度的测度分布偏态与峰度的测度n第五节第五节 统计表和统计图统计表和统计图统计先是思维而后才是数学统计先是思维而后才是数学 2学习目标学习目标1.掌握数据的整理方法掌握数据的整理方法2.掌握集中、离散趋势的测度掌握集中、离散趋势的测度3.掌握偏态峰度的测度掌握偏态峰度的测度4.掌握统计表和统计图的制作与使掌握统计表和统计图的制作

2、与使用用统计先是思维而后才是数学统计先是思维而后才是数学 3录取中有无歧视?录取中有无歧视?n某高校两个系(财经系、工程系)的报考及录取某高校两个系(财经系、工程系)的报考及录取情况情况男生男生女生女生录取录取350200未录取未录取450400报考人数报考人数800600 录取比率:录取比率:男生:男生:350/800=44%女生:女生:200/600=33%男生成绩好男生成绩好?性别歧视性别歧视?统计先是思维而后才是数学统计先是思维而后才是数学 4两个系的报考及录取情况两个系的报考及录取情况工程系工程系财经系财经系男生男生女生女生男生男生女生女生录取录取30010050100未录取未录取3

3、00100150300报考人数报考人数600200200400工程系:男女录取比率工程系:男女录取比率50%,财经系:男女录取比率,财经系:男女录取比率25%。说明的问题:对数据说明的问题:对数据 1.1.要从不同的角度进行分析;要从不同的角度进行分析;2.2.要注意结构或是权数的影响。要注意结构或是权数的影响。统计先是思维而后才是数学统计先是思维而后才是数学 52.1 统计数据的整理统计数据的整理统计先是思维而后才是数学统计先是思维而后才是数学 6统计整理统计整理将统计调查得到的原始资料将统计调查得到的原始资料将统计调查得到的原始资料将统计调查得到的原始资料或已经加工或已经加工的综合资料的综

4、合资料进行科学的分组和汇总形成进行科学的分组和汇总形成进行科学的分组和汇总形成进行科学的分组和汇总形成综合统计资料的工作过程综合统计资料的工作过程综合统计资料的工作过程综合统计资料的工作过程是统计调查的继续,统计分析的前提是统计调查的继续,统计分析的前提是统计调查的继续,统计分析的前提是统计调查的继续,统计分析的前提和基础和基础和基础和基础地位地位使数据系统化、条理化,反映事物的总体特使数据系统化、条理化,反映事物的总体特征,并在建立数据库的基础上达到一源多用征,并在建立数据库的基础上达到一源多用作用作用统计整理的概念和作用统计整理的概念和作用统计先是思维而后才是数学统计先是思维而后才是数学

5、7制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤统计先是思维而后才是数学统计先是思维而后才是数学 8数据的审核数据的审核对原始数据的审核的内容对原始数据的审核的内容1.完整性审核完整性审核2.准确性审核准确性审核对第对第2手数据的审核的内容手数据的审核的内容1.完整性审核完整性审核2.准确性审核准确性审核3.时效性时效性4.适用性适用性统计先是思维而后才是数学统计先是思维而后才是数学 9数据的排序数据的排序(data rank)1.1.按按一一定定顺顺序序将将数数据据排排列列,以以发发现

6、现一一些些明明显显的的特特征征或或趋趋势,找到解决问题的线索势,找到解决问题的线索2.2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新新归归类类或或分分组组等提供依据等提供依据3.3.在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一4.4.排序可借助于计算机完成排序可借助于计算机完成统计先是思维而后才是数学统计先是思维而后才是数学 10世界人均国民总收入世界人均国民总收入统计先是思维而后才是数学统计先是思维而后才是数学 112.1.1 统计数据的分组统计数据的分组统计先是思维而后才是数学统计先是思维而后才是数学 12统计分组的基本原则统计分组

7、的基本原则:必须保证在某一标志上,必须保证在某一标志上,组内的同质性和组组内的同质性和组间的差异性间的差异性。分组兼有分组兼有“分和合分和合”双重含义双重含义 一、统计分组的概念和作用一、统计分组的概念和作用将总体中所有单位按一定的标志分为性将总体中所有单位按一定的标志分为性将总体中所有单位按一定的标志分为性将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分的过程质不同但又有联系的若干部分的过程质不同但又有联系的若干部分的过程质不同但又有联系的若干部分的过程统计分组统计分组统计先是思维而后才是数学统计先是思维而后才是数学 13分组分组分组前分组前分组前分组前分组后分组后分组后分组后2

8、53342统计先是思维而后才是数学统计先是思维而后才是数学 14统计分组的关键:统计分组的关键:1、选择分组标志、选择分组标志:品质标志(性别、质量等)品质标志(性别、质量等)数量标志(数量、数值等)数量标志(数量、数值等)2、划分各组界限、划分各组界限二、分组标志的选择与分组种类二、分组标志的选择与分组种类统计先是思维而后才是数学统计先是思维而后才是数学 15 学生按性别分组学生按性别分组性别性别人数(频数)人数(频数)频率(频率(%)男生男生30306060女生女生20204040合计合计5050100100按品质标志分组按品质标志分组统计先是思维而后才是数学统计先是思维而后才是数学 16

9、某班学生按考试成绩分组某班学生按考试成绩分组按考试成绩分组按考试成绩分组人数人数频率频率%优优510良良1020中中2040及格及格1020不及格不及格510合计合计50100统计先是思维而后才是数学统计先是思维而后才是数学 17按数量标志分组按数量标志分组年龄年龄人数人数频率频率%191230201537.5211332.5合计合计40100某班学生按年龄频数分布某班学生按年龄频数分布统计先是思维而后才是数学统计先是思维而后才是数学 182.1.2 次数分配次数分配统计先是思维而后才是数学统计先是思维而后才是数学 19 次数分配次数分配是将总体按一定的标志分组,说明是将总体按一定的标志分组,

10、说明个体在各组之间的分布情况。是统计资料整理结个体在各组之间的分布情况。是统计资料整理结果的一种重要表现。果的一种重要表现。n次数分配次数分配:也称次数(频数)分布。:也称次数(频数)分布。n次数分配组成要素次数分配组成要素:1、组的名称、组的名称 2、各组次数(也称频数)或频率、各组次数(也称频数)或频率统计先是思维而后才是数学统计先是思维而后才是数学 20等距分组等距分组异距分组异距分组统计先是思维而后才是数学统计先是思维而后才是数学 21单变量值分组单变量值分组(要点)(要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量

11、值较少的情况统计先是思维而后才是数学统计先是思维而后才是数学 22例题分析例题分析【例例】某某某某车车车车间间间间30303030名名名名工工工工人人人人每每每每周周周周加加加加工工工工某某某某种种种种零零零零件件件件件数如右表件数如右表件数如右表件数如右表。统计先是思维而后才是数学统计先是思维而后才是数学 23单变量值分组表单变量值分组表(实例)(实例)表表 某车间某车间30名工人周加工零件数分组表名工人周加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)8485889194959611121119799 101103

12、10510610711213421091101111181191211281121111变量值变量值统计先是思维而后才是数学统计先是思维而后才是数学 24组距分组(要点)组距分组(要点)1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.适合于连续变量适合于连续变量3.适合于变量值较多的情况适合于变量值较多的情况4.必必须须遵遵循循“不不重重不不漏漏”的的原原则则(上上组限值不算在该组内)组限值不算在该组内)5.可可采采用用等等距距分分组组,也也可可采采用用不不等等距距分组分组 统计先是思维而后才是数学统计先是思维而后才是数学 25工人按月工资额分组工人按月工资额分组(元)(元)工人数

13、工人数(频数)(频数)频率频率%6007004010700800100258009001203090010008020100011006015合计合计400100等距分组等距分组 l各组的组距相等各组的组距相等 l各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响l可直接根据绝对频数来观察频数分布的特征和规律可直接根据绝对频数来观察频数分布的特征和规律统计先是思维而后才是数学统计先是思维而后才是数学 26不等距分组不等距分组l各组的组距是不相等各组的组距是不相等 l各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响年龄阶段年龄阶段男性男性 女性女性婴幼儿婴幼儿0

14、-60-6少年儿童少年儿童7-177-17中青年中青年18-5918-54老年老年60岁以上岁以上55岁以上岁以上统计先是思维而后才是数学统计先是思维而后才是数学 27等距分组步骤等距分组步骤1)确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。一一般般情情况况下下,组组数数不不应应少少于于5组组,也不应多于也不应多于15组。组。在在实实际际分分组组时时,可可以以按按 Sturges 提提出出的的经经验验公公式式来来确定组数确定组数K(四舍五入取整)(四舍五入取整)例如例如2-12-1的数据:的数据:统计先是思维而后才是数学统计

15、先是思维而后才是数学 28 2 2)确定各组的组距确定各组的组距确定各组的组距确定各组的组距:组距:组距:组距:组距(Class Width)Class Width)是一个组的上是一个组的上是一个组的上是一个组的上限与下限之差,可根据全部数据的最大值和最小值及限与下限之差,可根据全部数据的最大值和最小值及限与下限之差,可根据全部数据的最大值和最小值及限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即所分的组数来确定,即所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 例例2.1的数据,最大值

16、为的数据,最大值为128,最小值为,最小值为84,则,则 组距组距(128-84)/67.3。组距宜取组距宜取5或或10的倍数的倍数;(近似值);(近似值)在实践中,组数和组距要通过反复的实验确定,在实践中,组数和组距要通过反复的实验确定,最终确定出最有意义的组数和组距的组合。最终确定出最有意义的组数和组距的组合。统计先是思维而后才是数学统计先是思维而后才是数学 293)确定组限确定组限:组限是分组的数量界限,是表明每组界限:组限是分组的数量界限,是表明每组界限的两头数值。的两头数值。下下 限限(low limit):一个组的最小值:一个组的最小值 上上 限限(upper limit):一个组

17、的最大值:一个组的最大值组限的具体形式有组限的具体形式有:重合组限和间断组限;闭口组限和:重合组限和间断组限;闭口组限和开口组限。开口组限。确定组限的原则确定组限的原则1:最小一组的下限必须包含数列中最小:最小一组的下限必须包含数列中最小变量值;最大组的上限必须包含数列中最大变量值。变量值;最大组的上限必须包含数列中最大变量值。确定组限的原则确定组限的原则2:遵循不重不漏的原则。:遵循不重不漏的原则。“不重不重”是指一项数据只能分在其中的某一组,不能是指一项数据只能分在其中的某一组,不能在其他组中重复出现;在其他组中重复出现;“不漏不漏”在所分的全部组别中每项数据都能分在其中在所分的全部组别中

18、每项数据都能分在其中的某一组,不能遗漏。的某一组,不能遗漏。统计先是思维而后才是数学统计先是思维而后才是数学 304)根据分组计算频数,整理成频数分布表根据分组计算频数,整理成频数分布表:将原始数据:将原始数据按照各自的大小分配到各组中。按照各自的大小分配到各组中。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)频率(频率(%)809031090100723.331001101343.33110120516.6712013026.67合计合计30100本例可以得到如下频数分布表本例可以得到如下频数分布表重合组限、闭口组限重合组限、闭口组限统计先是思维而后才是数学统计先是思维而后才是

19、数学 31 对于重合组限的形式,为解决对于重合组限的形式,为解决“不重不重”的问题,统计分组时习惯上规定的问题,统计分组时习惯上规定“上组限上组限不在内不在内”,即当相邻两组的上下限重叠时,即当相邻两组的上下限重叠时,恰好等于其一组上限的变量值不算在本组恰好等于其一组上限的变量值不算在本组内,而计算在下一组内。内,而计算在下一组内。重合组限既适用于连续型变量分组也适重合组限既适用于连续型变量分组也适用于离散型变量分组,应用非常广泛。用于离散型变量分组,应用非常广泛。统计先是思维而后才是数学统计先是思维而后才是数学 32对于离散变量,可以采用相邻两组组限间断的办法对于离散变量,可以采用相邻两组组

20、限间断的办法(间断组限)解决(间断组限)解决“不重不重”的问题。的问题。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80893909971001091311011951201292合计合计30统计先是思维而后才是数学统计先是思维而后才是数学 33n如果全部数据中的最大值和最小值与其他数如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组或个别极端据相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采取值被漏掉,第一组和最后一组可以采取“x x以下以下”及及“x x以上以上”这样的开口组。这样的开口组。n开口组通常以相邻组的组距作为其组距。开口组通常

21、以相邻组的组距作为其组距。n例如,在例例如,在例21的的30个数据中,假定将最小个数据中,假定将最小值改为值改为64,最大值改为,最大值改为160,采用上面的分组,采用上面的分组就会出现就会出现“空白组空白组”,这时可采用,这时可采用“开口组开口组”,如,如80以下;以下;130以上。以上。开口组限:缺少上限或者下限的组限设置。开口组限:缺少上限或者下限的组限设置。统计先是思维而后才是数学统计先是思维而后才是数学 34按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80以下以下1809029010071001101311012051201301130以上以上1合计合计30开口组开口

22、组统计先是思维而后才是数学统计先是思维而后才是数学 35编制频数分布表的步骤编制频数分布表的步骤确确确确定定定定组组组组数数数数编制频数分布表编制频数分布表编制频数分布表编制频数分布表的步骤的步骤的步骤的步骤确确确确定定定定组组组组距距距距确确确确定定定定组组组组限限限限编编编编制制制制表表表表格格格格计计计计算算算算频频频频数数数数统计先是思维而后才是数学统计先是思维而后才是数学 36 在研究分析次数分布时,还需要计算:累计频在研究分析次数分布时,还需要计算:累计频数和累计频率数和累计频率1.1.累计频数:将各类别的频数逐级累加。累计频数:将各类别的频数逐级累加。有两种方法:有两种方法:一是

23、可以从最小组一方向最大组的一方累加一是可以从最小组一方向最大组的一方累加频数,称为向上累积;频数,称为向上累积;二是可以从最大组的一方向最小组的一方累二是可以从最大组的一方向最小组的一方累加频数,称为向下累积。加频数,称为向下累积。2.2.累计频率:将各类别的频率累计频率:将各类别的频率(百分比百分比)逐级累加逐级累加统计先是思维而后才是数学统计先是思维而后才是数学 37表表 某车间工人某车间工人周零件数的频数分布表周零件数的频数分布表按按周加工周加工零件数零件数分组分组人数人数(次数次数)频率频率(%)向下累积向下累积 向上累积向上累积 累计累计频数频数(次数)(次数)累计累计频率频率(%)

24、累计累计频数频数(次数次数)累计累计频率频率(%)80-90 90-100 100-110 110-120 120-1303713521023.3343.3316.676.673 102328301033.3376.6693.33100302720721009066.6723.346.67合计合计30100.0例:累计频数和累计频率的计算例:累计频数和累计频率的计算统计先是思维而后才是数学统计先是思维而后才是数学 38 在根据组距数列进行统计计算时,需要确定组中在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的代表值。值,作为各组变量值的代表值。组中值组中值(class midpo

25、int):下限与上限之间的中点值。:下限与上限之间的中点值。下限值下限值+上限值上限值2组中值组中值概念:组中值概念:组中值n组中值这种代表有一个必要的假定条件,即各组数据在本组中值这种代表有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。组内呈均匀分布或在组距中值两侧呈对称分布。n如实际数据的分布不符合这一假定,用组中值作为一组数如实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。据的代表值会有一定的误差。统计先是思维而后才是数学统计先是思维而后才是数学 39例:组中值计算例:组中值计算按周加工零件数按周加工零件数分组分组组中值组中值次数次

26、数(频数)(频数)频率(频率(%)8090853109010095723.331001101051343.33110120115516.6712013012526.67合计合计30100统计先是思维而后才是数学统计先是思维而后才是数学 40在开口组中,组中值的计算以邻近组组距为依据在开口组中,组中值的计算以邻近组组距为依据 可见,开口组的组中值既假定变量值是均匀分可见,开口组的组中值既假定变量值是均匀分布或对称分布,又假定组距与邻近组组距相等。布或对称分布,又假定组距与邻近组组距相等。统计先是思维而后才是数学统计先是思维而后才是数学 41例:组中值计算例:组中值计算按周加工零件数按周加工零件数

27、分组分组组中值组中值次数次数(频数)(频数)频率(频率(%)80以下以下7513.3380908526.679010095723.331001101051343.33110120115516.6712013012513.33130以上以上13513.33合计合计30100统计先是思维而后才是数学统计先是思维而后才是数学 42次数分配表的编制(例题分析)【例例例例】某某某某车车车车间间间间3030名名名名工工工工人人人人每每每每周周周周加加加加工工工工某某某某种种种种零零零零件件件件件件件件数数数数如如如如右右右右表表表表,试试试试 对对对对 数数数数 据据据据 进进进进行分组。行分组。行分组。

28、行分组。使用Excel频数函数(FREQUENCY)使使用用Excel中中的的统统计计函函数数“FREQUENCY”来来创创建建频频数数分分布布表表和和直直方方图图,可可解解决决这这一一问问题题。创创建建频频数数分分布布表表的步骤是的步骤是选选择择与与接接受受区区域域相相临临近近的的单单元元格格区区域域,作作为为频频数数分分布布表表输出的区域输出的区域选择统计函数中的选择统计函数中的“FREQUENCY”函数函数在在对对话话框框Date-array后后输输入入数数据据区区域域,在在Bins-array后后输输入各组分界点入各组分界点同时按下同时按下ctrl-shift-Enter组合键,即得到

29、频数分布组合键,即得到频数分布统计函数统计函数统计函数统计函数FREQUENCYFREQUENCY次数分配表按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)809039010071001101411012041201302合计合计302.1.3 次数分配直方图次数分配直方图统计先是思维而后才是数学统计先是思维而后才是数学 461.直方图直方图1.用用矩矩形形的的宽宽度度和和高高度度来来表表示示频频数数分分布布的的图图形形,实际上是用矩形的实际上是用矩形的面积面积来表示各组的频数分布来表示各组的频数分布2.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示

30、示频频数数或或频频率率,各各组组与与相相应应的的频频数数就就形形成成了了一一个矩形,即直方图个矩形,即直方图(Histogram)3.直方图下的总面积等于直方图下的总面积等于1统计先是思维而后才是数学统计先是思维而后才是数学 47分组数据的图示分组数据的图示(直方图的绘制直方图的绘制)某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图某车间工人周加工零件直方图 我我我我一一一一眼眼眼眼就就就就看看看看出出出出来来来来了了了了,周周周周加加加加工工工工零零零零件件件件在在在在100100100100 110110110110之之之之间间间间的的的的人人人人数数数数最最

31、最最多多多多!高度表示每一组的频数或高度表示每一组的频数或百分比,宽度则表示各组百分比,宽度则表示各组的组距,的组距,横轴标注的刻度横轴标注的刻度应该是连续区间应该是连续区间统计先是思维而后才是数学统计先是思维而后才是数学 482.折线图折线图1.1.折线图也称频数多边形图折线图也称频数多边形图2.2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是第第一一个个矩矩形形的的顶顶部部中中点点通

32、通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与其竖边中点连接到横轴与其竖边中点连接到横轴折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所表示的频数分布是一致的所表示的频数分布是一致的统计先是思维而后才是数学统计先是思维而后才是数学 49分组数据的图示分组数据的图示(折线图的绘制折线图的绘制)折线图与直方图折线图与直方图下的面积相等!下的面积相等!某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图某车间工人周加工零件折线图 统计先是思维而后才是数

33、学统计先是思维而后才是数学 503.次数分布曲线次数分布曲线当对数据所分的组数很多时,组距会越来越当对数据所分的组数很多时,组距会越来越小,这时所绘制的折线图就会越来越光滑,小,这时所绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频数分布逐渐形成一条平滑的曲线,这就是频数分布曲线。曲线。统计先是思维而后才是数学统计先是思维而后才是数学 51频数分布曲线的类型频数分布曲线的类型对称分布对称分布对称分布对称分布对称分布对称分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布正正正正正正J J J型分布型分布型分布型分布型分布型分布反反反反

34、反反J J J型分布型分布型分布型分布型分布型分布U UU型分布型分布型分布型分布型分布型分布图图图图 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布统计先是思维而后才是数学统计先是思维而后才是数学 522.1.4 洛伦兹曲线与基尼系数洛伦兹曲线与基尼系数统计先是思维而后才是数学统计先是思维而后才是数学 53洛伦茨曲线(累积次数分配折线图)洛伦茨曲线(累积次数分配折线图)20世世纪纪初初美美国国经经济济学学家家、统统计计学学家家洛洛伦伦茨茨(M.E.Lorentz)根根据据意意大大利利经经济济学学家家帕帕累累托托(V.Pareto)提出的收入分配公式绘制而成的。提出的

35、收入分配公式绘制而成的。是是描描述述收收入入和和财财富富分分配配性性质质的的曲曲线线,分分析析该该国家或地区分配的平均程度国家或地区分配的平均程度 AB累积的人口百分比累积的人口百分比 累累积积的的收收入入百百分分比比 绝对公平线绝对公平线 洛伦茨曲线洛伦茨曲线统计先是思维而后才是数学统计先是思维而后才是数学 54基尼系数基尼系数 1.20世世纪纪初初意意大大利利经经济济学学家家基基尼尼(G.Gini)根根据据洛洛伦伦茨茨曲曲线线给给出出了了衡衡量量收入分配平均程度的指标收入分配平均程度的指标2.A表示实际收入曲线与绝对平均线之间的面积表示实际收入曲线与绝对平均线之间的面积3.B表示实际收入曲

36、线与绝对不平均线之间的面积表示实际收入曲线与绝对不平均线之间的面积4.如果如果A=0,则基尼系数,则基尼系数=0,表示收入绝对平均,表示收入绝对平均5.如果如果B=0,则基尼系数,则基尼系数=1,表示收入绝对不平均,表示收入绝对不平均6.基尼系数在基尼系数在0 和和1之间取值之间取值7.一般认为:一般认为:基尼系数若小于基尼系数若小于0.2,表明分配平均;,表明分配平均;基基尼尼系系数数在在0.2至至0.4之之间间是是比比较较适适当当的的,即即一一个个社社会会既既有有效效率率又没有造成极大的分配不公;又没有造成极大的分配不公;基基尼尼系系数数在在0.4被被认认为为是是收收入入分分配配不不公公平

37、平的的警警戒戒线线,超超过过了了0.4应该采取措施缩小这一差距。应该采取措施缩小这一差距。AB统计先是思维而后才是数学统计先是思维而后才是数学 552.2 分布集中趋势的测度分布集中趋势的测度 统计先是思维而后才是数学统计先是思维而后才是数学 56数据集中区数据集中区变变量量x 集中趋势是指一组数据向某一中心值集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值据一般水平的代表值或中心值统计先是思维而后才是数学统计先是思维而后才是数学 57n一、众数一、众数n二、中位数二、中位数n三、四分位数三、四分位数n四、均值四

38、、均值n五、几何均值五、几何均值n六、切尾均值六、切尾均值n七、众数、中位数和均值的比较七、众数、中位数和均值的比较统计先是思维而后才是数学统计先是思维而后才是数学 581.1.概概念:在总体中出现次数最多的那个标志值就是众数。念:在总体中出现次数最多的那个标志值就是众数。2.2.1 众数众数 M0从分布的角度看,众数是具有明显集中趋势点的数值,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。一组数据分布的最高峰点所对应的数值即为众数。例如:集市上某种蔬菜的成交价格(元)为:例如:集市上某种蔬菜的成交价格(元)为:0.8,0.9,0.9,1.0,1.

39、2,1.2,1.2,1.2,1.5,1.5,1.6 1.2元出现次数最多,就是众数元出现次数最多,就是众数统计先是思维而后才是数学统计先是思维而后才是数学 59众数众数无众数无众数众数众数 1 1众数众数2 2一组数据可能没有众数或有几个众数(不唯一性)一组数据可能没有众数或有几个众数(不唯一性)统计先是思维而后才是数学统计先是思维而后才是数学 60M0M0M0M0M0若有两个次数相等的众数,则称复众数。若有两个次数相等的众数,则称复众数。只有总体单位数比较多,而且又有明显的集中趋势时才只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。存在众数。由定义可看出众数存在的条件:由定义可看出

40、众数存在的条件:统计先是思维而后才是数学统计先是思维而后才是数学 61下三图无众数:下三图无众数:在单位数很少,或单位数虽多但无明显集中趋势时,在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。计算众数是没有意义的。统计先是思维而后才是数学统计先是思维而后才是数学 621)定类数据的众数)定类数据的众数 表表1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(频数频数)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.

41、5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100众数众数=商品广告商品广告 对定序数据同样对定序数据同样2 2.众数的计算方法众数的计算方法统计先是思维而后才是数学统计先是思维而后才是数学 632)定序数据的众数)定序数据的众数解解解解:这这这这里里里里的的的的数数数数据据据据为为为为定定定定序序序序数数数数据据据据。变变变变量量量量为为为为“回回回回答类别答类别答类别答类别”城城城城市市市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108

42、108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这这这这一一一一类类类类别,即别,即别,即别,即 MMo o不满意不满意不满意不满意某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0统计先是思维而后才是数学统计先是思维而后才是数学 64 根据单项数列确定众数;根据单项数列确定众数;价格价格(元元)销售数量销售数量(千克千克)2

43、.00 202.40 603.001404.00 80合计合计300某种商品的价格情况某种商品的价格情况众数众数 M0=3.00(元元)例例3)数值数据的众数)数值数据的众数统计先是思维而后才是数学统计先是思维而后才是数学 65 根据组距数列确定众数根据组距数列确定众数 利利用比例插值法推算众数的近似值。用比例插值法推算众数的近似值。由由最多次数来确定众数所在组;最多次数来确定众数所在组;12众数众数Lin其中:其中:L 众数组的下限众数组的下限;n 1 众数组与前一组的频数之差众数组与前一组的频数之差n 2 众数组与后一组的频数之差众数组与后一组的频数之差n i 众数组的组距众数组的组距统计

44、先是思维而后才是数学统计先是思维而后才是数学 66按周加工零件数分组按周加工零件数分组工人人数工人人数(人人)80-903 90-1007 100-11013 110-1205 120-1302 表中表中100-110,即众数所在组。,即众数所在组。例例统计先是思维而后才是数学统计先是思维而后才是数学 67解:众数组是解:众数组是“100-110”的组,则的组,则 统计先是思维而后才是数学统计先是思维而后才是数学 68众数的特点众数的特点:n集中趋势的测度值之一集中趋势的测度值之一n出现次数最多的变量值出现次数最多的变量值n众数是位置代表值,不受极端值的影响众数是位置代表值,不受极端值的影响n

45、可能没有众数或几个众数可能没有众数或几个众数n适用于定类数据、定序数据、定量数据适用于定类数据、定序数据、定量数据众数所体现的统计思想是:众数所体现的统计思想是:n 在在一一组组数数据据的的中中心心点点附附近近,变变量量值值出出现现的的频频数数较较高高,根根据据众众数数组组及及相相邻邻两两组组的的频频数数分分布布,确确定定中中心心点的位置。点的位置。统计先是思维而后才是数学统计先是思维而后才是数学 69n在某些情况下,众数是一个较好的代表值。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣零售商在进

46、行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。的是最普遍的尺寸而不是平均尺寸。n又如,当要了解大多数家庭的收入状况时,又如,当要了解大多数家庭的收入状况时,也要用到众数。也要用到众数。例:买菜例:买菜;n适合于数据量较多时使用适合于数据量较多时使用n 众数值偏离众数组组中值得程度越大,分布众数值偏离众数组组中值得程度越大,分布的形状越偏的形状越偏统计先是思维而后才是数学统计先是思维而后才是数学 701.1.概概念:念:将总体中各单位标志值按大小顺序排列,将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。居于中间位置的那个标志值就是中位数。2.2.2 中位数中

47、位数 MeMMe e50%50%统计先是思维而后才是数学统计先是思维而后才是数学 711)定序数据的中位数)定序数据的中位数回答类别回答类别频数频数(户户)向上向上累积累积非常不满意非常不满意24242424不满意不满意108108132132一般一般9393225225满意满意4545270270非常满意非常满意3030300300合计合计300300表表表表 某城市家庭对住房状况的评价某城市家庭对住房状况的评价某城市家庭对住房状况的评价某城市家庭对住房状况的评价对于定序数据,确定中位对于定序数据,确定中位数位置用:数位置用:l中位数位置中位数位置=300/2=150=300/2=150l中

48、位数中位数=一般一般;2.中位数的计算方法中位数的计算方法统计先是思维而后才是数学统计先是思维而后才是数学 72 由未分组资料计算中位数由未分组资料计算中位数(a)先对数据进行排序)先对数据进行排序(b)确定中位数的位置,其公式为)确定中位数的位置,其公式为:(n为数据的个数)为数据的个数)(c)最后确定中位数的具体数值)最后确定中位数的具体数值当当n为偶数时,为偶数时,当当n为奇数时,为奇数时,2)数值数据的中位数)数值数据的中位数统计先是思维而后才是数学统计先是思维而后才是数学 73n 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 85

49、0 960 2000 1250 1630排序排序:750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9中位数中位数 1080例例统计先是思维而后才是数学统计先是思维而后才是数学 74n 10个家庭的人均月收入数据个家庭的人均月收入数据排序排序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 例例统计先是思维而后才是数学统计先是思维而后才是数学 75 由分组数据确定中位数由分组数据确定中位数 按日产量分组按日产量分组(千克千克)工人数

50、工人数(人人)向上累计向上累计向下累计向下累计 50 60 10 10164 60 70 19 29154 70 80 50 79135 80 90 36115 85 90100 27142 49 100-110 14156 22 110以上以上 8164 8合计合计164-na)要先根据公式:)要先根据公式:f/2,确定中位数的位置,并确定,确定中位数的位置,并确定中位数所在的组。中位数所在的组。f 总次数总次数统计先是思维而后才是数学统计先是思维而后才是数学 76b)然后采用下面的公式计算中位数的近似值:)然后采用下面的公式计算中位数的近似值:式中:式中:f 为数据的个数,为数据的个数,L

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服