资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 统计,2.2.1 用样本频率分布预计,总体分布,第1页,用样本预计总体,在统计中,用样本相关情况预计总体对应情况大致上有两类方法:,一、用样本,频率分布,去预计总体分布,二、用样本某种,数字特征,去预计总体对应数字特征(如平均数、标准差等),第2页,抽查某地域55名12岁男生身高(单位:cm)测量值以下:,128.1 144.4 150.3 146.2 140.6 126.0,125.6,127.7 154.4 142.7 141.2 142.7 137.6 136.9 132.3 131.8 147.7 138.4 136.6 136.2 141.6 141.1 133.1 142.8 136.8 133.1 144.5 142.4 140.8 127.7 150.7,160.3,138.8 154.3 147.9 141.3 143.8 138.1 139.7 142.9 144.7 148.5 138.3 135.3 134.5 140.6 138.4 137.3 149.5 142.5 139.3 156.1 152.2 129.8 133.2,试从以上数据中,对该地域,12,岁男生身高情况进行大致推测。,情景导入,为此,需要对统计数据进行整理和分析。分析数据一个基本方法是用图将他们画出来,或用表格改变数据排列方式。,第3页,128.1 144.4 150.3 146.2 140.6 126.0,125.6,127.7 154.4 142.7 141.2 142.7 137.6 136.9 132.3 131.8 147.7 138.4 136.6 136.2 141.6 141.1 133.1 142.8 136.8 133.1 144.5 142.4 140.8 127.7 150.7,160.3,138.8 154.3 147.9 141.3 143.8 138.1 139.7 142.9 144.7 148.5 138.3 135.3 134.5 140.6 138.4 137.3 149.5 142.5 139.3 156.1 152.2 129.8 133.2,依据以上数据能够画出频数分布表和频数分布图,从图表中能够清楚地知道,数据分布在各个小组个数。,频率分布表和频率分布图,则从,各个小组数据,在,样本容量,中所占,百分比,大小来表示数据分布规律。,第4页,画频率分布直方图详细做法以下:,1、求极差(最大值与最小值差),160.3-125.6=34.7,2、决定组距与组数(将数据分组),组数极差/组距34.7/56.9,所以组距为5,组数为7,3、将数据分组,4、画频率分布表,125.45 ,130.45),130.45,135.45),135.45,140.45),140.45,145.45),145.45,150.45),150.45,155.45),155.45,160.45,第5页,分 组,频数,频率,125.45 ,130.45),6,0.109,130.45,135.45),7,0.127,135.45,140.45),14,0.255,140.45,145.45),17,0.309,145.45,150.45),5,0.091,150.45,155.45),4,0.073,155.45,160.45,2,0.036,累计,55,1.00,55名12岁男生身高频率分布表,一、频率分布表,4、画频率分布表,第6页,5、画频率分布直方图,125.45 130.45,160.45,身高/cm,频率,组距,0.01,0.02,二、频率分布直方图,第7页,1、频率分布表列出是数据落在各个小组,频率,。,2、频率分布直方图是用,面积,表示数据落在各个小组频率大小。在频率分布直方图中,各小长方形面积之和为,1,。,说明:,第8页,画频率分布直方图普通步骤:,1、求极差(最大值与最小值差),2、决定组距与组数(将数据分组),组数极差/组距,当样本容量不超出100时,组数普通为512组,5、画频率分布直方图,4、画频率分布表,二、频率分布直方图,3、将数据分组,第9页,125.45 130.45,160.45,身高,频率,组距,0.01,0.02,三、频率分布折线图,第10页,伴随样本容量增加,作图时所分组数增加,组距减小,对应频率折线图会越来越靠近于一条光滑曲线,统计中称这条光滑曲线为,总体密度曲线,。,四、总体密度曲线,第11页,四、总体密度曲线,频率,组距,身高,a,b,(图中阴影部分面积,表示总体在区间(a,b)内取值百分比)。,反应了总体分布,即反应了总体在各个范围内取值百分比,第12页,说明:,总体密度曲线是,客观存在,,但在实际中,我们只能用样原来预计。因为样本是随机,不一样样本得到频率分布折线图不一样;即使是同一样本,不一样分组得到频率分布折线图也不一样。,也就是说:,频率分布折线图是伴随样本容量和分组情况改变而改变,所以不能由样本频率分布折线图得到准确总体密度曲线。,第13页,例1、为了了解某地高一年级男生身高情况,从其中一个学校选取容量为60样本(60名男生身高,单位:cm),分组情况以下:,分组,151.5158.5,158.5165.5,165.5172.5,172.5179.5,频数,6,21,m,频率,a,0.1,则表中m=,a=,6,0.45,27,第14页,例2、一个社会调查机构就某地居民月收入调查了10000人,并依据所得数据画了样本频率分布直方图,为了分析居民收入与年纪、学历、职业等方面联络,要从这10000人中再用分层抽样方法抽出100人作深入调查,则在2500,3000(元)月收入段应抽出,人,0.0001,0.0002,0.0003,0.0004,0.0005,1000,1500,2500,3000,3500,4000,月收入(元),频率/组距,25,第15页,试验1、进行“抛掷硬币”试验试验结果,画出频率分布条形图,注意点:,各直方长条宽度要相同;,相邻长条之间间隔要适当,结论:当试验次数无限增大时,试验结果,频数,频率,正面向上,36124,0.5011,反面向上,35964,0.4989,频率,试验结果,0,1,正面向上,反面向上,0.5,概率,0.5,0.5,两种试验结果频率大致相同。,第16页,五、总体分布,排除了抽样造成误差,准确地反应了总体取值概率分布规律。这种总体取值概率分布规律通常成为,总体分布,。,(2)研究总体概率分布往往能够研究其频数分布、频率分布.,频率分布与总体分布关系:,(1)经过样本频数分布、频率分布能够预计总体概率分布.,抽样过程中加大样本容量,排除抽样造成误差,这么样本分布频率准确地反应了总体取值概率分布规律。,第17页,用样本频率分布预计总体分布,能够分为两种情况。,(1)当总体中个体取,不一样数值极少,时,如试验1,其几何表示用条形图;,(2)当总体中个体取,不一样数值较多、甚至无限时或总体能够在一个实数区间内取值,,如试验2,其几何表示用直方图。,说明:以上两种情况不一样之处于于:前者频率分布表列出是几个不一样数值频率,条形图用其,高度,来表示取各个值频率;后者频率分布表列出是在各个不一样区间内取值频率,直方图用其,图形面积大小,来表示在各个区间内取值频率,各长方形面积之和为1。,第18页,NBA某赛季甲、乙两名篮球运动员每场比赛得分原始纪录以下:,甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39;,乙运动员得分:,49,24,12,31,50,31,44,36,15,37,25,36,39.问题一:请用适当方法表示上述数据,并对两名运动员得分能力进行比较.,六、茎叶图,第19页,频率分布表,分组,频数,频率,甲,乙,甲(11),乙(13),0,10),1,0,0.09,0.00,10,20),3,2,0.27,0.15,20,30),3,2,0.27,0.15,30,40),3,6,0.27,0.46,40,50),0,2,0.00,0.15,50,60),1,1,0.09,0.08,第20页,第21页,问题二:用上次课所学制作样本频率分布直方图来分析好吗?甲:13,51,23,8,26,38,16,33,14,28,39;乙:49,24,12,31,50,31,44,36,15,37,25,36,39.,当数据比较少时,应用列分布直方图反而不方便,第22页,简化制图格式和步骤,得到新统计制图方法:,甲运动员得分:13,51,23,8,26,38,16,,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,,36,15,37,25,36,39.,茎叶图,第23页,茎叶图:顾名思义,茎是指中间一列数,叶就是从茎旁边生长出来数.中间数字表示得分十位数,旁边数字分别表示两个人得分个位数.,茎叶图特点:,茎叶图不但能保留原始数据,而且能够展示数据,分布情况,。,第24页,乙:得分基本上是对称,叶分布是“单峰”,有10/13叶是分布在茎2、3、4上,中位数是36.,甲:得分除一个特殊得分(51分)外,也大致对称,分布也是“单峰”,有9/11叶主要集中在茎1、2、3上,中位数是26.,从上述中位数大小就能够看得出,乙运动员成绩更加好.另外,乙运动员得分更集中于峰值附近,这说明乙运动员发挥更稳定.,第25页,第26页,
展开阅读全文