资源描述
,1.,频数、频率,将一批数据按要求分为若干个组,各组内数据的,,叫做该组的,,每组频数除以,的个数即得该组的,.,2.,频率分布表,当总体很大或不便于获得时,可以用,.,估计总体的频率分布,反映总体频率分布的表格称为频率分布表,.,3.,频率分布直方图,以横轴表示,纵轴表示,以每个组距为底,以各频率除以组距的商为高,分别画成矩形,这样就得到了频率分布直方图,.,个数,频数,频率,样本容量,样本的频率分布,总分,4.,频率分布折线图,把频率分布直方图各个长方形上底边的,用线段连接起来,就得到频率分布折线图,.,5.,总体密度曲线,频率分布直方图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条,来描绘,这条光滑曲线就叫做总体密度曲线,.,中点,光滑曲线,一个容量为,40,的样本数据,分组后,组距与频数如下:,5,10,),5,个;,10,15,),12,个;,15,20,),7,个;,20,25,),5,个;,25,30,),7,个;,30,35,4,个,.,则样本在区间,20,+,)上的频率为,_.,【,解析,】,在区间,20,+,)上的频数为,5+7+4=16,,故所求频率为,答案:,0.4,频率分布直方图的应用,为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,(,如图,2-4-2,所示,),图中从左到右各小长方形面积之比为,24171593,第二小组频数为,12.,图,2-4-2,【,分,析】,考查频率分布直方图的应用.,(1)第二小组的频率是多少?样本容量是多少?,(2)若次数在110以上(含110次)为达标,试估计该校全体高,一学生的达标率是多少?,【,解析,】,(1),由于频率分布直方图以面积的形式反映了,数据落在各个小组内的频率大小,因此第二小组的频率为,又因为频率,=,所以样本容量,=,=150.,(2),由图可估计该校高一学生的达标率约为,故第二小组的频率是,0.08,样本容量是,150,,高一学生达标率是,88%.,【,评,析】(1)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到题意中看不清楚的信息和数据模式.,(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性,利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.,在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为,5,月,1,日至,30,日,评委会把同学们上交作品的件数按,5,天一组分组统计,绘制了频率分布直方图,(,如图,2-4-3,所示,).,已知从左到右各长方形的高的比为,2346,41,第三组的频数为,12,请解答下列问题,:,图,2-4-3,(1),本次活动共有多少件作品参加评比,?,(2),哪组上交的作品数最多,?,有多少件,?,(3),经过评比,第四组和第六组分别有,10,件、,2,件作品获奖,问这两组哪组获奖率较高,?,解,:(1),依题意知第三组的频率为,又因为第三组的频数为,12,所以本次活动的参评作品数为,=60(,件,).,(2),根据频率分布直方图,可以看出第四组上交的作品数量最多,共有,60,=18(,件,).,(3),第四组的获奖率是,第六组上交的作品数量为,60,=3(,件,).,第六组的获奖率为,显然第六组的获奖率较高,.,某市对上、下班交通情况进行抽样调查,上、下班时间各抽取了12辆机动车行驶时速如下:(单位:km/h),上班时间:,30,33,18,27,32,40,26,28,21,28,35,20,下班时间:,27,19,32,29,36,29,30,22,25,16,17,30,用茎叶图表示上面的样本数据,并求出样本数据的中位数.,解:根据题意绘出该市上、下班交通情况的茎叶图,如图所示,.,由图可见,上班时间行驶时速的中位数是,28,,下班时间行驶时速的中位数是,28.,【,变式训练,】,如图是,2012,年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图,(图中,m,为数字,0,9,中的一个),,去掉一个最高分和一个最低分后,,甲、乙两名选手得分的平均数分,别为,a,1,,,a,2,,则一定有(),(,A,),a,1,a,2,(,B,),a,2,a,1,(,C,),a,1,=a,2,(,D,),a,1,a,2,的大小与,m,的值有关,【,解析,】,选,B.,根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为 乙的平均分为,故,a,2,a,1,.,【,易错误区,】,求解频率分布直方图问题时的常见错误,【,典例,】,(,2011,湖北高考)有一个容量为,200,的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间,10,,,12,)内的频数为(),(,A,),18,(,B,),36,(,C,),54,(,D,),72,【,解题指导,】,【,解析,】,选,B.,设样本数据落在区间,10,,,12,)内的频率为,2x,,则,(,0.02+0.05+x+0.15+0.19,),2=1,得,x=0.09,,所以样本数据落在区间,10,12,)内的频数为,0.09,2,200=36.,1.如何理解用样本的频率分布估计总体的分布?,总体分布是指总体取值的分布规律,这种分布我们一般是不知道的.用样本去估计总体,是研究统计问题的一个基本思想,对于不易知道的总体分布,常常用样本的频率分布对它进行估计.样本的容量越大,这种估计就越精确.用样本估计的思想就是用部分考察全体、用离散考察连续、用有限考察无限的思想,是用观察测量值来探究客观规律的一种重要的基本思想.,用样本的频率分布估计总体的分布时,要使样本能够很好的反映总体的特征,必须随机抽取样本.由于抽样的随机性,当抽取的样本变化时,所形成的样本频率分布一般会与前一个样本频率分布有所不同.但是,它们都可以近似地看作总体的分布.,2.如何理解频率分布折线图与总体密度曲线?,(1)为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际的意义.,(2)总体密度曲线呈中间高、两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内.,用样本的频率分布估计总体的分布时,要使样本能够很好的反映总体的特征,必须随机抽取样本.由于抽样的随机性,当抽取的样本变化时,所形成的样本频率分布一般会与前一个样本频率分布有所不同.但是,它们都可以近似地看作总体的分布.,3.茎叶图有哪些优点?,用茎叶图表示有两个突出的优点:其一,在统计图上没有原始信息的损失,所有的信息都可以从这个茎叶图中得到;其二,茎叶图可以在比赛时随时记录,方便记录与表示.但茎叶图便于表示两位有效数字的数据,虽然可以表示两个人以上的比赛结果(或两个以上的记录),但没有分别表示两个记录那么直观、清晰.,1.做频率分布直方图,一般按以下步骤:,(1)求极差(极差=最大值-最小值);,(2)决定组距与组数;,(3)决定分点;,(4)列频率分布表(频率=频数/样本容量);,(5)绘制频率分布直方图.,2.画频率分布直方图时应注意以下原则:,(1)决定组距与组数,将数据分组时,组数应为求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:,一般样本容量越大,所分组数越多;,为方便起见,组距的选择应力求“取整”;,当样本容量不超过100时,按照数据的多少,通常分成512组.,(2)在频率分布直方图中,纵轴表示,,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.,
展开阅读全文