1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2.1,用样本的频率分布估计总体的分布,(,二,),二、总体密度曲线,1,频率分布折线图,把频率分布直方图各个长方形上边的中点用线段连接起来,就得到,频率分布折线图,。,为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际的意义。例如,前面的钢管内径的频率分布折线图,如图所示。,频率分布直方图:,频率分布折线图,2,总体密度曲线,如果样本容量越大,所分组数越多,上述图中表示的频率分布
2、就越接近于总体在各个小组内所取值的个数与总数比值的大小。,设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线,y,=,f(,x,),来描绘,这条光滑曲线就叫做总体密度曲线。,总体密度曲线,精确地,反映了一个总体在各个区域内取值的规律。,产品尺寸落在,(,a,,,b,),内的,百分率,就是图中带斜线部分的面积。,对前面钢管内径的例子来说,总体密度曲线呈中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。,例:对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是(),(,A,)频率分布
3、折线图与总体密度曲线无关,(,B,)频率分布折线图就是总体密度曲线,(,C,)样本容量很大的频率分布折线图就是总体密度曲线,(,D,)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线,D,解析:总体密度曲线通常是用样本频率分布估计出来的;因为如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线,这条曲线就是总体密度曲线,故选,D,.,(,1,)总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到总体密度曲线的函数表达式,从而用函数的理论去研究它。但我们所面临的情况是总体分布未知,因此,我们只能,通过样本频率分布
4、折线图近似表示总体密度曲线,,当然还可以用其他方法估计总体密度曲线,但不能够通过样本数据准确地画出总体密度曲线。,进一步理解:,(,2,)总体密度曲线的,实际意义,在于:,总体密度曲线与,x,轴,直线,x,=,a,,,x,=,b,围成的,面积等于,x,在,a,,,b,取值时的,概率,.,2.,茎叶图,茎叶图也是用来表示数据的一种图,茎是中间的一列数,,叶是从茎上生长出来,的数,.,例甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平,甲:,12,,,15,,,24,,,25,,,31,,,31,,,36,,,36,,,37,,,39,,,44,,,49,,,50,乙:,
5、8,,,13,,,14,,,16,,,23,,,26,,,28,,,33,,,38,,,39,,,51,解:画出两人得分的茎叶图,茎叶图的中间部分像一颗植物的茎,两边部分像这颗植物上长出来的叶子。,用中间的数字表示两位运动员得分的十位数,两边的数字分布表示两个人各场得分的个位数,例如,3|389,就表示了,33,,,38,,,39,这,3,个数据。,从这个茎叶图可以看出甲运动员的得分大致对称平均得分及中位数、众数都是,30,多分;乙运动员的得分除一个,51,外,也大致对称,平均得分及中位数、众数都是,20,多分,因此甲运动员发挥比较稳定,总体得分情况比乙好,画茎叶图的步骤,S1,将每个数据分为
6、茎(高位)和叶(低位)两部分;,S2,将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;,S3,将各个数据的叶按大小次序写在其茎右(左)侧。,几种表示样本分布的,方法比较,:,(,1,),频率分布表,在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便;,(,2,),频率分布直方图,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到频率分布表中看不清楚的数据模式,但是从频率分布直方图本身不能得出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,(,3,)频率分布,折线图,的优点是它反映了数据的变化趋势,如果样本容量不断增
7、大,分组的组距不断缩小,那么折线图就趋向于,总体密度曲线,。,(,4,)用,茎叶图,刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。,例,1.,在某电脑杂志的一篇文章中,每个句子的字数如下:,10,,,28,,,31,,,17,,,23,,,27,,,18,,,15,,,26,,,24,,,20,,,19,,,36,,,27,,,14,,,25,,,22,,,11,,,24,,,27,,,17.,在某报纸的一篇文章中,每个句子的字数如下:,27,,,39,,,33,,,24,
8、28,,,19,,,32,,,41,,,33,,,27,,,35,,,12,,,36,,,41,,,27,,,13,,,22,,,23,,,18,,,46,,,32,,,22,。,(,1,)将这两组数据用茎叶图表示;,(,2,)将这两组数据进行比较分析,得到什么结论?,(,1,)将这两组数据用茎叶图表示;,(,2,)电脑杂志上每个句子的字数集中在,10,,,30,之间,,中位数为,22.5,,而报纸上每个句子的字数集中在,20,,,40,之间,,中位数为,27.5,,还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要简洁明了、通俗易懂。,例,
9、2.,有人说:“茎叶图表示三位数以上的数据时不够方便”,果真如此吗?请看下例:,现在能否用茎叶图来表示上述数据呢?,解:从上述数据可以看到它们的百位数字都是,3,,所不同的仅仅是十位和个位,而两位数据是可以作茎的,那么只需在茎的位置写上百位和十位,叶的位置上写上个位即可。,例,3.,某运动员得分的茎叶图如下,试判断他的得分的中位数,众数及稳定程度,.,解:从这个图可以直观的看出该运动员得分的中位数是,36,、众数是,31,与,36,,,且得分大都在,20,和,40,之间,分布较对称,集中程度高,说明其发挥比较稳定,练习题:,1.,在频率分布直方图中,小矩形的高表示(),A.,频率,/,样本容量
10、B.,组距,频率,C.,频率,D.,频率,/,组距,D,2.,在用样本频率估计总体分布的过程中,下列说法中正确的是(),A.,总体容量越大,估计越精确,B.,总体容量越小,估计越精确,C.,样本容量越大,估计越精确,D.,样本容量越小,估计越精确,C,3.,一个容量为,20,的样本数据,分组后组距与频数如下表,.,组距,10,,,20),20,,,30),30,,,40),40,,,50),50,,,60),60,,,70),频数,2,3,4,5,4,2,则样本在区间,(,,,50),上的频率为,(),A.0.5 B.0.25 C.0.6 D.0.7,D,4.10,个小球分别编有号码,1,,
11、2,,,3,,,4,,其中,1,号球,4,个,,2,号球,2,个,,3,号球,3,个,,4,号球,1,个,数,0.4,是指,1,号球占总体分布的(),A.,频数,B.,频率,C.,频率,/,组距,D.,累计频率,B,5.,已知样本:,12,,,7,,,11,,,12,,,11,,,12,,,10,,,10,,,9,,,8,,,13,,,12,,,10,,,9,,,6,,,11,,,8,,,9,,,8,,,10,,那么频率为,0.25,的样本的范围是,(),A.5.5,,,7.5)B.7.5,,,9.5),C.9.5,,,11.5)D.11.5,,,13.5),D,6.,频率分布直方图中,小长
12、方体的面积等于,(),A.,相应各组的频数,B.,相应各组的频率,C.,组数,D.,组距,B,7.,将容量为,50,的数据,按从小到大的顺序分为,6,组,如下表,.,组号,1,2,3,4,5,6,频数,6,8,10,10,9,7,第,3,组的频率和前,3,组的累计频率是(),A.0.24,和,0.5B.0.2,和,0.48,C.0.06,和,0.24 D.0.14,和,0.48,B,8.,从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过,70,分的人数为,8,人,其累计频率为,0.4,,则这样的样本容量是(),A.20,人,B.40,人,C.70,人,D.80,人,A,9
13、一个容量为,n,的样本分成若干组,已知某组的频数和频率分别是,30,和,0.25,,则,n,=_.,120,10.,将,100,个数据分成,8,个组,其中有一组是,9,个数据,那么该组的频数是,_,,频率是,_.,9,0.09,11.,从某校,2100,名学生随机抽取一个,30,名学生的样本,样本中每个学生用于课外作业的时间(单位,:min,)依次为,:75,,,80,,,85,,,65,,,95,,,100,,,70,,,55,,,65,,,75,,,85,,,110,,,120,,,80,,,85,,,80,,,75,,,90,,,90,,,95,,,70,,,60,,,60,,,75,,,90,,,95,,,65,,,75,,,80,,,80.,该校的学生中作业时间超过一个半小时(含一个半小时)的学生有,_,人,.,630,12.,频率分布直方图中各小长方体的面积和为,_.,1,






