1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第,52,讲抽样方法、用样本估计总体及正态分布,【,学习目标,】,1,理解随机抽样的必要性和重要性,2,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法;搞清三种抽样的联系与区别,3,了解分布的意义与作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点,4,能从样本数据中提取基本的数字特征,(,如平均数、标准差,),5,会用样本的频率分布估计总体分布,会用样本的基本数字特征,理解用样本估计总体的思想,6,会用随机抽样的基本方法和样本估计总体的思想解决一些简
2、单实际问题,7,利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义,【,基础检测,】,1,在,100,个零件中,有一级品,20,个,二级品,30,个,三级品,50,个,从中抽取,20,个作为样本,采用随机抽样法:抽签取出,20,个样本;,采用系统抽样法:将零件编号为,00,,,01,,,,,99,,然后平均分组抽取,20,个样本;,采用分层抽样法:从一级品,二级品,三级品中抽取,20,个样本下列说法中正确的是,(),A,无论采用哪种方法,这,100,个零件中每一个被抽到的概率都相等,B,两种抽样方法,这,100,个零件中每一个被抽到的概率都相等;,并非如此,C,两种抽样方法,这,1
3、00,个零件中每一个被抽到的概率都相等;,并非如此,D,采用不同的抽样方法,这,100,个零件中每一个零件被抽到的概率是各不相同的,A,C,3,下图是某学校举行的运动会上七位评委为某体操项目某运动员打出的分数的茎叶统计图,(,其中第一列数为十位数字,),,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为,(),A,84,,,4.84,B,84,,,1.6,C,85,,,1.6,D,85,,,4,C,A,800,【,知识要点,】,1,简单随机抽样,(1),定义:设一个总体含有,N,个个体,从中,_,抽取,n,个个体作为样本,(,n,N,),,如果每次抽取时总体内的各个个体被抽到的机会都
4、就把这种抽样方法叫做简单随机抽样,(2),最常用的简单随机抽样的方法:,和,_,_,逐个不放回地,相等,抽签法,随机数法,编号,分段间隔,k,分段,简单随机抽样,l,k,(,l,2,k,),3,分层抽样,(1),定义:在抽样时,将总体分成,的层,然后按照,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样,(2),分层抽样的应用范围:,当总体是由,时,往往选用分层抽样,4,分层抽样的步骤,(1),分层:将总体按某种特征分成若干部分,(2),确定比例:计算各层的个体数与总体的个体数的比,(3),确定各层应抽取的样本容量,(4),在每一层进行抽样,(
5、各层分别按简单随机抽样或系统抽样的方法抽取,),,综合每层抽样,组成样本,互不交叉,一定的比例,差异明显的几个部分组成,5,用样本的数字特征估计总体的数字特征,(1),众数、中位数,在一组数据中出现次数,_,的数据叫做这组数据的众数;,将一组数据按照从大到小,(,或从小到大,),排列,处在,上的一个数据,(,或中间两位数据的平均数,),叫做这组数据的中位数,最多,中间位置,6,频率分布直方图,(1),通常我们对总体作出的估计一般分成两种:一种是用,;另一种是用,_ _,(2),作频率分布直方图的步骤,求极差,(,即一组数据中最大值与最小值的差,),决定,_,与,_,将数据分组,列频率分布表,
6、画频率分布直方图,(3),在频率分布直方图中,纵轴表示,_,,数据落在各个小组内的频率用,表示各小长方形的面积总和等于,1.,样本的频率分布估计总体的分布,样本的数字特征,(,如平均数、标准差等,),估计总体数字特征,组距,组数,各小长方形面积,7,频率分布折线图和总体密度曲线,(1),频率分布折线图:连接频率分布直方图中各小长方形上端的,_,,就得到频率分布折线图,(2),总体密度曲线:随着样本容量的增加,_,减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线,8,茎叶图的优点,(1),统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到,(2),茎叶图中的数据可以
7、随时记录,随时添加,方便记录与表示,中点,组距,9,正态分布,(1),函数,,,(x,),,,x,R,的图象称为正态分布密度曲线,简称正态曲线,对于任何实数,a,b,,随机变量,X,满足,P,(,a,X,b,),,则称,X,的分布为正态分布,正态分布完全由参数,_,确定因此正态分布常记作,,如果,X,服从正态分布,则记为,_,和,N,(,,,2,),X,N,(,,,2,),(2),正态分布的特点:,曲线,;,曲线关于直线,_,对称;,曲线在,x,时,;,当,一定时,曲线的形状由,确定,,越大,曲线越,“,矮胖,”,,表示总体的分布越,_,;,越小,曲线越,“,高瘦,”,,表示总体的分布越,_,
8、3),原则,x,(,,,),,,P,(,x,),0.682 6,;,x,(,2,,,2,),,,P,(,x,),0.954 4,;,x,(,3,,,3,),,,P,(,x,),0.997 4.,位于,x,轴上方与,x,轴不相交,x,分散,集中,(2),采用系统抽样方法从,960,人中抽取,32,人做问卷调查,为此将他们随机编号为,1,,,2,,,,,960,,分组后在第一组采用简单随机抽样的方法抽到的号码为,9.,抽到的,32,人中,编号落入区间,1,,,450,的人做问卷,A,,编号落入区间,451,,,750,的人做问卷,B,,其余的人做问卷,C,.,则抽到的人中,做问卷,B,的人数为,
9、人,10,【,解析,】,采用系统抽样方法从,960,人中抽取,32,人,将整体分成,32,组,每组,30,人,即,l,30,,第,k,组的号码为,(,k,1)30,9,,令,451,(,k,1)30,9,750,,而,k,Z,,解得,16,k,25,,则满足,16,k,25,的整数,k,有,10,个,【,点评,】,分层抽样、系统抽样的基础知识的考纲要求是,“,了解,”,和,“,会,”,,因此复习时重点在基础知识的了解与简单应用,0.16,【,解析,】,正态曲线关于直线,x,2,对称,则,P,(,0),P,(,4),1,P,(,4),1,0.84,0.16.,(2),在一次高三模拟考试中,某
10、校,1 000,名学生的语文成绩近似满足正态分布,即分数,x,N,(108,,,4),,若,P,(,x,100),0.2,,则考分在,108,分,116,分之间的学生人数约为,_,人,300,【,解析,】,易知,P,(108,x,116),0.3,,所以学生人数约为,300,人,【,点评,】,正态分布的概率计算关键是利用数形结合思想和对称性转化,【,点评,】,要求考生既要会作茎叶图,同时也要会看茎叶图,但考纲要求为,“,了解和会,”,的层次,注重基础是关键,(1),将,T,表示为,X,的函数;,(2),根据直方图估计利润,T,不少于,57 000,元的概率;,(3),在直方图的需求量分组中,以
11、各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率,(,例如:若需求量,X,100,,,110),,则取,X,105,,且,X,105,的概率等于需求量落入,100,,,110),的频率,),,求,T,的数学期望,【,点评,】,高考中关于直方图及其应用的考查大有加强的趋势,因此既要会作相关统计数据的直方图,又要会观察直方图,提升识图能力,同时还要加强与概率问题的综合,【,点评,】,本题主要考查分层抽样的概念和运算,以及运用统计知识解决实际问题的能力,1,设计抽样方案时,必须保证其满足简单随机抽样的四个特点,2,用抽签法抽样关键是将号签搅拌均匀当总体容量较
12、大时,样本容量也较大,可用系统抽样法抽样,在抽样前有的要先随机剔除一部分个体,多余个体的剔除不影响抽样的公平性,3,进行分层抽样的关键是根据每一层所占的比例确定出每一层应抽取的个体数,4,要注意理解频率分布直方图纵坐标的含义,并搞清其与频率分布条形图的异同,5,对于每个个体所取不同数值较少的总体,常用条形图表示其样本分布,而对于每个个体所取不同数值较多或可以在实数区间内取值的总体,常用频率分布直方图表示其分布,6,在用样本的频率分布估计总体分布时,要清楚以下概念:频率分布折线图,总体密度曲线,茎叶图,用样本的数字特征估计总体的数字特征,要理解以下概念:,众数,中位数,平均数,标准差,7,正态分
13、布是一种非常常见的分布,应理解正态分布的有关概念,掌握正态曲线的有关性质并会求有关的概率,1,(2013,陕西,),某单位有,840,名职工,现采用系统抽样方法抽取,42,人做问卷调查,将,840,人按,1,,,2,,,,,840,随机编号,则抽取的,42,人中,编号落入区间,481,,,720,的人数为,(),A,11 B,12,C,13 D,14,B,【,命题立意,】,本题考查系统抽样等知识,考查数据处理能力,属中档题,2,(2013,福建,),某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成,6,组:,40,,,50),,,50,,,60),,,60,,,70),,,70,
14、80),,,80,,,90),,,90,,,100,加以统计,得到如图所示的频率分布直方图已知高一年级共有学生,600,名,据此估计,该模块测试成绩不少于,60,分的学生人数为,(),A,588 B,480,C,450 D,120,B,【,解析,】,成绩在,40,,,60),的频率,P,1,(0.005,0.015),10,0.2,,成绩不少于,60,分的频率,P,2,1,0.2,0.8,,所以成绩不少于,60,分的学生人数约为,600,0.8,480,人,故选,B.,【,命题立意,】,本题考查频率分布直方图等知识,考查识图与数据处理能力,属中档题,1,某公司在甲、乙、丙、丁四个地区分别有
15、150,个、,120,个、,180,个、,150,个销售点公司为了调查产品销售的情况,需从这,600,个销售点中抽取一个容量为,100,的样本,记这项调查为,;在丙地区中有,20,个特大型销售点,要从中抽取,7,个调查其销售收入和售后服务情况,记这项调查为,.,则完成,,,这两项调查宜采用的抽样方法依次是,(),A,分层抽样法,系统抽样法,B,分层抽样法,简单随机抽样法,C,系统抽样法,分层抽样法,D,简单随机抽样法,分层抽样法,B,【,解析,】,此题为抽样方法的选取问题当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用简单随机抽样,依据题
16、意,第,项调查应采用分层抽样法,第,项调查应采用简单随机抽样法故选,B.,2,某班,50,名学生在一次百米测验中,成绩全部介于,13 s,与,19 s,之间,将测试结果按如下方式分成,6,组:第一组,成绩大于等于,13 s,且小于,14 s,;第二组,成绩大于等于,14 s,且小于,15 s,;,;第六组,成绩大于等于,18 s,且小于等于,19 s,如图是按上述分组方法得到的频率分布直方图设成绩小于,17 s,的学生人数占全班总人数的百分比为,x,,成绩大于等于,15 s,且小于,17 s,的学生人数为,y,,则从频率分布直方图中可分析出,x,和,y,分别为,(),A,0.9,,,35 B,
17、0.9,,,45,C,0.1,,,35 D,0.1,,,45,A,【,解析,】,从频率分布直方图可以看到,成绩小于,17 s,的学生的频率,也就是成绩小于,17 s,的学生所占的百分比是,0.02,0.18,0.34,0.36,0.9,;,成绩大于等于,15 s,小于,17 s,的学生的人数为,(0.34,0.36),50,35(,人,),3,右图给出了三种正态分布,N,(,,,1,2,),,,N,(,,,2,2,),,,N,(,,,3,2,),的三条对应正态曲线,则,1,,,2,,,3,的大小关系是,(),A,0,1,1,2,3,B,0,3,1,2,1,C,0,1,2,3,1,D,0,3,2
18、1,1,A,【,解析,】,由图象知,,2,1.,越大图象越矮胖;,越小图象越瘦高,0,1,2,1,3,.,4,如图是甲、乙两名同学在高三阶段,10,次月考的数学成绩的茎叶图,则下列判断正确的是,(),A,甲比乙的平均成绩高,且甲的状态稳定,B,乙比甲的平均成绩高,但甲的状态稳定,C,甲比乙的平均成绩高,但乙的状态稳定,D,乙比甲的平均成绩高,且乙的状态稳定,A,【,解析,】,由茎叶图可知甲的状态稳定,,x,甲,125.8,,,x,乙,125.4.,故选,A.,A,6,在某市组织的一次数学竞赛中,全体学生的成绩近似服从正态分布,N,(60,,,100),,已知成绩在,90,分以上,(,含,90
19、分,),的学生有,13,人,(1),此次参加竞赛的学生共有多少人?,(2),若计划奖励竞赛成绩排在前,228,名的学生,问受奖学生的分数线是多少?,7,甲、乙两同学参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取,8,次,具体成绩如茎叶图所示,已知两同学这,8,次成绩的平均分都是,85,分,(1),求,x,和乙的成绩的众数,并由图中数据直观判断,甲、乙两同学中哪一位的成绩比较稳定;,(2),若将频率视为概率,对甲同学今后,3,次数学竞赛的成绩,(,各次竞赛互不影响,),进行预测,记这,3,次成绩中高于,80,分的次数为,,求,的分布列及数学期望,E,.,(1),若用系统
20、抽样的方法抽取,50,个样本,现将所有学生随机地编号为,000,,,001,,,002,,,,,199,,试写出第二组第一位学生的编号;,(2),求出,a,,,b,,,c,,,d,,,e,的值,(,直接写出结果,),,并作出频率分布直方图;,(3),若成绩在,95.5,分以上的学生获得一等奖,现在,从所有一等奖同学中随机抽取,5,名同学代表学校参加决赛,某班共有,3,名同学荣获一等奖,若该班同学参加决赛人数记为,X,,求,X,的分布列和数学期望,【,解析,】,(1),由题意可知第二组第一位学生的编号为,004.,(2),a,,,b,,,c,,,d,,,e,的值分别为,13,,,4,,,0.30,,,0.08,,,1.,其频率分布直方图如下:,






