1、 第十一章 统 计 考纲链接 1.随机抽样 (1)理解随机抽样的必要性和重要性. (2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2.用样本估计总体 (1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点. (2)理解样本数据标准差的意义和作用,会计算数据标准差. (3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. (5)会用随机抽样的基本方法和样本估计总体的思想解决一
2、些简单的实际问题. 3.变量的相关性 (1)会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 4.统计案例 (1)通过典型案例了解回归分析的思想、方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题. (2)通过典型案例了解独立性检验的思想、方法,并能初步应用独立性检验的思想、方法解决一些简单的实际问题. §11.1 随机抽样 1.简单随机抽样 (1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个________地抽取n个个体作为样本(n≤N
3、),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种:________法和________法. 抽签法(抓阄法):一般地,抽签法就是把总体中的N个个体________,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取______个号签,连续抽取________次,就得到一个容量为n的样本. 随机数法:随机数法就是利用______________、随机数骰子或计算机产生的随机数进行抽样. 简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的. 2.系统抽样 (1)一般地,假设要从容
4、量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样: ①先将总体的N个个体________.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等; ②确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取k=Nn,如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除; ③在第1段用______________抽样方法确定第一个个体编号l(l≤k); ④按照一定的规则抽取样本.通常是将l加上________得到第2个个体编号________,再________得到第3个个体编号________,依次进行下去,直到获
5、取整个样本. (2)当总体中元素个数较少时,常采用____________,当总体中元素个数较多时,常采用______________. 3.分层抽样 (1)分层抽样的概念:一般地,在抽样时,将总体分成________的层,然后按照一定的________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)当总体是由__________的几个部分组成时,往往选用分层抽样的方法. (3)分层抽样时,每个个体被抽到的机会是________的. 自查自纠: 1.(1)不放回 都相等 (2)抽签 随机数 编号 1 n 随机数表 2.(1)①编号 ③简
6、单随机 ④间隔k (l+k) 加k (l+2k) (2)简单随机抽样 系统抽样 3.(1)互不交叉 比例 (2)差异明显 (3)均等 (2015•南昌模拟)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样 解:总体中所要调查的因素受学段影响较大,而受性别影响不大,所以最合理的抽样方法是按学段分层抽样.故选C. 从匀速传递的新产品生产流水线上,质检员每
7、10分钟从中抽取一件新产品进行某项指标检测,这样的抽样是( ) A.系统抽样 B.分层抽样 C.简单随机抽样 D.随机数法 解:根据定义易判断这样的抽样为系统抽样.故选A. (2014•重庆)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( ) A.100 B.150 C.200 D.250 解:样本抽取比例为703500=150,该校总人数为3500+1500=5000,由n5000=150得n=100.故选A. 为了了解某地参加计算机水平测试的5008名学生的成绩,从中抽取了200名
8、学生的成绩进行统计分析,运用系统抽样抽取样本时,每组的容量为____________. 解:由于5008不能被200整除,所以须先剔除8人,再由5000÷200=25知每组的容量为25.故填25. 某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号为第1组,6~10号为第2组,…,196~200号为第40组).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人. 解:由分组可知,抽号的间隔为5,又因为第5组抽出的号码
9、为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37;易知40岁以下年龄段的职工数为200×0.5=100,所以40岁以下年龄段应抽取的人数为40200×100=20.故填37;20. 类型一 简单随机抽样 某大学为了支援我国西部教育事业,决定从应届毕业生报名的18名志愿者中选取6名组成志愿小组.请用抽签法和随机数表法设计抽样方案. 解:(抽签法) 第一步:将18名志愿者编号,编号为1,2,3,…,18; 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽
10、取6个号签,并记录上面的编号; 第五步:所得号码对应的志愿者就是志愿小组的成员. (随机数表法) 第一步:将18名志愿者编号,编号为01,02,03,…,18; 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如从第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01~18中的数或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09; 第四步:找出以上号码对应的志愿者,即是志愿小组的成员. 点拨: 考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行.注意掌握随机数表的使用方法. 有
11、一批机器,编号为1,2,3,…,112,为调查机器的质量问题,打算抽取10台入样,请写出用简单随机抽样方法获得样本的步骤. 解法一:将112个外形完全相同的号签(编号001,002,…,112)放入一个不透明的盒子里,充分搅拌均匀后,每次不放回地从盒子中抽取1个号签,连续抽取10次,就得到1个容量为10的样本. 解法二:第一步,将机器编号为001,002,003,…,112; 第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如选第9行第7个数“3”,向右读; 第三步,从“3”开始,向右读,每次读取三位,凡不在001~112中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得
12、到074,100,094,052,080,003,105,107,083,092,这样就得到一个容量为10的样本; 第四步,找出以上号码对应的机器,即是要抽取的样本. 类型二 系统抽样 从某厂生产的10002辆汽车中随机抽取100辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程. 解:因为总体容量和样本容量都较大,可用系统抽样. 抽样步骤如下: 第一步,将10002辆汽车用随机方式编号; 第二步,从总体中剔除2辆(剔除法可用随机数表法),将剩下的10000辆汽车重新编号(分别为00001,00002,…,10000),并分成100段; 第三步,在第一段00001,00002,…,0
13、0100这100个编号中用简单随机抽样方法抽出一个作为起始号码(如00006); 第四步,把起始号码依次加上间隔100,可获得样本. 点拨: ①总体容量和样本容量都较大时,选用系统抽样比较合适;②系统抽样的号码成等差数列,公差为每组的容量. (2013•陕西)某单位有840名职工, 现采用系统抽样方法抽取42人做问卷调查, 将840人按1, 2, … , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为( ) A.11 B.12 C.13 D.14 解:从840名职工中抽取42人,按系统抽样分42组,每组20人,每组中抽取1人,在[481,720] 中有7
14、20-480=240人,240÷20=12组,编号落入区间[481,720]的人数为12.故选B. 类型三 分层抽样 某企业共有5个分布在不同区域的工厂,职工3万人,其中职工比例为3∶2∶5∶2∶3.现从3万人中抽取一个300人的样本,分析员工的生产效率.已知生产效率与不同的地理位置的生活习俗及文化传统有关,问应采取什么样的方法?并写出具体过程. 解:应采取分层抽样的方法.过程如下: (1)将3万人分为五层,其中一个工厂为一层. (2)按照样本容量的比例随机抽取各工厂应抽取的样本: 300×315=60(人);300×215=40(人); 300×515=100(人);300×215=40(
15、人); 300×315=60(人). 因此各工厂应抽取的人数分别为60人,40人,100人,40人,60人. (3)将300人组到一起即得到一个样本. 点拨: 分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样.应认识到,在各层抽取样本时,又可能会用到简单随机抽样,系统抽样,甚至分层抽样来抽取样本. (2014•天津)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取__________名
16、学生. 解:应从一年级本科生中抽取300×44+5+5+6=60名学生.故填60. 1.简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,它的特点是: (1)它要求总体个数较少; (2)它是从总体中逐个抽取的; (3)它是一种不放回抽样. 2.系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了.但要注意,如果编号的个体特征随编号的变化呈现一定的周期性,那么样本的代表性是不可靠的,甚至会导致明显的偏向. 3.分层抽样一般在总体是由差异明显的几个部分组成时使用. 4.抽样方法经常交叉使用,比如系统抽样中均匀分段后的第一段,可采用简单随机抽样;分层抽样中,若每层中个体数量仍很大时
17、则可辅之以系统抽样等. 5.三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 简单随 机抽样 抽样过程中每个个体被抽取的概率相等 从总体中逐个抽样 总体中的个体数较少 系统抽样 将总体均分成几部分,按事先确定的规则在各部分抽取 在起始部分抽样时采用简单随机抽样 总体中的个体数较多 分层抽样 将总体分成几层,分层进行抽取 分层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成 1.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额,采取如下方法:从某本50张的发票存根中随机抽取一张,如15号,然后按顺序往后将65号、115号、165号……发票上的销售额组
18、成一个调查样本.这种抽取样本的方法是( ) A.抽签法 B.系统抽样 C.分层抽样 D.随机数表法 解:易知为系统抽样.故选B. 2.现要完成下列3项抽样调查: ①从10盒酸奶中抽取3盒进行食品卫生检查. ②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈. ③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本. 较为合理的抽样方法是( ) A.①简单随机抽样;②系统抽样;③分层抽样 B.①简单随机抽样;②分层抽样;③系统
19、抽样 C.①系统抽样;②简单随机抽样;③分层抽样 D.①分层抽样;②系统抽样;③简单随机抽样 解:由各抽样方法的适用范围可知较为合理的抽样方法是:①用简单随机抽样,②用系统抽样,③用分层抽样.故选A. 3.(2014•广东)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 解:由100040=25,可得分段的间隔为25.故选C. 4.(2015•河北模拟)用简单随机抽样的方法从含有100个个体的总体中依次抽取一个容量为5的样本,则个体m被抽到的概率为( ) A.1100 B.120 C.199 D.1
20、50 解:简单随机抽样中,每个个体被抽到的概率为样本容量总体中的个体数,即个体m被抽到的概率为5100=120.故选B. 5.(2014•湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2 21、0个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07 C.02 D.01 解:从选定的两位数字开始向右读,剔除不合题意及与前面重复的编号,得到符合题意的编号分别为08,02,14,07,01,…,因此选出来的第5个个体的编号为01.故选D. 7.(2014•河北唐山统考)一支游泳队有男运动员32人,女运动员24人 22、若用分层抽样的方法从该队的全体运动员中抽取一个容量为14的样本,则抽取男运动员的人数为________. 解:设抽取男运动员的人数为x,则由题意得1432+24=x32,解得x=8.故填8. 8.(2015•安徽模拟)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号,31号,44号学生在样本中,则样本中还有一个学生的编号是____________. 解:∵系统抽样是等距抽样,52÷4=13,间隔为13,且5号,31号,44号学生在样本中,∴5+13=18,即样本中还有一个学生的编号是18.故填18. 9.为了考察某校的教学水平,将抽查该校高三年 23、级部分学生本学年的考试成绩进行考察.为了全面地反映实际情况,采用以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题: (1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的 24、样本中,其样本容量分别是多少? (2)上面三种抽取方式中各自采用了何种抽取样本的方法? 解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100. (2)第一种采用简单随机抽样法;第二种采用系统抽样法和简单随机抽样法;第三种采用分层抽样法和简单随机抽样法. 10.一支田径队有男运动员56人,女运动员42人 25、用分层抽样的方法从全体运动员中抽出一个容量为28的样本. 解:田径运动员的总人数是56+42=98(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取56×27=16(人),在女运动员中随机抽取28-16=12(人).这样,就可以得到一个容量为28的样本. 11.某大学今年有毕业生1503人,为了了解毕业生择业的意向,打算从中选50人进行询问调查,试用系统抽样法确定出这50个人. 解:总体中的每个个体都必须等可能地入样,为了实现系统抽样的平均分组且又等概率抽样,必须先剔除1503被50除的余数3,再“分段”,定起始位置. 第一步:将1503名大学生随机编号:0001 26、0002,…,1503; 第二步:因为1503被50除余3,所以应从总体中剔除3人,用随机数表法确定被剔除的3位学生; 第三步:将余下的1500名学生重新编号为0001,0002,…,1500; 第四步:将上述1500个号码按顺序平均分成50段,每段30人; 第五步:在第一段0001,0002,…,0030这30个编号中随机确定一起始号i0; 第六步:取出编号为i0,i0+30,i0+60,…,i0+49×30的大学生,即得所需样本. 某公司有1000名员工,其中:高层管理人员为50名,属于高收入者;中层管理人员为150名,属于中等收入者;一般员工为800名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽取100名员工,应当怎样进行抽样? 解:可以采用分层抽样的方法,按照收入水平分成三层:高收入者、中等收入者、低收入者.从题中数据可以看出,高收入者为50名,占所有员工的比例为501000=5%,为保证样本的代表性,在所抽取的100名员工中,高收入者所占的比例也应为5%,数量为100×5%=5,所以应抽取5名高层管理人员.同理,抽取15名中层管理人员、80名一般员工,再对收入状况分别进行调查.
20 × 20






