1、2022版高考数学一轮复习 第九章 算法初步 统计、统计案例 第三讲 用样本估计总体学案新人教版2022版高考数学一轮复习 第九章 算法初步 统计、统计案例 第三讲 用样本估计总体学案新人教版年级:姓名:第三讲用样本估计总体知识梳理双基自测知识点一用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况绘制频率分布直方图的步骤为:_求极差_;_决定组距与组数_;_将数据分组_;_列频率分布表_;_画频率分布直方图_(2)频率分布折线图顺次连接频率分布直方图中
2、_各小长方形上端的中点_,就得到频率分布折线图(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息知识点二茎叶图(1)茎叶图中茎是指_中间_的一列数,叶是从茎的_旁边_生长出来的数(2)茎叶图的优点是可以_保留_原始数据,而且可以_随时_记录,这对数据的记录和表示都能带来方便知识点三样本的数字特征(1)众数:一组数据中出现次数最多的数(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数(3)平均数:_,反映了一组数据的平均水平(4)标准差:s_,反映了样本数据的离散程度(5)方差:s2_(x1)2(x
3、2)2(xn)2_,反映了样本数据的离散程度(1)若一组数据xi(i1,2,n)的平均数为,方差为s2,则数据组axib(i1,2,n,a,b为常数)的平均数为ab,方差为a2s2(2)频率分布直方图与众数、中位数与平均数的关系最高的小长方形底边中点的横坐标即是众数中位数左边和右边的小长方形的面积和是相等的,均为平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和题组一走出误区1判断下列结论是否正确(请在括号中打“”或“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的众数可以是一个或几个,那么中位数也具有
4、相同的结论()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()题组二走进教材2(P81A组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为(B)A95,94B92,86C99,86D95,91解析由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,9
5、4,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B 3(P7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民有_25_人解析100(0.50.5)25(人)题组三走向高考4(2020新课标)设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为(C)A0.01B0.1C1D10解析样本数据x1,x2,xn的方差为0.01,根据任何一组数据同时扩大几倍方差将变为平方倍增长,数据10x1,10x2,10xn的方差为:1000.011,故选C5(2020
6、天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为(B)A10B18C20D36解析直径落在区间5.43,5.47)的频率为(6.255)0.02 0.225,则被抽取的零件中,直径落在区间5.43,5.47)内的个数为0.22580 18个,故选B考点突破互动探究考点一频率分布直方图自主练透例1 (1)(2021江西赣州十四县联考)中央电视台播出中国诗词大会火遍全国,下面是组委会在选拔赛时随
7、机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组160,165)0.100笫2组165,170)第3组170,175)20第4组175,180)200.200第5组180,185)100.100合计1001.00()请先求出频率分布表中、位置的相应数据,再完成频率分布直方图(用阴影表示)()为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?()在()的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概
8、率(2)(2021湖北恩施州质检)为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为40,50),50,60),60,70),70,80),80,90),90,100六组),若问卷成绩最后三组频数之和为360,则下列结论正确的是_n480问卷成绩在70,80)内的频率为0.3a0.030以样本估计总体,若对A地区5 000人进行问卷调查,则约有1 250人不及格解析(1)()第1组的频数为1000.10010,所以处应填的数为100(10202010)40,从而第
9、2组的频率为0.400处应填的数为1(0.10.40.20.1)0.200频率分布直方图如图所示()因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:52,第4组:52,第5组:51,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试()(理)记“第4组至少有一名选手被考官A面试”为事件A,则P(A)(文)设第3组的2位选手为A1,A2,第4组的2位选手为B1,B2,第5组的1位选手为C1,则从这五位选手中抽取两位选手有(A1,A2),(A1,B1),(A1,B2),(A1,C1),(A2,B1),(A2,B2),
10、(A2,C1),(B1,B2),(B1,C1),(B2,C1),共10种情况其中第4组的2位选手B1,B2,中至少有一位入选的有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(B1,B2),(B1,C1),(B2,C1),共有7种情况,所以第4组至少有一名选手被考官A面试的概率为(2)由(0.0100.0150.015a0.0250.005)101,得a0.030,n600故不正确,正确;成绩在70,80)内的频率为10a0.3,故正确;若对A地区5 000人进行问卷调查,则约有5 000(0.10.15)1 250人不及格,故正确名师点拨应用频率分布直方图时的注意事项用频率
11、分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1变式训练1(1)(2021安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在80,130(单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220_(2)(2021山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约23天,
12、长的约1014天,甚至有20余天某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是(C)A12B13C14D15解析(1)根据频率分布直方图知:(2a0.040.030.02)101a0.005;计算出数学成绩不低于100分的频率为:(0.030.020.005)100.55;所以这次测试数学成绩不低于100分的人数为0.55400220人(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04因为前三组的频率和为0.88,故要使90%的患者显现出明显病状,则需
13、隔离观察的天数至少是:1314,故选C考点二茎叶图师生共研例2(2021四川省乐山市调研)胡萝卜中含有大量的胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法不正确的是(C)ab64423864143.13.23.33.42371111257AabBa的方差大于b的方差Cb品种的众数为3.31Da品种的中位数为3.27解析由茎叶图得:b品种所含胡萝卜素普遍高于a品种,ab,故A正确;a品种的数据波动比b品种的数据波动大,a的方差大于b的方差,故B正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位
14、数为:3.27,故D正确名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等变式训练2(2019山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为(A)甲组乙组625x4567917y8A3,5B5,5C3,7D
15、5,7解析甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y5又甲、乙两组数据的平均值相等,(5665627470x)(5961676578),x3故选A考点三,样本数字特征多维探究角度1样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(B)A12.5,12.5B12.5,13C13,12.5D13,13解析由频率分布直方图可知,众数为12.5,因为0.0450.2,0.150.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间10,15)内设中位数为x,则(x10)0.10.50.2,解得x13角
16、度2样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为_解析由图可知去掉的两个数是87,99,所以879029129490x917,解得x4,s2(8791)2(9091)22(9191)22(9491)22角度3样本数字特征的计算(3)(2021湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s2为(C)AB3CD4解析设某7个数据分别为a1,a2,a7,则由题意得a1a
17、2a75735,(a15)2(a25)2(a75)24728,加入新数据5后的平均数5,方差s2故选C名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小变式训练3(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155_,平均数为_156.8_(2)(角度2)(2021陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为(B)78984677
18、9148899A8954.5B8953.5C8753.5D8954(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x1,x2,x3,x100,它们的平均数为,方差为s2:其中扫码支付使用的人数分别为3x12,3x22,3x32,3x1002,它们的平均数为,方差为s2,则,s2分别为(C)A32,3s22B3,3s2C32,9s2D32,9s22解析(1)中位数为:150(170150)155该组数据的平均数为0.005201200.015201400.020201600.0052018
19、00.003202000.00220220156.8(2)由题可知,中位数为:89,先求平均数:90,S2(12)2(11)2(6)2(4)2(3)2(3)212428282929253.5,故中位数为:89,方差为53.5,故选:B(3)显然32,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a,则方差变为原方差的a2倍,故选C考点四,折线图师生共研例4(2021河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是(A)A连续三天日平均温度的方差最大的是7日,8日,9日三天B这15天日平均温度的极差为15 C由折线图能预测16日
20、温度要低于19 D由折线图能预测本月温度小于25 的天数少于温度大于25 的天数解析A选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B选项,这15天日平均温度的极差为18 ,B错;C选项,由折线图无法预测16日温度是否低于19 ,故C错误;D选项,由折线图无法预测本月温度小于25 的天数是否少于温度大于25 的天数,故D错误故选A名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势变式训练4甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别
21、为甲、乙,则下列结论正确的个数为(B)每次考试甲的成绩都比乙的成绩高甲的成绩比乙稳定甲一定大于乙甲的成绩的极差大于乙的成绩的极差A1B2C3D4解析第二次考试甲的成绩比乙低,错;由图可知甲的成绩比乙的成绩波动小,正确,错;甲的平均成绩显然比乙的平均成绩高,正确;故选B名师讲坛素养提升高考与频率分布直方图例5(理)(2021安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:80,90),90,100),100,110),110,120),120,130),130,140),140,150其中a,b,c成等差数列且c2a,物理成绩统计如表(说明:数学
22、满分150分,物理满分100分)分组50,60)60,70)70,80)80,90)90,100频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分;(2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人记X为抽到两个“优”的学生人数,求X的分布列和期望值(文)(2021河南新乡模拟)甲、乙两人想参加某项竞赛,根据以往20次的测试,将样本数据分成50,60),60,70),70,80),80,90),90,100五组,并整理得到如下频率分布直方图:
23、已知甲测试成绩的中位数是75(1)求x,y的值,并分别求出甲、乙两人测试成绩的平均数(假设同一组中的每个数据可用该组区间中点值代替);(2)从甲、乙两人测试成绩不足60分的试卷中随机抽取3份,求恰有2份来自乙的概率解析(理)(1)根据频率分布直方图得,(ab2c0.0240.0200.004)10 1,又因ac2b,c2a,解得a0.008,b0.012,c0.016,故数学成绩的平均分850.04950.121050.161150.21250.24 1350.161450.08117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间70,80),所以物理成绩的中位数为75分
24、(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X的取值为0、1、2、3P(X0),P(X1),P(X2),P(X3),所以分布列为:X0123P期望值为E(X)0123(文)(1)甲测试成绩的中位数为75,0.0110y100.04(7570)0.5,解得y0.02,0.0110y100.0410x100.005101,解得x0.025同学甲的平均分为550.0110650.0210750.0410850.02510950.0051074.5同学乙的平均分为550.01510650.02510750.031
25、0850.0210950.011073.5(2)甲测试成绩不足60分的试卷数为200.01102,设为A,B乙测试成绩不足60分的试卷数为200.015103,设为a,b,c从中抽3份的情况有(A,B,a),(A,B,b),(A,B,c),(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),(a,b,c),共10种情况满足条件的有(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),共6种情况,故恰有2份来自乙的概率为名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系(2)准确理解频率分布直
26、方图的数据特点是解题关键变式训练5(2019高考全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解析(1)由已知得0.70a0.200.15,故a0.35b10.050.150.700.10(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00