1、第2讲用样本估量总体1统计图表的含义(1)频率分布表含义:把反映总体频率分布的表格称为频率分布表频率分布表的画法步骤:第一步:求极差,打算组数和组距,组距;其次步:分组,通常对组内数值所在区间取左闭右开区间,最终一组取闭区间;第三步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:能够反映样本的频率分布规律的直方图(3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图(4)总体密度曲线:假如将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线(5)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(
2、低位)两部分;其次步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧2样本的数字特征(1)众数:一组数据中毁灭次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小挨次排列,处于最中间位置的一个数据叫做这组数据的中位数(3)平均数:把称为a1,a2,an这n个数的平均数(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为x,则这组数据的标准差和方差分别是s s2(x1)2(x2)2(xn)2做一做1(2022高考四川卷)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析在
3、这个问题中,5 000名居民的阅读时间的全体是()A总体B个体C样本的容量 D从总体中抽取的一个样本解析:选A.调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体2(2021辽宁省五校联考)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为_万元解析:依题意,留意到9时至10时与11时至12时相应的频率之比为0.100.4014,因此11时至12时的销售额为2.5410(万元)答案:101辨明两个易误点(1)易忽视频率分布直方图中纵轴
4、表示的应为.(2)在绘制茎叶图时,易遗漏重复毁灭的数据,重复毁灭的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义2众数、中位数和平均数的异同众数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,毁灭在这些数据中不愿定在这些数据中毁灭奇数个时,在这组数据中毁灭;偶数个时,为中间两数的平均值不愿定在这些数据中毁灭3.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然做一做3(2021唐山市第一次模拟)如图所示的茎叶图表示某柜台记录的一天销售额状况(单位:元),则销售额中的
5、中位数是()A30.5 B31C31.5 D32解析:选B.由茎叶图知,销售额由低到高分别为10,12,20,21,24,31,31,32,36,43,48,共11个,故中位数为第6个,即31.,同学用书P201P203)_频率分布直方图(高频考点)_频率分布直方图是高考的热点,选择题、填空题、解答题都有可能毁灭难度一般较小高考对频率分布直方图的考查主要有以下四个命题角度:(1)完善频率分布直方图;(2)利用频率分布直方图求样本容量;(3)求样本平均数、众数、中位数;(4)与概率结合考查某区间内的个体被选中的概率(1)(2022高考山东卷)为了争辩某药品的疗效,选取若干名志愿者进行临床试验,全
6、部志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的挨次分别编号为第一组,其次组,第五组,如图是依据试验数据制成的频率分布直方图已知第一组与其次组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6B8C12 D18(2)(2022高考北京卷)从某校随机抽取100名同学,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数10,2)622,4)834,6)1746,8)2258,10)25610,12)12712,14)6814,16)2916
7、,18)2合计100从该校随机选取一名同学,试估量这名同学该周课外阅读时间少于12小时的概率;求频率分布直方图中的a,b的值;假设同一组中的每个数据可用该组区间的中点值代替,试估量样本中的100名同学该周课外阅读时间的平均数在第几组(只需写出结论)解析(1)志愿者的总人数为50,所以第三组人数为500.3618,有疗效的人数为18612.答案C(2)解:依据频数分布表,100名同学中课外阅读时间不少于12小时的同学共有62210(名),所以样本中的同学课外阅读时间少于12小时的频率是10.9.从该校随机选取一名同学,估量其课外阅读时间少于12小时的概率为0.9.课外阅读时间落在组4,6)的有1
8、7人,频率为0.17,所以a0.085.课外阅读时间落在组8,10)的有25人,频率为0.25,所以b0.125.样本中的100名同学课外阅读时间的平均数在第4组规律方法解决频率分布直方图问题时要抓住:(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示,故每组样本的频率为组距,即矩形的面积(3)直方图中每组样本的频数为频率总体数1.(1)某学校为了调查同学在课外读物方面的支出状况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在40,50元的同学有39人,则n的值为()A100 B120C130 D390(2)(2021河北省衡水中学其次学期调研)今年年初,我国多个地
9、区发生了持续性大规模的雾霾天气,给我们的身体健康产生了巨大的威逼私家车的尾气排放也是造成雾霾天气的重要因素之一,因此在生活中我们应当提倡低碳生活,少开私家车,尽量选择绿色出行方式,为预防雾霾出一份力为此,很多城市实施了机动车尾号限行,我市某报社为了解市区公众对“车辆限行”的态度,随机抽查了50人,将调查状况进行整理后制成下表:年龄(岁)15,25)25,35)35,45)45,55)55,65)65,75频数510151055赞成人数469634完成被调查人员的频率分布直方图;若从年龄在15,25),25,35)的被调查者中各随机选取2人进行追踪调查,记选中的4人中不赞成“车辆限行”的人数为,
10、求随机变量的分布列和数学期望解析:(1)选C.样本数据落在40,50上的频率为1(0.0100.0230.037)100.30,则0.30,解得n130.(2)解:各组的频率分别是0.1,0.2,0.3,0.2,0.1,0.1.所以图中各组的纵坐标分别是0.01,0.02,0.03,0.02,0.01,0.01.的全部可能取值为:0,1,2,3.P(0),P(1),P(2).P(3),所以的分布列是:0123P所以的数学期望E()._茎叶图_(2021高考课标全国卷)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段
11、时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)依据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解(1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得(0.6
12、1.21.21.51.51.82.22.32.32.42.52.62.72.72.82.93.03.13.23.5)2.3,(0.50.50.60.80.91.11.21.21.31.41.61.71.81.92.12.42.52.62.73.2)1.6.由以上计算结果可得xy,因此可看出A药的疗效更好(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好规律方法茎叶图的优缺点:由茎叶图可以清楚地看到数据的分布状况,这一点同频率分布直方图类似它优于频率分布直方
13、图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,其次点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较繁琐2.(1)(2021安徽省“江南十校”联考)一次数学测验后,从甲、乙两班各抽取9名同学的成果进行统计分析,绘成茎叶图如图所示据此估量两个班成果的中位数的差的确定值为()A8 B5C4 D2(2)(2021高考重庆卷)右面茎叶图记录了甲、乙两组各五名同学在一次英语听力测试中的成果(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5C5,8 D8,8解析:(1)选D.甲、乙两班成果按大小挨次排列,处在最中间的数分别为87、8
14、9,故它们之差的确定值是2.(2)选C.由于甲组数据的中位数为1510x,x5.又乙组数据的平均数为16.8,y8.x,y的值分别为5,8._样本的数字特征_(2022高考陕西卷)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.,s21002 B.100,s21002C.,s2 D.100,s2解析,yixi100,所以y1,y2,y10的均值为100,方差不变,故选D.答案D规律方法样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体的一种简明的阐述平均
15、数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小(2)平均数、方差公式的推广若数据x1,x2,xn的平均数为,方差为s2,则数据mx1a,mx2a,mxna的平均数为ma,方差为m2s2.3.(1)(2021高考山东卷)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x91则7个剩余分数的方差为()A. B.C36 D.(2)(2021高考辽宁卷)为了考察某校各班参与课外书法小组的人数,从全校随机抽取5个班级,把每个班级参与该小组的人数作为样本数据已知样本平均数为7,
16、样本方差为4,且样本数据互不相同,则样本数据中的最大值为_解析:(1)依据茎叶图,去掉1个最低分87,1个最高分99,则8794909190(90x)9191,x4.s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2.(2)设5个班级中参与的人数分别为x1,x2,x3,x4,x5,则由题意知7,(x17)2(x27)2(x37)2(x47)2(x57)220,五个整数的平方和为20,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6,由上可知参与的人数分别为4,6,7,8,10,故最大值为10.答案:(1)B(2)
17、10,同学用书P203)交汇创新统计与概率的交汇(2022高考广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.依据上述数据得到样本的频率分布表如下:分组频数频率25,3030.12(30,3550.20(35,4080.32(40,45n1f1(45,50n2f2(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)依据上述频率分布表,画出样本频率分布直方图;(3)依据样本频率分布直方图,求在该厂任取
18、4人,至少有1人的日加工零件数落在区间(30,35的概率解(1)由所给数据知,落在区间(40,45内的有7个,落在(45,50内的有2个,故n17,n22,所以f10.28,f20.08.(2)样本频率分布直方图如图(3)依据样本频率分布直方图,每人的日加工零件数落在区间(30,35的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35的人数为,则B(4,0.2),P(1)1P(0)1(10.2)410.409 60.590 4,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35的概率为0.590 4.名师点评本题是概率与统计相交汇的常规命制试题,门槛低,入手简洁解决此
19、类问题的关键是理解统计中一些基本概念,理解大事的含义并确定大事的全部可能结果,求出每个结果对应的概率,即可得到答案(2021海淀区其次学期期中练习)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制表如下:两名快递员完成一件货物投递可获得的劳务费状况如下:甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超过35件的部分每件7元(1)依据表中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;(2)为了解乙公司员工B的每天所得劳务费
20、的状况,从这10天中随机抽取1天,他所得的劳务费记为X(单位:元),求X的分布列和数学期望解:(1)甲公司员工A投递快递件数的平均数为(32333338353639334140)36,众数为33.(2)设a为乙公司员工B投递件数,则当a34时,X136,当a35时,X354(a35)7,X的可能取值为136,147,154,189,203,X的分布列为:X136147154189203PX的数学期望E(X)136147154189203165.5.1把样本容量为20的数据分组,分组区间与频数如下:10,20),2;20,30),3;30,40),4;40,50),5;50,60),4;60,7
21、0,2,则在区间10,50)上的数据的频率是()A0.05B0.25C0.5 D0.7解析:选D.由题知,在区间10,50)上的数据的频数是234514,故其频率为0.7.2(2022高考广东卷)已知某地区中学校生人数和近视状况分别如图和图所示为了解该地区中学校生的近视形成缘由,用分层抽样的方法抽取2%的同学进行调查,则样本容量和抽取的高中生近视人数分别为()A200,20 B100,20C200,10 D100,10解析:选A.该地区中学校生总人数为3 5002 0004 50010 000,则样本容量为10 0002%200,其中抽取的高中生近视人数为2 0002%50%20,故选A.3.
22、某同学进入高三后,4次月考的数学成果的茎叶图如图,则该同学数学成果的方差是()A125 B5C45 D3解析:选C.由茎叶图知平均值为125,s2(125114)2(125126)2(125128)2(125132)245.4某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有()Aabc BbcaCcab Dcba解析:选D.把该组数据按从小到大的挨次排列为10,12,14,14,15,15,16,17,17,17,其平均数a(10121414151516171717)14.7,中位数b15
23、,众数c17,则abs,说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,故选择乙同学(2)从6个成果中随机选择2个,共有15个基本大事,分别是:102,105,102,112,102,113,102,117,102,123,105,112,105,113,105,117,105,123,112,113,112,117,112,123,113,117,113,123,117,123,其中满足条件的基本大事有5个,故所求概率P.1一个样本a,3,5,7的平均数是b,且a、b是方程x25x40的两根,则这个样本的方差是()A3 B4C5 D6解析:选C.由x25x40的两根分别为1,4,有或.
24、又a,3,5,7的平均数是b.即b,b,a154b,符合题意,则方差s25.2(2021安徽省名校模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列an,若a38,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A13,12 B13,13C12,13 D13,14解析:选B.设等差数列an的公差为d(d0),a38,a1a7(a3)264,(82d)(84d)64,(4d)(2d)8,2dd20,又d0,故d2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为13,中位数为13.3某班有48名同学,在一次考试中统计出平均分为70,方
25、差为75,后来发觉有2名同学的分数登记错了,甲实际得80分却记成了50分,乙实际得70分却记成了100分,更正后平均分为_,方差为_解析:因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2(x170)2(x270)2(8070)2(7070)2(x4870)2,而更正前有75(x170)2(x270)2(5070)2(10070)2(x4870)2,化简整理得s250.答案:70504为了解本市的交通状况,某校高一班级的同学分成了甲、乙、丙三组,从13点到18点,分别对三个路口的机动车通过状况进行了实际调查,并绘制了频率分布直方图(如图)若定义“总体平均数的
26、估量值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和”,则甲、乙、丙三组所调查数据的总体平均数的估量值1,2,3的大小关系为_解析:依据题中总体平均数的估量值的定义可得,10.313.50.214.50.115.50.116.50.317.515.4,20.213.50.214.50.315.50.216.50.117.515.3,x30.113.50.314.50.315.50.216.50.117.515.4,故132.答案:1325(2021宁波模拟)甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7
27、,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)依据计算结果,估量一下两名战士的射击水平谁更好一些解:(1) 甲(86786591047)7,乙(6778678795)7.(2)由方差公式s2(x1)2(x2)2(xnx)2可求得s3.0,s1.2.(3)由甲乙,说明甲、乙两战士的平均水平相当;又ss,说明甲战士射击状况波动大,因此乙战士比甲战士射击状况稳定6(选做题)某高三班级有500名同学,为了了解数学学科的学习状况,现从中随机抽出若干名同学在一次测试中的数学成果,制成如下频率分布表:分组频数频率85,95)95,105)0.05010
28、5,115)0.200115,125)120.300125,135)0.275135,145)4145,1550.050合计(1)依据上面图表,求出处应填的数值;(2)在所给的坐标系中画出85,155的频率分布直方图及折线图;(3)依据题中信息估量总体平均数,并估量总体落在129,155中的频率解:(1)由题意和表中数据可知,随机抽取的人数为40.由统计学问知处应填1,处0.100,应填0.100,处10.0500.1000.2750.3000.2000.0500.025,应填0.025,处0.025401,应填1.(2)频率分布直方图及折线图如图所示(3)利用组中值算得平均数为:900.0251000.051100.21200.31300.2751400.11500.05122.5;总体落在129,155上的频率为0.2750.10.050.315.故总体平均数约为122.5,总体落在129,155上的频率约为0.315.