1、第2讲 用样本估量总体 [最新考纲] 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. 4.会用样本的频率分布估量总体分布,会用样本的基本数字特征估量总体的基本数字特征,理解样本估量总体的思想. 5.会用随机抽样的基本方法和样本估量总体的思想解决一些简洁的实际问题. 知 识 梳 理 知 识 梳 理 1.频率分布直方图 (1)通常
2、我们对总体作出的估量一般分成两种,一种是用样本的频率分布估量总体的频率分布,另一种是用样本的数字特征估量总体的数字特征. (2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1. (3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留全部信息,而且可以随时记录,给数据的记录
3、和表示都带来便利. 2.用样本的数字特征估量总体的数字特征 (1)众数、中位数、平均数 ①众数:在一组数据中,消灭次数最多的数据叫做这组数据的众数. ②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. ③平均数:样本数据的算术平均数,即=(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等. (2)样本方差、标准差 标准差s= . 其中xn是样本数据的第n项,n是样本容量,是平均数. 标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估量总体方差,当样本容量接近总体
4、容量时,样本方差很接近总体方差. 辨 析 感 悟 1.对频率分布直方图的生疏 (1)在频率分布直方图中,小矩形的高表示频率.(×) (2)频率分布直方图中各个长方形的面积之和为1.(√) 2.对样本数字特征的生疏 (3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√) (4)一组数据的方差越大,说明这组数据的波动越大.(√) (5)茎叶图一般左侧的叶按从大到小的挨次写,右侧的叶按从小到大的挨次写,相同的数据可以只记一次.(×) (6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√) (7)在频率分布直方图中,众数左边和右边的小长方形的面积和是
5、相等的.(×) (8)如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为85,1.6.(√) (9)(2022·广州调研改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是15.(√) [感悟·提升] 1.作频率分布直方图的步骤 (1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图. 2.两个防范 一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频
6、率,如(1); 二是利用频率分布直方图求众数、中位数和平均数时,应留意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 考点一 频率分布直方图的应用 【例1】 某中学高一女生共有450人,为了了解高一女生的身高状况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下: 组别 频数 频率 145.5~149.5 8 0.16 149.5~153.5 6 0.12 153.5~157.5 14 0
7、28 157.5~161.5 10 0.20 161.5~165.5 8 0.16 165.5~169.5 m n 合计 M N (1)求出表中字母m,n,M,N所对应的数值; (2)在给出的直角坐标系中画出频率分布直方图; (3)估量该校高一女生身高在149.5~165.5 cm范围内有多少人? 审题路线 由频率分布表可以计算出m,n,M,N的值⇒作频率分布直方图⇒利用频率分布直方图求值. 解 (1)由题意M==50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4, 频率为n=0.08,总频率N=1.00. (2)频率
8、分布直方图如下图: (3)该所学校高一女生身高在149.5~165.5 cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人). 规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积=组距×=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题. 【训练1】 (2021·辽宁卷)某班的全体同学参与英语测试,成果的频率分布直方图如图,数据的分组依
9、次为:[20,40),[40,60),[60,80),[80,100]人.若低于60分的人数是15人,则该班的同学人数是( ). A.45 B.50 C.55 D.60 解析 第一、其次小组的频率分别是0.1,0.2,所以低于60分的频率是0.3,设班级人数为m,则=0.3,m=50. 答案 B 考点二 茎叶图的应用 【例2】 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.
10、6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)依据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好? 解 (1)设A药观测数据的平均数为A,B药观测数据的平均数为B, 则A=(0.6+1.2
11、+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3. B=(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则A>B,因此A药的疗效更好. (2)由观测结果绘制如下茎叶图: 从茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上;B药疗效的试验结果有的叶集中在茎0,1上. 由上述可看出A药的疗效更好. 规律方法 茎叶图的绘制需留意:(1)“叶”的位置只有
12、一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复消灭的数据要重复记录,不能遗漏,特殊是“叶”的位置的数据. 【训练2】 (2021·重庆卷)以下茎叶图记录了甲、乙两组各五名同学在一次英语听力测试中的成果(单位:分) 甲组 乙组 9 0 9 x 2 1 5 y 8 7 4 2 4 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( ). A.2,5 B.5,5 C.5,8 D.8,8 解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即=16.8,解得y=8.
13、答案 C 考点三 样本的数字特征 【例3】 甲乙二人参与某体育项目训练,近期的五次测试成果得分状况如图. (1)分别求出两人得分的平均数与方差; (2)依据图和上面算得的结果,对两人的训练成果作出评价. 解 (1)由图象可得甲、乙两人五次测试的成果分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. 甲==13, 乙==13, s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)
14、2]=0.8. (2)由s>s可知乙的成果较稳定. 从折线图看,甲的成果基本呈上升状态,而乙的成果上下波动,可知甲的成果在不断提高,而乙的成果则无明显提高. 规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的状况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小. 【训练3】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91. 现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示: 则7个剩余分数的方差为 ( ). A. B. C.36 D.
15、解析 由题意知=91,解得x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=(16+9+1+0+1+9+0)=. 答案 B 1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布状况的.茎叶图由全部样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必需在完成抽样后才能制作. 2.众数、中位数、平均数的异同 (1)众数、中位数及平均数都是描述一
16、组数据集中趋势的量,平均数是最重要的量. (2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质. (3)众数体现各数据消灭的频率,当一组数据中有若干数据多次消灭时,众数往往更能反映问题. (4)中位数仅与数据的排列位置有关,中位数可能消灭在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势. 易错辨析8——统计图表识图不准致误 【典例】 从某校高三班级随机抽取一个班,对该班50名同学的高校招生体检表中的视力状况进行统计,其频率
17、分布直方图如图所示: 若某高校A专业对视力的要求在0.9以上,则该班同学中能报A专业的人数为________. [解析] 该班同学视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A专业的人数为0.4×50=20. [答案] 20 [易错警示] 解题中易消灭审题不认真,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误. [防范措施] 求解频率分布直方图中的数据问题,最简洁消灭的问题就是把纵轴误以为是频率导致错误.在频率分布直方图中,纵轴表示,我们用各个小矩形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高
18、对应的数据与小矩形的宽(样本数据的组距)的乘积. 【自主体验】 (2021·福建卷)某校从高一班级同学中随机抽取部分同学,将他们的模块测试成果分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一班级共有同学600名,据此估量,该模块测试成果不少于60分的同学人数为( ). A.588 B.480 C.450 D.120 解析 从频率分布直方图可以看出:分数大于或等于60分的频率为(0.030+0.025+0.015+0.010)×10
19、=0.8,故频数为600×0.8=480. 答案 B 基础巩固题组 (建议用时:40分钟) 一、选择题 1.(2022·山东卷)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据.则A,B两样本的下列数字特征对应相同的是( ). A.众数 B.平均数 C.中位数 D.标准差 解析 对样本中每个数据都加上一个非零常数时不转变样本的方差和标准差,众数、中位数、平均数都发生转变. 答案 D 2.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他1
20、0个小长方形面积和的,且样本容量为160,则中间一组的频数为( ). A.32 B.0.2 C.40 D.0.25 解析 由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1, ∴x=0.2,故中间一组的频数为160×0.2=32,选A. 答案 A 3.(2022·潮州二模)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下: 甲 7 8 7 9 5 4 9 10 7 4 乙 9 5 7 8 7 6 8 6 7 7 则下列推断正确的是( ). A.甲射击的平均成果比乙好 B.乙射击的平均成果比甲好 C.甲比乙的射击成果稳定 D.乙比甲的
21、射击成果稳定 解析 甲、乙的平均成果分别为甲=7,乙=7,故排解A,B项;甲、乙的成果的方差分别为s=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,s=[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=1.2,则s>s,所以乙比甲的射击成果稳定,故选D. 答案 D 4. (2022·临沂一模)某中学高三从甲、乙两个班中各选出7名同学参与数学竞赛,他们取得的成果 (满分100分)的茎叶图如图
22、其中甲班同学成果的众数是85,乙班同学成果的中位数是83,则x+y的值为( ). A.7 B.8 C.9 D.10 解析 由茎叶图可知,甲班同学成果的众数是85,所以x=5.乙班同学成果的中位数是83,所以y=3,所以x+y=5+3=8. 答案 B 5.甲、乙两人在一次射击竞赛中各射靶5次,两人成果的条形统计图如图所示,则( ). A.甲的成果的平均数小于乙的成果的平均数 B.甲的成果的中位数等于乙的成果的中位数 C.甲的成果的方差小于乙的成果的方差 D.甲的成果的极差小于乙的成果的极差 解析 由条形统计图知: 甲射靶5次的成果分别为:4,5,6,7,8;
23、 乙射靶5次的成果分别为:5,5,5,6,9; 所以甲==6; 乙==6. 所以甲=乙.故A不正确.甲的成果的中位数为6,乙的成果的中位数为5,故B不正确. s=[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=×10=2, s=[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=×12=,由于2<, 所以s<s.故C正确. 甲的成果的极差为:8-4=4, 乙的成果的极差为:9-5=4, 故D不正确.故选C. 答案 C 二、填空题 6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.
24、 解析 依据茎叶图所给数据,易知两组数据的中位数分别为45,46. 答案 45 46 7.(2021·湖北卷)从某小区抽取100户居民进行月用电量调查,发觉其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x的值为 __________; (2)在这些用户中,用电量落在区间[100,250]内的户数为________. 解析 (1)依据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4. (2)(0.003 6+0.004 4+0.006 0)×50×100=70. 答
25、案 0.004 4 70 8.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________. 解析 由题意可得:x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,|x-y|=2|t|=4. 答案 4 三、解答题 9.某校高一某班的某次数学测试成果(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题: (1)求分数在[50,60]的频率及全班人数; (2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]
26、间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08. 由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形的高为÷10=0.016. 10.(2022·大连模拟)从某校高三班级800名男生中随机抽取50名同学测量其身高,据测量,被测同学的身高全部在155 cm到195 cm之间.将测量结果按如下方式分成8组:第一组[155,160),其次组[160,165),…,第八组[190,195],下图是按上述分组得到的频率分布直方图的一部分.
27、已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差. 求下列频率分布表中所标字母的值,并补充完成频率分布直方图. 频率分布表: 分组 频数 频率 频率/组距 … … … … [180,185) x y z [185,190) m n p … … … … 解 由频率分布直方图可知前五组的频率和是(0.008+0.016+0.04+0.04+0.06)×5=0.82,第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数
28、为50×0.14=7. 由已知得x+m=7,m-x=2-m, 解得x=4,m=3, 所以y=0.08,n=0.06,z=0.016,p=0.012. 补充完成频率分布直方图如图所示. 力量提升题组 (建议用时:25分钟) 一、选择题 1.(2022·长春调研)如图是依据某城市年龄在20岁到45岁的居民上网状况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40)、[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民消灭的频率为( ). A.0.04 B.0.06 C.0.2 D.0.3 解析 由频率分布直方图可知,
29、年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的频率成等差数列分布,所以年龄在[35,40)的网民消灭的频率为0.2.
答案 C
2.(2022·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则( ).
A.甲<乙,m甲>m乙 B.甲<乙,m甲 30、27+10+10+14+18+18+5+6+8)=,
乙=(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=.
∴甲<乙.
又∵m甲=20,m乙=29,
∴m甲 31、3.
答案 1,1,3,3
三、解答题
4.(2022·西安模拟)某校从参与高三模拟考试的同学中随机抽取60名同学,将其数学成果(均为整数)分成六组[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图.观看图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为=105.)作为这组数据的平均分,据此,估量本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的同学中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多 32、有1人在分数段[120,130)内的概率.
解 (1)分数在[120,130)内的频率为
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.
(2)估量平均分为
=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
(3)由题意,[110,120)分数段的人数为60×0.15=9(人).
[120,130)分数段的人数为60×0.3=18(人).
∵用分层抽样的方法在分数段为[110,130)的同学中抽取一个容量为6的样本,∴需在[110,120)分数段内抽取2人,并分别记为m,n;
在[120,130)分数段内抽取4人,并分别记为a,b,c,d;设“从样本中任取2人,至多有1人在分数段[120,130)内”为大事A,则基本大事共有(m,n),(m,a),…,(m,d),(n,a),…,(n,d),(a,b),…,(c,d)共15种.
则大事A包含的基本大事有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d)共9种.
∴P(A)==.
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818