1、第二节第二节用样本估计总体用样本估计总体最新考纲1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题1常用统计图表(1)作频率分布直方图的步骤:求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(2)频率分布直方图:反映样本频率分
2、布的直方图(如图)横轴表示样本数据,纵轴表示率各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线2样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数频率,每个小矩形的面积表示样本数据落在该组内的频组距据的平均数)叫做这组数据的中位数(3)平均数:把
3、xx1x2xn称为x1,x2,xn这n个数的平均数n(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为x,则这组数据的标准差和方差分别是s11x1x2nx2x2xnx2;s2(x1x)2(x2x)2(xnx)2n常用结论1频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小矩形的面积和是相等的2平均数、方差的公式推广(1)若数据x1,x2,xn的平均数为x,那么mx1a,mx2a,mx3a,mxna的平均数是m xa.(2)数据x1,x2,x
4、n的方差为s.数据x1a,x2a,xna的方差也为s;数据ax1,ax2,axn的方差为a s.一、思考辨析(正确的打“”,错误的打“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势(2)一组数据的方差越大,说明这组数据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高()(4)已知样本数据x1,x2,xn的均值x5,则样本数据2x11,2x21,2xn1的均值为 10.答案(1)(2)(3)(4)二、教材改编1一个容量为 32 的样本,已知某组样本的频率为0.25,则该组样本的频数为()A4B8C12D16()()2222B B设频数为n
5、,则0.25,321n32 8.42若某校高一年级8 个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()A91.5 和 91.5C91 和 91.5B91.5 和 92D92 和 92n9192A A这组数据为 87,89,90,91,92,93,94,96,中位数是91.5,28789909192939496平均数x91.5.83(2019盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是 2,则数据 2x1,2x2,2x3,2x4,2x5的标准差为122 2 2 2由sn(xix)2,则数据2x1,2x2,2x3,2x4
6、,2x5的方差是8,标准差为2 2.24如图是 100 位居民月均用水量的频率分布直方图,则月均用水量为2,2.5)范围内的居民有人250.50.510025.考点 1样本的数字特征的计算与应用利用样本的数字特征解决决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征1.(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、
7、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数字特征是()A中位数C方差B平均数D极差A A设 9 位评委评分按从小到大排列为x1x2x3x4x8x9,则原始中位数为x5,去掉最低分x1,最高分x9后剩余x2x3x4x8,中位数仍为x5,A 正确2 甲、乙两人在一次射击比赛中各射靶5 次,两人成绩的条形统计图如图所示,则()甲乙A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差C C根据条形统计图可知甲的中靶情况为4 环、5 环、6 环、7 环、8 环;乙的中11靶
8、情况为 5 环、5 环、5 环、6 环、9 环.x甲(45678)6,x乙(5369)556,甲的成绩的方差为4656225622665227628622,乙的成绩的方差为3665962.4;甲的成绩的极差为4 环,乙的成绩的极差为4环;甲的成绩的中位数为6 环,乙的成绩的中位数为5 环,综上可知 C 正确,故选 C.3某人 5 次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为 10,方差为 2,则|xy|的值为()A1B2 C3D4D D由题意可知1515xy1011910,x10222y1022112,xy20,22xy208.(xy)xy2xy,即
9、2082xy400,xy96.(xy)xy2xy16,|xy|4,故选 D.4(2019全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表222y的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到 0.01)附:748.602.解(1)根据产值增长率频数分布表
10、得,所调查的100 个企业中产值增长率不低于40%的147企业频率为0.21.100产值负增长的企业频率为20.02.100用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为 21%,产值负增长的企业比例为 2%.1(2)y 100(0.1020.10240.30530.50140.707)0.30,s2122222(0.40)2(0.20)240 530.20 140.40 71000.029 6,s 0.029 60.02 740.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.122方差的简化计算公式:sn(xxxn)n x,或写成sn(
11、x1x2221222222x2n)x,即方差等于原数据平方的平均数减去平均数的平方1考点 2频率分布直方图频率、频数、样本容量的计算方法频率(1)组距频率组距频数频数(2)频率,样本容量,样本容量频率频数样本容量频率(1)(2019益阳模拟)为了了解某校九年级 1 600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是()A该校九年级学生 1 分钟仰卧起坐的次数的中位数为26.25B该校九年级学生 1 分钟仰卧起坐的次数的众数为27.5C该校九年级学生 1 分钟仰卧起坐的次数超过30 的
12、人数约为 320D该校九年级学生 1 分钟仰卧起坐的次数少于20 的人数约为 32(2)(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为 0.70.求乙离子残留百分比直方图中a,b的值;分别估计甲、乙离子残留百分比的平均值(同一组中的数据
13、用该组区间的中点值为代表)(1)D由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1 分钟仰卧起坐的次数超过30 的频率为 0.2,所以估计 1 分钟仰卧起坐的次数超过30 的人数为 320;1 分钟仰卧起坐的次数少于20 的频率为 0.1,所以估计 1 分钟仰卧起坐的次数少于20 的人数为 160.故 D 错误(2)解由已知得 0.70a0.200.15,故a0.35.b10.050.150.700.10.甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平
14、均值的估计值为30.0540.1050.1560.3570.2080.156.00.频率频率分布直方图的纵坐标是组距,而不是频率,切莫与条形图混淆教师备选例题(2018全国卷)某家庭记录了未使用节水龙头50 天的日用水量数据(单位:m)和使用了节水龙头 50 天的日用水量数据,得到频数分布表如下:未使用节水龙头 50 天的日用水量频数分布表3使用了节水龙头 50 天的日用水量频数分布表(1)在下图中作出使用了节水龙头50 天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算
15、,同一组中的数据以这组数据所在区间中点的值作代表)解(1)如图所示:3(2)根据以上数据,该家庭使用节水龙头后50 天日用水量小于 0.35 m 的频率为 0.20.110.12.60.120.050.48,因此该家庭使用节水龙头后日用水量小于0.35 m 的概率的估计值为 0.48.(3)该家庭未使用节水龙头50 天日用水量的平均数为1x1(0.0510.1530.2520.3540.4590.55260.655)500.48.该家庭使用了节水龙头后50 天日用水量的平均数为1x2(0.0510.1550.25130.35100.45160.555)0.35.50估计使用节水龙头后,一年可节
16、省水(0.480.35)36547.45(m)1.为了了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视333力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5 组频数和为 62,设视力在 4.6 到 4.8 之间的学生数为a,最大频率为 0.32,则a的值为()A64C48B54D27B前两组中的频数为 100(0.050.11)16.因为后五组频数和为 62,所以前三组为38.所以第三组频数为 22.又最大频率为 0.32,对应的最大频数为 0.3210032.所以a223254.2某城市 100 户居民的月平均用电量(单位:千瓦时),以160,180),
17、180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在220,240)的用户中应抽取多少户?解(1)(0.0020.009 50.0110.012 5x0.0050.002 5)201,解得x0.007 5.即直方图中x的值为 0.007 5.220240(2)月平均用电量的众数是230.2(0.0020.009 50.011)200.450.5,(0.0020.009 50.0110.012 5)200.70.5,月平均用电量的中位数在220,240)内设中位数为a,则 0.450.012 5(a220)0.5,解得a224,即中位数为 224.(3)月平均用电量在220,240)的用户有 0.012 52010025(户)同理可得月平均用电量在240,260)的用户有 15 户,月平均用电量在260,280)的用户有 10 户,月平均用电量111在280,300的用户有 5 户,故抽取比例为.251510551月平均用电量在220,240)的用户中应抽取 25 5(户)5
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100