资源描述
,教材研读,考点突破,栏目索引,教材研读,考点突破,栏目索引,教材研读,考点突破,栏目索引,*,*,教材研读,考点突破,栏目索引,*,*,教材研读,考点突破,栏目索引,教材研读,考点突破,栏目索引,*,*,理数,课标版,第二节用样本预计总体,1/28,1.惯用统计图表,(1)频率分布表画法:,第一步:求,极差,决定组数和组距,组距=,;,第二步:,分组,通常对组内数值所在区间取左闭右开区间,最终一,组取闭区间;,第三步:登记频数,计算频率,列出频率分布表.,教材研读,2/28,(2)频率分布直方图:反应样本频率分布直方图.,横轴表示样本数据,纵轴表示,每个小矩形面积表示样本,落在该组内,频率,.,(3)茎叶图画法:,第一步:将每个数据分为茎(高位)和叶(低位)两部分;,第二步:将各个数据茎按,大小,次序排成一列;,第三步:将各个数据叶依次写在其茎右(左)侧.,3/28,2.样本数字特征,(1)众数、中位数、平均数,数字特征,定义与求法,优点与缺点,众数,一组数据中出现次数最多数,通惯用于描述出现次数最多数,显然它对其它数据信息忽略使得无法客观地反应总体特征,中位数,把一组数据按大小次序排列,处于最中间位置一个数据(或两个数据平均数),中位数是样本数据所占频率等分线,它不受少数几个极端值影响,这在一些情况下是优点,但它对极端值不敏感有时也会成为缺点,平均数,假如有n个数据x1,x2,xn,那么这n个数平均数=(x1+x2+xn),平均数和每一个数据相关,能够反应样本数据全体信息,但平均数受数据中极端值影响较大,使平均数在预计总体时可靠性降低,4/28,(2)标准差、方差,(i)标准差:表示样本数据到平均数一个平均距离,普通用,s,表示,s,=,.,(ii)方差:标准差平方,s,2,叫做方差.,s,2,=,(,x,1,-,),2,+(,x,2,-,),2,+,+(,x,n,-,),2,其中,x,i,(,i,=1,2,3,n,)是,样本数据,n,是,样本容量,是,样本平均数,.,5/28,判断下面结论是否正确(请在括号中打“”或“,”),(1)在频率分布直方图中,小矩形高表示频率.,(,),(2)频率分布直方图中各个长方形面积之和为1.,(),(3)茎叶图中数据要按从小到大次序写,相同数据能够只记一次.,(,),(4)平均数、众数与中位数从不一样角度描述了一组数据集中趋势.,(),(5)一组数据方差越大,说明这组数据波动越大.,(),6/28,1.一个容量为32样本,已知某组样本频率为0.25,则该组样本频数,为,(),A.4B.8,C.12D.16,答案,B样本频数=32,0.25=8.,2.把样本容量为20数据分组,分组区间与频数以下:10,20),2;20,30),3;,30,40),4;40,50),5;50,60),4;60,70,2,则在区间10,50)上数据频率,是,(),A.0.05B.0.25,C.0.5D.0.7,答案,D由题意知,在区间10,50)上数据频数是2+3+4+5=14,故,其频率为,=0.7.,7/28,3.某雷达测速区要求:凡车速大于或等于70 km/h汽车视为“超速”,并将受处处罚.如图是某路段一个检测点对200辆汽车车速进行检,测后所作频率分布直方图,则从图中能够看出被处罚汽车大约有,(),A.30辆B.40辆,C.60辆D.80辆,答案,B从频率分布直方图可知,车速大于或等于70 km/h频率为,0.02,10=0.2,而样本容量为200,所以被处罚汽车约有200,0.2=40辆.,8/28,4.如图是某班8位学生诗词比赛得分茎叶图,那么这8位学生得分众,数和中位数分别为,.,答案,93,92,解析,依题意,结合茎叶图,将题中数由小到大依次排列得到:86,86,90,91,93,93,93,96,所以这8位学生得分众数是93,中位数是,=92.,9/28,5.某学员在一次射击测试中射靶10次,命中环数以下:7,8,7,9,5,4,9,10,7,4.,(1)平均命中环数为,;,(2)命中环数标准差为,.,答案,(1)7(2)2,解析,(1),=,(7+8+7+9+5+4+9+10+7+4)=7.,(2)方差,s,2,=,(7-7),2,+(8-7),2,+(7-7),2,+(9-7),2,+(5-7),2,+(4-7),2,+(9-7),2,+(10-7),2,+(7-,7),2,+(4-7),2,=4.,标准差,s,=2,.,10/28,考点一频率分布直方图,考点突破,典例1,我国是世界上严重缺水国家,某市政府为了勉励居民节约用,水,计划调整居民生活用水收费方案,拟确定一个合理月用水量标准,x,(吨),一位居民月用水量不超出,x,部分按平价收费,超出,x,部分按议,价收费.为了了解居民用水情况,经过抽样,取得了某年100位居民每人,月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成,了如图所表示频率分布直方图.,(1)求直方图中,a,值;,(2)设该市有30万居民,预计全市居民中月均用水量不低于3吨人数,并,说明理由.,11/28,解析,(1)由频率分布直方图知,月均用水量在0,0.5)中频率为0.08,0.5=0.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)中频率分别为0.08,0.20,0.26,0.06,0.04,0.02.,12/28,由0.04+0.08+0.5,a,+0.20+0.26+0.5,a,+0.06+0.04+0.02=1,解得,a,=0.30.,(2)由(1)知,100位居民每人月均用水量不低于3吨频率为0.06+0.04+,0.02=0.12.,由以上样本频率分布,能够预计全市30万居民中月均用水量不低于3,吨人数为300 000,0.12=36 000.,13/28,方法技巧,处理关于频率分布直方图问题,关键在于找出图中数据之间联络.,从图中可直接看出组距、,从而可间接计算出频率(小长方形面,积).处理直方图相关问题时,惯用到两个等量关系:小长方形面积=,组距,=频率,小长方形面积之和等于1(频率之和等于1).,1-1,(山东,3,5分)某高校调查了200名学生每七天自习时间(单位:,小时),制成了如图所表示频率分布直方图,其中自习时间范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.依据,直方图,这200名学生中每七天自习时间不少于22.5小时人数是,(),14/28,A.56B.60,C.120D.140,答案,D由频率分布直方图知200名学生每七天自习时间不少于22.5,小时频率为1-(0.02+0.10),2.5=0.7,则这200名学生中每七天自习时间,不少于22.5小时人数为200,0.7=140,故选D,.,15/28,1-2,为了了解高一年级学生体能情况,某校抽取了部分高一学生进,行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,若图,中从左到右各个小长方形高之比为24171593,且样本数据,落在第2小组频数为12.,(1)样本数据落在第2小组频率为,;,(2)抽取学生中一分钟跳绳次数在第3小组人数为,.,答案,(1)0.08(2)51,解析,(1)因为在频率分布直方图中,各个小长方形高之比=各个小长,方形面积之比=各组频率之比,所以样本数据落在第2小组频率,为,=0.08.,(2)因为各小组频率之比=小长方形高之比,所以设抽取学生中一,分钟跳绳次数在第3小组人数为,x,则有417=12,x,解得,x,=51.,16/28,考点二茎叶图,典例2,(课标,18,12分)某企业为了解用户对其产品满意度,从,A,B两地域分别随机调查了20个用户,得到用户对产品满意度评分如,下:,A地域:62738192958574645376,78869566977888827689,B地域:73836251914653736482,93486581745654766579,(1)依据两组数据完成两地域用户满意度评分茎叶图,并经过茎叶图,比较两地域满意度评分平均值及分散程度(不要求计算出详细值,给,出结论即可);,17/28,A地域,B地域,4,5,6,7,8,9,(2)依据用户满意度评分,将用户满意度从低到高分为三个等级,:,记事件,C,:“A地域用户满意度等级高于B地域用户满意度等,级”.假设两地域用户评价结果相互独立.依据所给数据,以事件发生,频率作为对应事件发生概率,求,C,概率.,满意度评分,低于70分,70分到89分,不低于90分,满意度等级,不满意,满意,非常满意,18/28,A地域,B地域,4,68,3,5,1364,642,6,2455,688643,7,33469,928651,8,321,7552,9,13,解析,(1)两地域用户满意度评分茎叶图以下:,(3,分,),经过茎叶图能够看出,A,地域用户满意度评分平均值高于,B,地域用户,满意度评分平均值,;A,地域用户满意度评分比较集中,B,地域用户满意,度评分比较分散,.,(6,分,),19/28,(2)记,C,A1,表示事件:“A地域用户满意度等级为满意或非常满意”;,C,A2,表示事件:“A地域用户满意度等级为非常满意”;,C,B1,表示事件:“B地域用户满意度等级为不满意”;,C,B2,表示事件:“B地域用户满意度等级为满意”,则,C,A1,与,C,B1,独立,C,A2,与,C,B2,独立,C,B1,与,C,B2,互斥,(8分),C,=,C,B1,C,A1,C,B2,C,A2,.,P,(,C,)=,P,(,C,B1,C,A1,C,B2,C,A2,)=,P,(,C,B1,C,A1,)+,P,(,C,B2,C,A2,)=,P,(,C,B1,),P,(,C,A1,)+,P,(,C,B2,),P,(,C,A2,).,由所给数据得,C,A1,C,A2,C,B1,C,B2,发生频率分别为,故,P,(,C,A1,)=,P,(,C,A2,)=,P,(,C,B1,)=,P,(,C,B2,)=,P,(,C,)=,+,=,0.48.,(12分),20/28,规律总结,(1)茎叶图绘制需注意:“叶”每个位置上只有一个数字,而,“茎”每个位置上数位数普通不需要统一;重复出现数据要,重复统计,不能遗漏,尤其是“叶”位置上数据.,(2)茎叶图通惯用来统计两位数数据,能够用来分析单组数据,也能够,用来比较两组数据.经过茎叶图能够确定数据中位数,数据大致集中,在哪块茎,数据是否关于茎对称,数据分布是否均匀等.,21/28,2-1,若某校高一年级8个班参加合唱比赛得分如茎叶图所表示,则这组,数据中位数和平均数分别是,(),A.91.5和91.5B.91.5和92,C.91和91.5D.92和92,答案,A将这组数据从小到大排列为87,89,90,91,92,93,94,96.,故中位数为,=91.5.,平均数为91+,=91.5.,22/28,2-2,如图所表示茎叶图统计了甲、乙两组各五名学生在一次英语听,力测试中成绩(单位:分).已知甲组数据中位数为15,乙组数据平,均数为16.8,则,x,y,值分别为,(),甲组,乙组,9,0,9,x,2,1,5,y,8,7,4,2,4,A.2,5B.5,5,C.5,8D.8,8,答案,C甲组数据中位数为15=10+,x,x,=5.,又乙组数据平均数为,=16.8,y,=8.,x,y,值分别为5,8.,23/28,考点三样本数字特征,典例3,(广东,17,12分)某工厂36名工人年纪数据以下表.,工人编号,年纪,工人编号,年纪,工人编号,年纪,工人编号,年纪,1,40,10,36,19,27,28,34,2,44,11,31,20,43,29,39,3,40,12,38,21,41,30,43,4,41,13,39,22,37,31,38,5,33,14,43,23,34,32,42,6,40,15,45,24,42,33,53,7,45,16,39,25,37,34,37,8,42,17,38,26,44,35,49,9,43,18,36,27,42,36,39,24/28,(1),用系统抽样法从,36,名工人中抽取容量为,9,样本,且在第一分段,里用随机抽样法抽到年纪数据为,44,列出样本年纪数据,;,(2)计算(1)中样本均值,和方差,s,2,;,(3)36名工人中年纪在,-,s,与,+,s,之间有多少人?所占百分比是多少,(准确到0.01%)?,解析,(1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工,人.,因为在第一分段里抽到是年纪为44工人,即编号为2工人,故所抽样本年纪数据为44,40,36,43,36,37,44,43,37.,(2)均值,=,=40;,25/28,方差,s,2,=,(44-40),2,+(40-40),2,+(36-40),2,+(43-40),2,+(36-40),2,+(37-40),2,+(44-,40),2,+(43-40),2,+(37-40),2,=,.,(3)由(2)可知,s,=,.,由题意知,年纪在,内工人共有23人,所占百分比为,100%,63.89%.,26/28,规律总结,平均数与方差都是主要数字特征,是对数据一个简明描述,它们所,反应情况有着主要实际意义.平均数、中位数、众数描述数据集中,趋势,方差和标准差描述数据波动大小.,3-1,(河南信阳三中月考)为比较甲、乙两地某月14时气温情况,随机选取该月中5天,将这5天中14时气温数据(单位:)制成如图所,示茎叶图.,考虑以下结论:,27/28,甲地该月14时平均气温低于乙地该月14时平均气温;,甲地该月14时平均气温高于乙地该月14时平均气温;,甲地该月14时气温标准差小于乙地该月14时气温标准差;,甲地该月14时气温标准差大于乙地该月14时气温标准差.,其中依据茎叶图能得到统计结论编号为,(),A.B.,C.D.,答案,B由茎叶图中数据经过计算求得,=29,=30,s,甲,=,s,乙,=,s,乙,故正确.,故选B.,28/28,
展开阅读全文