1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,众数的确定(分组数据),众数,=25,1,众数的确定(分组数据),组距,频数,10 14,5,15 19,7,20 24,12,25 29,18,30 34,22,35 39,16,40 44,10,45 49,8,众数为,31.5,Line 1,Line 2,Line 3,2,众数的确定(分组数据),L,众数组的真实下限值,d1,众数组频数,-,众数组前一组频数,d2,众数组频数,-,众数组后一组频数,i,每组数据的组距个数,3,中位数,(,位置的确定,),奇数个数的数据,:,偶数个数的数据:,4,中位数
2、的确定(分组数据),根据位置公式确定中位数所在的组,采用下列近似公式计算:,L,中位数组的真实组下限的值,N,整组数据的总数量,Sm-1,中位数组为止以上的累积频数,fm,中位数组的频数,i,组距的个数,5,某车间,50,名工人月产量的资料如下,:,月产量(件),工人人数(人),向上累计次数,(人),200,以下,200,400,400,600,600,以上,3,7,32,8,3,10,42,50,合计,50,6,简单平均数,(Simple Mean),设一组数据为:,X,1,,,X,2,,,,,Xn,适用于总体资料未经分组整理、尚为原始资料的情况,总体均值,样本均值,式中:,为均值,;,N,
3、n,),为总体,(,样本,),单位总数;,Xi,为第,i,个单位的变量值。,7,算术平均数的计算方法,案例分析,4.10,某售货小组,5,个人,某天的销售额分别为,520,元、,600,元、,480,元、,750,元、,440,元,则,平均每人日销售额为:,8,加权平均数,(Weighted Mean),设一组数据为:,x,1,,,x,2,,,,,xn,相应的频数为:,f,1,,,f,2,,,,,fk,适用于总体资料经过分组整理形成变量数列的情况,总体均值,样本均值,(,未分组,),公式中:为均值,;f,为相应频数;,Xi,为第,i,个单位的变量值。,9,加权平均数的计算方法案例分析,4.
4、11,某企业某日工人的日产量资料如下:,日产量(件),工人人数(人),10,11,12,13,14,70,100,380,150,100,合计,800,计算该企业该日全部工人的平均日产量。,10,加权平均数的计算方法案例分析,4.11,若上述资料为分组数列,则应取各组的,组中值,作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。,11,简单平均数与加权平均数,(Simple Mean/Weighted Mean),设一组数据为:,x,1,,,x,2,,,,,x,n,各组的组中值为,:,M,1,,,M,2,,,,,M,k,相应的频数为:,f,1,,,f,2,,,,,f,k,简单平
5、均数,加权平均数,(,分组数据,),表示各组的,变量值,(分组数列的,组中值,);,表示各组变量值出现的频数(即,权数,)。,12,例:,根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。,按销售量分组(台),组中值,(,M,i,),市场个数,(,f,i,),M,i,f,i,140,150,150,160,160,170,170,180,180,190,190,200,200,210,210220,220230,230240,145,155,165,175,185,195,205,215,225,235,4,9,16,27,20,17,10,8,4,5,580,1395,2640
6、4725,3700,3315,2050,1720,900,1175,合计,f,i,120,M,i,f,i,22200,13,样本,方差和标准差,(Sample Variance and Standard Deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,注意:,样本方差用自由度,n-1,去除,!,14,样本标准差,例题分析,4.18,某电脑公司销售量数据平均差计算表,按销售量分组,组中值,(,M,i,),频数,(,f,i,),140150,150160,160170,170180,180190,190200,200210,21
7、0220,220230,230240,145,155,165,175,185,195,205,215,225,235,4,9,16,27,20,17,10,8,4,5,1600,900,400,100,0,100,400,900,1600,2500,6400,8100,6400,2700,0,1700,4000,7200,6400,12500,合计,120,55400,15,样本标准差,例题分析,4.18,结论,:每一天的销售量与平均数相比,平均相差,21.58,台,16,练习题,4.1,某百货公司,6,月份各天的销售额数据如下(单位:万元):,(,1,)计算该百货公司日销售额的均值、中位数和
8、四分位数;,(,2,)计算日销售额的标准差。,17,解答,4.1,均值:,中位数,:位置为第,15,位和第,16,位,四分位数,:中位数位于第,15,个数靠上半位的位置上,所以前四分位数位于第,1,第,15,个数据的中间位置,(,第,8,位,),靠上四分之一的位置上,后四分位数位于第,16,第,30,个数据的中间位置,(,第,23,位,),靠下四分之一的位置上,由重新排序后的,Excel,表中第,23,位是,291,,第,16,位是,273,。,标准差:,21.17,18,练习题,4.2,在某地区抽取的,120,家企业按利润额进行分组,结果如下:,计算,120,家企业利润额的均值和标准差。,1
9、9,解答,4.2,各组平均利润为,x,,企业数为,f,,则组总利润为,xf,,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:,均值:,20,解答,4.2,标准差:,21,一个总体参数的区间估计,总体参数,符号表示,样本统计量,均值,比例,方差,22,总体,均值,的区间估计,(,大样本,n,30,),假定条件,总体服从正态分布,且,方差,(,),已,知,如果不是正态分布,可由正态分布来近似,(,n,30),使用正态分布统计量,z,总体均值,在,1-,置信水平下的,置信区间为,23,总体均值的区间估计 例题分析,6.2,一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企
10、业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了,25,袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为,10g,。试估计该批产品平均重量的置信区间,置信水平为,95%,。,25,袋食品的重量,112.5,101.0,103.0,102.0,100.5,102.6,107.5,95.0,108.8,115.6,100.0,123.5,102.0,101.6,102.2,116.6,95.4,97.8,108.6,105.0,136.8,102.8,101.5,98.4,93.3,24,总体均值的区间估计 例题分析,6.2,解:,
11、已知,N,(,,,10,2,),,,n,=25,1-,=95%,,,z,/2,=1.96,。根据样本数据计算得:。由于是正态总体,且方差已知。,总体均值,在,1-,置信水平下的置信区间为,因此:食品平均重量的置信区间为,101.44g109.28g,25,总体均值的区间估计 例题分析,6.3,一家保险公司收集到由,36,个,投保人组成的随机样本,得到每个投保人的年龄,(,单位:周岁,),数据如下表。试建立投保人年龄,90%,的置信区间。,36,个投保人年龄的数据,23,35,39,27,36,44,36,42,46,43,31,33,42,53,45,54,47,24,34,28,39,36,
12、44,40,39,49,38,34,48,50,34,39,45,48,45,32,26,总体均值的区间估计 例题分析,6.3,解:,已知,n,=36,1-,=90%,,,z,/2,=1.645,。根据样本数据计算得:,,总体均值,在,1-,置信水平下的置信区间为,因此:在置信水平为,90%,的情况下,投保人平均年龄的置信区间为,37.37,岁,41.63,岁。,27,总体,均值,的区间估计,(,小样本,),假定条件,总体服从,正态,分布,但方差,(,),未知,小样本,(,n,1020,=0.05,n,=16,临界值,(s):,检验统计量,:,因为,Z,0.05,=1.645,2.4,1.64
13、5,在,=0.05的水平上,拒绝H,0,有证据表明这批灯泡的使用寿命有显著提高。,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,56,2,未知大样本均值的检验,(,例题分析,7.3,),H,0,:,1200,H,1,:,1200,=0.05,n,=100,临界值,(s):,检验统计量,:,因为,Z,0.05,=1.645,1.5,1.645,在,=0.05,的水平上,不拒绝,H,0,不能认为该厂生产的元件寿命显著地高于,1200,小时。,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,57,2,未知小样本均值的检验,(,例题分析,7.4,),H,0,:,=5,H,1,:,
14、5,=0.05,df=10-1=9,临界值,(s):,检验统计量,:,因为 t,0.025,=2.262,3.16,2.262,在,=0.05的水平上拒绝H,0,说明该机器的性能不好。,决策:,结论:,t,0,2.262,-2.262,.025,拒绝,H,0,拒绝,H,0,.025,58,均值的单侧,t,检验,(,计算结果,),H,0,:,40000,H,1,:,40000,=0.05,df=20-1=19,临界值,(s):,检验统计量,:,因为,t,0.05,=1.729,0.894,1.729,在,=0.05,的水平上不拒绝,H,0,不能认为制造商的产品同他所说的标准不相符。,决策,:,结
15、论,:,-1.7291,t,0,拒绝域,.05,t,0,拒绝域,0.05,1.729,59,总体比例的检验,(,例题分析,7.6,),H,0,:,=14.7%,H,1,:,14.7%,=0.05,n,=400,临界值,(s):,检验统计量,:,因为 Z,0.025,=1.96,-0.254,-1.96,在,=0.05的水平上不拒绝H,0,该市老年人口比重为,14.7%.,决策,:,结论,:,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,60,方差的卡方,(,2,),检验,(,例题分析,7.7),H,0,:,2,=1,H,1,:,2,1,=0.05,df=25-1
16、24,临界值,(s):,统计量,:,在,=0.05,的水平上不拒绝,H,0,不能认为该机器的性能未达到设计要求,2,0,39.36,12.40,/2=.05,决策,:,结论,:,61,用置信区间进行检验,(,例题分析,7.8,),H,0,:,=,1000,H,1,:,1000,=0.05,n,=16,临界值,(s):,置信区间为,决策,:,结论,:,假设的,0,=1000,在置信区间内,不拒绝,H,0,不能认为这批产品的包装重量不合格。,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,62,练习题,7.1,液晶显示屏批量生产的质量标准为平均使用寿命,35000,
17、小时。某厂商宣称其生产的液晶显示屏的使用寿命远远超过规定标准。现从该厂商生产的一批液晶显示屏中随机抽取了,100,件样本进行验证,测得平均使用寿命为,35250,小时,标准差为,1380,小时,试在,(,=0.05,),的显著性水平下检验该厂商生产的液晶显示屏是否显著的高于规定标准?,63,练习题,7.2,某制盐企业用机器包装食盐,假设每袋食盐的净重量服从正态分布,每袋标准净重量为,500,克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取了,9,袋,测得平均净重量为,499,克,样本标准差为,16.03,克,试在,(,=0.05,),的显著性水平下检验这天包装机工作是否正常?,
18、64,练习题,7.3,某公司计划为每一位员工配股,董事会估计配股方案在全体员工内的支持率为,80%,。现随机抽查,100,名员工,其中支持配股方案的有,76,人。试在,(,=0.05,),的显著性水平下检验董事会的估计是否可靠?,65,练习题,7.4,66,解答,7.1,67,解答,7.2,68,解答,7.3,69,解答,7.4,70,方差分析,练习题,8.1,某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了,30,名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到如下表:,1,)完成方差分析表,2,)若显著性水平为,=0
19、05,,检验三种方法组装的产品数量之间是否有显著差异。,71,练习题,8.2,从三个总体中各抽取容量不同的样本数据,得到下表。检验,3,个总体的均值之间是否有显著差异,.,(,=0.01),72,练习题,8.3,某家电制造公司准备购进一批,5#,电池,现有,A,B,C,三个电池生产企业愿意供货,为此比较它们生产的电池质量,从每个企业各随机抽取,5,只电池,经试验得出其寿命(小时)数据如下表。,试分析三个企业生产的电池的平均寿命之间有无差异。,(,=0.05),如果有差异,用,LSD,方法建议哪些企业之间有差异。,73,解答,8.1,F=1.478F,0.05,(2,27)=3.354 131
20、 所以不拒绝原假设,表明不认为三种方法组装的产品之间有显著差异。,P值也可以直接用来进行统计决策,若P,,则拒绝原假设,P,,则不拒绝原假设。该题中P=0.245 946,=0.05,因此不拒绝原假设,H,0,。,74,解答,8.2,F=4.6574F,0.01,(2,9)=8.0215 所以不拒绝原假设,表明不认为三个总体均值之间有显著差异。,P值也可以直接用来进行统计决策,若P,,则拒绝原假设,P,,则不拒绝原假设。该题中P=0.040877,=0.01,因此不拒绝原假设,H,0,。,75,解答,8.3,F=17.0684F,0.05,(2,12)=3.88529 所以拒绝原假设,表明三个
21、三个企业生产电池的寿命之间有显著差异。,P值也可以直接用来进行统计决策,若P,,则拒绝原假设,P,,则不拒绝原假设。该题中P=0.00031,=0.05,因此不拒绝原假设,H,0,。,76,解答,8.3,第,1,步:,提出假设,检验,1,:,检验,2,:,检验,3,:,77,解答,8.3,第,2,步:,计算检验统计量,检验,1,:,检验,2,:,检验,3,:,第,3,步:,计算,LSD,检验,1,:,检验,2,:,检验,3,78,解答,8.3,第,4,步:,作出决策,A,电池与,B,电池寿命有显著差异,不认为,A,电池与,C,电池寿命有显著差异,B,电池与,C,电池寿命有显著差异,79,回归,
22、练习题,9.1,某汽车生产商欲了解广告费用,x,对销售量,y,的影响,收集了过去,12,年的有关数据。通过计算得到下面的有关结果:,方差分析表,变差来源,df,SS,MS,F,Significance F,回归,2.17E-09,残差,220158.07,-,-,总计,11,1642866.67,-,-,-,80,解答,9.1,变差来源,df,SS,MS,F,Significance F,回归,1,1422708.6,1422708.6,64.6221,2.17E-09,残差,10,220158.07,22015.807,总计,11,1642866.67,解:(,2,),由此可知,销售量与广告费用之间的相关系数是,0.93,。,81,解答,9.1,(3),估计的回归方程:,回归系数 表示广告费用每增加一个单位,销售量平均增加,1.420211,个单位。,(4)F=64.6221,,所以这回归方程是显著的。,82,
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818