资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,11/7/2009,#,#,单击此处编辑母版标题样式,会计学,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,会计学,1,数据集离散(lsn)程的测定,第一页,共34页。,一、标志变动(bindng)度:离散趋势,数据分布的另一个重要特征,离中趋势的各指标值是对数据离散程度所作的描述,反映各变量值远离其中心值的程度,因此也称为离中趋势,从另一个侧面说明了集中趋势测度值的代表程度,反映社会经济现象的均衡或协调性,以及(yj)产品质量的稳定程度,第1页/共34页,第二页,共34页。,数据的特征(tzhng)和测度,数据的特征和测度,分布的形状,离散程度,集中趋势,众 数,中位数,均 值,标准差系数,方差和标准差,峰 度,全距(极差),偏 度,第2页/共34页,第三页,共34页。,二、全距,第3页/共34页,第四页,共34页。,全距(概念(ginin)要点及计算公式),1.又称“极差”,一组数据的最大值与最小值之差,2.离散程度的最简单测度值,3.易受极端值影响,4.未考虑(kol)数据的分布,7,8,9,10,7,8,9,10,未分组数据(shj)R=max(Xi)-min(Xi),.,=,组距分组数据,R,最高组上限,-,最低组下限,5.,计算公式为,6.,全距越大,离散程度越大;越小,离散程度越小,第4页/共34页,第五页,共34页。,全距特点(tdin),受极端值影响。,不能计算(j sun)开口组的全距。,与中间标志值无关,不能反映中间值的差异;,与分布频数无关,不能全面反映各单位的标志的变异程度。,第5页/共34页,第六页,共34页。,三、平均差,第6页/共34页,第七页,共34页。,平均差(概念(ginin)要点及计算公式),1.离散程度的测度值之一,2.各变量值与其均值离差绝对值的平均数,3.能全面反映一组数据(shj)的离散程度,4.数学性质较差,实际中应用较少,5.,计算公式为,未分组数据(shj),组距分组数据,6.,平均差越大,标志变动度越大,第7页/共34页,第八页,共34页。,平均差(计算过程(guchng)及结果),某车间50名工人日加工零件标准差计算表,按零件数分组,组中值,(,X,i,),频数,(,F,i,),|,X,i,-,X,|,|,X,i,-,X,|,F,i,105,110,110,115,115,120,120,125,125,130,130,135,135,140,107.5,112.5,117.5,122.5,127.5,132.5,137.5,3,5,8,14,10,6,4,15.7,10.7,5.7,0.7,4.3,9.3,14.3,47.1,53.5,45.6,9.8,43.0,55.8,57.2,合计,50,312,【例3.23】计算(j sun)工人日加工零件数的平均差,第8页/共34页,第九页,共34页。,平均差特点(tdin),考虑了全部(qunb)标志值和分布频数,对离散趋势有较充分的代表性。,不便数学运算,实际中可用中位数代替算术平均数,第9页/共34页,第十页,共34页。,四、方差(fn ch)和标准差,第10页/共34页,第十一页,共34页。,方差(fn ch)和标准差(概念要点),1.离散程度的测度值之一,2.最常用的测度值,3.反映了数据的分布,反映了各变量值与均值的平均差异,根据总体数据计算的,称为(chn wi)总体方差或标准差;根据样本数据计算的,称为(chn wi)样本方差或标准差,4 6 8 10 12,X=,8.3,第11页/共34页,第十二页,共34页。,总体(zngt)方差和标准差(计算公式),未分组数据(shj):,组距分组数据(shj):,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,第12页/共34页,第十三页,共34页。,总体标准差(计算过程(guchng)及结果),某车间50名工人日加工零件标准差计算表,按零件数分组,组中值,(,X,i,),频数,(,F,i,),(,X,i,-,X,),2,(,X,i,-,X,),2,F,i,105,110,110,115,115,120,120,125,125,130,130,135,135,140,107.5,112.5,117.5,122.5,127.5,132.5,137.5,3,5,8,14,10,6,4,246.49,114.49,32.49,0.49,18.49,86.49,204.49,739.47,572.45,259.92,6.86,184.90,518.94,817.96,合计,50,3100.5,【例3.24】计算(j sun)工人日加工零件数的标准差,第13页/共34页,第十四页,共34页。,样本(yngbn)方差和标准差(计算公式),未分组数据(shj):,组距分组数据(shj):,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,注意:,样本方差用自由度,n-1,去除,!,第14页/共34页,第十五页,共34页。,样本(yngbn)方差自由度(degree of freedom),一组数据中可以自由取值的数据的个数,当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个(y)数据则不能自由取值,例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个(y)则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值,样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,第15页/共34页,第十六页,共34页。,样本(yngbn)方差(算例),原始数据,:,10 5 9 13 6 8,第16页/共34页,第十七页,共34页。,样本(yngbn)标准差(算例),样本(yngbn)标准差,原始数据,:10 5 9 13 6 8,第17页/共34页,第十八页,共34页。,方差(fn ch)(简化计算公式),样本(yngbn)方差,总体(zngt)方差,第18页/共34页,第十九页,共34页。,方差、标准差(数学(shxu)性质),各变量值对均值的方差(fn ch)最小,设X0为不等于X 的任意数,D2为对X0的方差(fn ch),则,第19页/共34页,第二十页,共34页。,方差(fn ch)、标准差(数学性质),方差等于(dngy)标志值平方的平均数减去标志值平均数的平方。,如果变量Y与变量X之间的关系(gun x)为YiabXi,其中a、b为常数,则,第20页/共34页,第二十一页,共34页。,方差(fn ch)、标准差(数学性质),如果X 与Y是两个相互(xingh)独立的变量,当ZkaXi+bYj(i=1,2,3,n;j=1,2,3,m;k=1,2,3,mn),则有,第21页/共34页,第二十二页,共34页。,五、数据(shj)的标准化,第22页/共34页,第二十三页,共34页。,标准分数,(,standard score,),1.也称标准化值,2.对某一个值在一组数据中相对位置(wi zhi)的度量,3.可用于判断一组数据是否有离群点,4.用于对变量的标准化处理,5.计算公式为,第23页/共34页,第二十四页,共34页。,标准分数(性质(xngzh),均值(jn zh)等于0,2.方差等于1,第24页/共34页,第二十五页,共34页。,标准分数(性质(xngzh),z分数只是将原始数据(shj)进行了线性变换,它并没有改变一个数据(shj)在改组数据(shj)中的位置,也没有改变该组数分布的形状,而只是将该组数据(shj)变为均值为0,标准差为1。,第25页/共34页,第二十六页,共34页。,标准化值(例题(lt)分析),9,个家庭人均月收入标准化值计算表,家庭编号,人均月收入(元),标准化值,z,1,2,3,4,5,6,7,8,9,1500,750,780,1080,850,960,2000,1250,1630,0.695,-1.042,-0.973,-0.278,-0.811,-0.556,1.853,0.116,0.996,第26页/共34页,第二十七页,共34页。,经验(jngyn)法则,经验(jngyn)法则表明:当一组数据对称分布时,约有68%的数据在平均数加减1个标准差的范围之内,约有95%的数据在平均数加减2个标准差的范围之内,约有99%的数据在平均数加减3个标准差的范围之内,第27页/共34页,第二十八页,共34页。,切比雪夫不等式,(,Chebyshevs inequality,),如果一组数据不是对称分布,经验法则就不再使用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用,切比雪夫不等式提供的是“下界”,也就是“所占比例至少有多少”,对于(duy)任意分布形态的数据,根据切比雪夫不等式,至少有 的数据落在k个标准差之内。其中k是大于1的任意值,但不一定是整数,第28页/共34页,第二十九页,共34页。,切比雪夫不等式,(,Chebyshevs inequality,),对于k=2,3,4,该不等式的含义是,至少有75%的数据落在平均数加减(ji jin)2个标准差的范围之内,至少有89%的数据落在平均数加减(ji jin)3个标准差的范围之内,至少有94%的数据落在平均数加减(ji jin)4个标准差的范围之内,第29页/共34页,第三十页,共34页。,六、标准差系数(xsh),第30页/共34页,第三十一页,共34页。,标准差系数(概念(ginin)要点和计算公式),1.标准差与其相应的均值之比,2.消除了数据水平高低和计量单位的影响,3.测度了数据的相对离散程度,4.用于对不同(b tn)组别数据离散程度的比较,5.计算公式为,第31页/共34页,第三十二页,共34页。,标准差系数(实例(shl)和计算过程),某管理局所属8家企业的产品销售数据,企业编号,产品销售额(万元),X,1,销售利润(万元),X,2,1,2,3,4,5,6,7,8,170,220,390,430,480,650,950,1000,8.1,12.5,18.0,22.0,26.5,40.0,64.0,69.0,【例3.25】某管理局抽查了所属的8家企业,其产品销售数据如表4.7。试比较产品销售额与销售利润的离散(lsn)程度,第32页/共34页,第三十三页,共34页。,标准差系数(xsh)(计算结果),X,1,=,536.25,(万元),S,1,=,309.19,(万元),V,1,=,536.25,309.19,=,0.577,S,2,=,23.09,(万元),V,2,=,32.5215,23.09,=,0.710,X,2,=,32.5215,(万元),结论:计算结果表明,V1V2,说明(shumng)产品销售额的离散程度小于销售利润的离散程度,第33页/共34页,第三十四页,共34页。,
展开阅读全文