收藏 分销(赏)

集中趋势和离中趋势学习教案.pptx

上传人:可**** 文档编号:12104757 上传时间:2025-09-13 格式:PPTX 页数:59 大小:600.02KB 下载积分:8 金币
下载 相关 举报
集中趋势和离中趋势学习教案.pptx_第1页
第1页 / 共59页
集中趋势和离中趋势学习教案.pptx_第2页
第2页 / 共59页


点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,11/7/2009,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,0,集中(jzhng)趋势和离中趋势,第一页,共59页。,算术平均的统计含义:算术平均数是同质总体各数据(shj)偶然性、随机性特征互相抵消后的稳定数值。反映数据(shj)集中的特征。,例 某生产班组11个工人的日产零件数分别(fnbi)为:15,17,19,20,22,26,30。求该生产班组工人的平均日产零件数。,22,解:,第1页/共58页,第二页,共59页。,算术平均值的性质一:数据(shj)观察值与均值的离差值之和为零.,此性质(xngzh)表明均值是各数值的重心,算术平均值的性质(xngzh)二:观察值与均值的离差平方和最小。,为任意数,故用算术平均值来预测作为估计值,误差平方和最小。,第2页/共58页,第三页,共59页。,数列(shli):1,2,2,3 平均数为2,数列(shli):1,2,2,5 平均数为2.5,数列(shli):1,2,2,7 平均数为3,均值的缺点:,均值易受极端值的影响,某个极端大值或极端小值都会影响均值的代表性。同时还影响其对集中趋势测度的准确性。,第3页/共58页,第四页,共59页。,50,0,1 2 3 4 5 6 7,数列(shli):1,2,2,3 平均数为2,数列(shli):1,2,2,5 平均数为2.5,数列(shli):1,2,2,7 平均数为3,第4页/共58页,第五页,共59页。,极端(jdun)值比较,50,0,1 2 3,4 5 6 7,50,0,1 2 3,4 5 6 7,50,0,1 2 3,4 5 6 7,数列(shli):1,2,2,3,数列(shli):1,2,2,5,数列,:1,2,2,7,平均数,左图是三个直方图,平均数用箭头标出,当蓝色矩形移向右方时,它牵着平均数跟着走。,在平均数处直方图保持平衡,面积以它们离开平衡点的距离而被加权。,第5页/共58页,第六页,共59页。,2.加权算术(sunsh)平均数,如果(rgu)数据是分组资料,经过整理形成了次数分配,由于各组次数不同,要用次数作权数计算加权算术平均数。,则均值的计算公式为:,其中(qzhng)Xi 表示第i 组的组中值,fi表示第i组的次数。,第6页/共58页,第七页,共59页。,工人一周生产零件数,工人数,f,i,组中值,x,i,x,i,f,i,60,以下,7,55,385,60-70,21,65,1365,70-80,25,75,1875,80-90,19,85,1615,90,以上,8,95,760,合计,80,-,6000,例:某单位80工人一周生产零件(ln jin)数的分组统计资料如下表:,第7页/共58页,第八页,共59页。,二、中位数,将数据观察值x1,x2,xn按其变量值由小到大的顺序排列,处于数列中点位置(wi zhi)的数值就是中位数(Me)。,中位数的确定方法:,如果数据个数为奇数,则处于(chy)(n+1)/2位置的标志值是中位数。,如果数据个数为偶数,则处于(chy)n/2、n/2+1的两个标志值的平均数为中位数。,第8页/共58页,第九页,共59页。,如果是组距分组资料(zlio),公式为:,中位数是n/2位置上的数值,设落在第i组,Li是中位数所在组的下限,Ui是中位数所在组的上限(shngxin);fi是中位数所在组的次数。,Fi-1是中位数所在组的前一组的累积次数,Ui-Li是中位数所在组的组距=上限(shngxin)-下限,向上(xingshng)累积,向下累积,第9页/共58页,第十页,共59页。,某单位80工人(gng rn)一周生产零件数分组统计资料如下:,工人一周生产零件数,工人数,f,i,组中值,x,i,x,i,f,i,向上累计频数,向下累计频数,60,以下,7,55,385,7,80,60-70,21,65,1365,28,73,70-80,25,75,1875,53,52,80-90,19,85,1615,72,27,90,以上,8,95,760,80,8,合计,80,-,6000,-,-,12,13,28,第10页/共58页,第十一页,共59页。,优点:中位数是位置平均数,不受极端(jdun)值的影响。,各个数值相对其中位数的绝对离差之和为最小。,不足:中位数确定时只与中间位置的相关数据有关,而不考虑其它数值的大小,缺乏敏感性;计算复杂。,第11页/共58页,第十二页,共59页。,三、众 数,众数是一组资料中出现次数最多的那个数值,也反映数据(shj)集中的程度(M0)。,未分组资料,M0就是出现次数最多的变量值。,20,15,18,20,20,22,20,23,众数为20,20,20,15,19,19,20,19,25,众数为19,20,10,11,13,16,15,25,8,12,不存在众数,第12页/共58页,第十三页,共59页。,分组资料:在等距分组的情况(qngkung)下,频数最多的组是众数组,在该组内确定众数。,设众数(zhn sh)在第i组,则,Li是众数所在(suzi)组的下限,Ui是众数所在(suzi)组的上限;,fi是众数所在(suzi)组的次数。,di=Ui-Li是中位数所在(suzi)组的组距=上限-下限,第13页/共58页,第十四页,共59页。,某单位80工人(gng rn)一周生产零件数分组统计资料如下:,工人一周生产零件数,工人数,f,i,组中值,x,i,x,i,f,i,向上累计频数,向下累计频数,60,以下,7,55,385,7,80,60-70,21,65,1365,28,73,70-80,25,75,1875,53,52,80-90,19,85,1615,72,27,90,以上,8,95,760,80,8,合计,80,-,6000,-,-,第14页/共58页,第十五页,共59页。,60以下(yxi),70,80,90,90以上(yshng),10,20,30,f(人数(rn sh)),周生产零件数,1,2,M,0,第15页/共58页,第十六页,共59页。,第16页/共58页,第十七页,共59页。,在,Excel,中,AVERAGE()计算(j sun)算术平均数,如:AVERAGE(F1:F30),利用SUM()函数和SUMPRODUCT()函数求加权算术平均。,如:SUMPRODUCT(A1:A10,B1:B10)/SUM(B1:B10),MEDIAN()计算(j sun)中位数,MEDIAN(F1:F30),MODE()计算(j sun)众数,MODE(F1:F30),第17页/共58页,第十八页,共59页。,四、均值(jn zh)、中位数、众数三者之间的关系,X,f,X,f,X,f,(对称(duchn)分布),正偏态分布(fnb)(右),负偏态分布,(,左),均值是数据分布的平衡点或重心,中位数把这个分布划分为两半,众数正好是分布的顶端。,第18页/共58页,第十九页,共59页。,在偏斜不大时,中位数大约位于(wiy)均值与众数的1/3处。,第19页/共58页,第二十页,共59页。,算术平均数适合用代数方法运算,故在实践中应用很广,主要适用于数值变量;,中位数不受极端值的影响,各个数值相对其中位数的绝对离差之和为最小。故当一组观测值有极大值或极小值时,用中位数表示现象的一般水平更具有代表性。,众数适用于总体的单位数较多,各标志值的次数分配有明显的集中趋势的情况。如果总体单位数很少,尽管次数分配较集中,那么计算出来的众数意义不大;如果总体单位数很多,但次数分配不集中,即各单位的标志值在总体中出现(chxin)的比重较均匀,那么也无所谓众数。,第20页/共58页,第二十一页,共59页。,五、集中趋势(qsh)的其它测度量,1.分位数:四分位数、十分位数、百分位数。,分位数的计算:,(1)将资料按大小顺序排列;,(2)求出分位数所在位置i;,(3)若i为整数,则所求分位数为该位置上的数值(shz);若i为非整数,则取第i与第i+1位置的两个数值(shz)的平均数为所求分位数。,(4)若资料为分组数据,则各分位数可按下式计算:,Ki表示第i个K分位数;Li表示第i个K分位数所在(suzi)组的下限;N表示数据总个数;Fi-1表示第i个K分位数所在(suzi)组的前一组的累积次数;fi是第i个K分位数所在(suzi)组的次数。di=Ui-Li是第i个K分位数所在(suzi)组的组距。,第21页/共58页,第二十二页,共59页。,其中 表示中位数的位置取整。这样计算(j sun)出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上,四分位数的位置确定(qudng)方法:,方法1:定义算法,方法2:以中位数为中心,从两端再计算中位数,公式:,第22页/共58页,第二十三页,共59页。,方法3 Excel给出的四分位数位置(wi zhi)的确定方法,无论哪种算法,如果位置(wi zhi)是整数,四分位数就是该位置(wi zhi)对应的值;如果是在0.5的位置(wi zhi)上,则取该位置(wi zhi)两侧值的平均数;如果在0.25或0.75位置(wi zhi)上,则四分位数等于该位置(wi zhi)的下侧值加上按比例分摊位置(wi zhi)两侧数值的差值。,第23页/共58页,第二十四页,共59页。,【例】:9个家庭的人均月收入数据(shj)(3种方法计算),原始数据(shj):1500 750 780 1080 850 960 2000 1250 1630,排 序:750 780 850 960 1080 1250 1500 1630 2000,位 置:1 2 3 4 5 6 7 8 9,方法1:,方法2:,所以QL为从最小值数第3个数值,即850元;Qu为从最大值数第3个数值,即1500元;,第24页/共58页,第二十五页,共59页。,方法(fngf)3 Excel方法(fngf),所以QL为第3个数值,即850元;Qu为7个数值,即1500元;,可见三种方法计算的四分位数不完全相同。但对他们的解释是一样的,即排序(pi x)数据中,至少25%的数据小于等于QL,至少75%的数据小于等于Qu。,原始数据,:,1500 750 780 1080 850 960 2000 1250 1630,排 序,:,750 780 850 960 1080 1250 1500 1630 2000,位 置,:,1 2 3 4 5 6 7 8 9,第25页/共58页,第二十六页,共59页。,2.几何平均(pngjn)数,(1)简单几何平均(pngjn)数公式为:,对上式取对数:,主要用于计算平均(pngjn)发展速度或平均(pngjn)增长率,即,(1)对比率进行平均(pngjn);,(2)测定生产或经济变量的时间序列的平均(pngjn)增长率。,第26页/共58页,第二十七页,共59页。,例:某高校2001-2005年学生人数如下(rxi)表,求该校学生学生人数的平均发展速度。,平均发展速度为:,年份,学生人数,逐年发展速度(,%,),2000,3760,-,2001,5900,156.9,2002,7600,128.8,2003,9900,130.3,2004,10200,103.0,2005,11000,107.8,第27页/共58页,第二十八页,共59页。,例:某机械厂五个流水作业车间(chjin)的合格率分别为96%、94%、95%、95%和96%,则五个车间(chjin)(即全厂)的平均生产合格率为:,但注意:该厂总的合格率为,第28页/共58页,第二十九页,共59页。,(2)加权几何平均数,当各个变量值出现的次数(csh)不等时,则应采用加权几何平均。,公式为:,第29页/共58页,第三十页,共59页。,注意:当观测值有一项为0或负值时,不易(b y)计算几何平均数。,例:将一笔钱存入(cn r)银行,存期10年,以复利计息,10年的利率分配是:第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率。,第30页/共58页,第三十一页,共59页。,3.调和(tio h)平均值,调和平均值是观察(gunch)值倒数之平均数的倒数,也称倒数平均数。用 表示:,当总体单位数未知或观测值是具有倒数(do sh)性质的变量时,适合采用调和平均数。,例如某人前10公里以时速50公里行驶,后10公里以30公里时速行驶。这20公里花了0.533小时,所以平均时速,第31页/共58页,第三十二页,共59页。,加权调和(tio h)平均数,mi表示各组标志总量。,应用条件:资料经过(jnggu)分组,各组次数不同。,第32页/共58页,第三十三页,共59页。,例:市场上某种蔬菜的价格是早市每公斤1.25元,午市每公斤1.20元,晚市每公斤1.10元。现若早、中、晚分别(fnbi)购买15元、12元和10元钱的蔬菜,问所购买蔬菜的平均价格是多少?,第33页/共58页,第三十四页,共59页。,算术平均、几何平均、调和(tio h)平均三者关系,三者均属于均值体系,一般情况下,算术平均值、几何平均值、调和平均值有如下关系:,在实际中任何一个计算对象一般都只适合采用一种方法来计算平均数,也就是说不同的平均数计算方法适合不同的计算条件,必须(bx)加以正确选择。,第34页/共58页,第三十五页,共59页。,在,Excel,中,QUARTILE()计算四分(s fn)位数,如:QUARTILE(A2:A10,1)第一个四分(s fn)位数,QUARTILE(A2:A10,2)第二个四分(s fn)位数(即中位数),QUARTILE(A2:A10,3)第三个四分(s fn)位数,QUARTILE(A2:A10,0)最小值,QUARTILE(A2:A10,4)最大值,PERCENTILE()计算百分位数,如:PERCENTILE(B2:B15,0.3),GEOMEAN()计算几何平均数,GEOMEAN(B2:B10),HARMEAN()计算简单调和平均数,HARMEAN(B2:B10),第35页/共58页,第三十六页,共59页。,4.2 离中趋势(qsh)的计算,离中趋势是数据分布的又一特征,它表明变量值的差异或离散程度。,离中趋势测度经常用到的指标有:极差、方差和标准差、四分位差等,它们也被称为变异指标。,一、极差,极差也称为全距,是一组数据的最大值和最小值的差:,缺点(qudin):易受极端值的影响。,由于全距只考虑了两个(lin)极端值之间的差距,没有利用全部观测值的信息,所以不能充分反映全部观测值之间的实际差异程度,所以在应用上有一定的局限性。,第36页/共58页,第三十七页,共59页。,二、平均差,1、平均差是指数据值与其均值之差的绝对值的算术平均值,用符号AD表示。计算公式:,2、优点:完整地反映了全部数据的分散程度(chngd),计算方法简单;,缺点:绝对值计算不方便,故实际中较少应用。,分组数据(shj):,未分组数据(shj):,平均差越大,,说明数据的离散程度越大;,平均差愈小,,说明数据的离散程度越小;,第37页/共58页,第三十八页,共59页。,三、方差(fn ch)与标准差,总体方差是观察(gunch)值与其均值离差平方和的均值;,总体标准差是总体方差的正平方根;,第38页/共58页,第三十九页,共59页。,如果计算总体方差的资料是次数分配数据,在计算总体方差时要将各组权数考虑进去(jn q),有如下公式:,总体(zngt)方差的另一种表达方式:,总体方差愈大,数据的变动(bindng)程度愈大,总体方差愈小,数据的变动(bindng)程度愈小。,第39页/共58页,第四十页,共59页。,样本(yngbn)方差与样本(yngbn)标准差,当样本数据(shj)个数足够大时,样本方差与总体方差很接近,在Excel中,Max()-min()计算极差,AVEDEV()计算平均差,VARP()计算总体方差,VAR()计算样本方差,STDEVP()计算总体标准差,STDEV()计算样本标准差,第40页/共58页,第四十一页,共59页。,四、Chebishev定理与经验(jngyn)法则,1.Chebishev定理:,对任何一组资料,观测值落于均值左右k个标准差的区间内的比例(bl),至少为(1-1/k2)。,Chebishev定理适用于任何形状的次数分布资料,但此区间是一个比较保守的估计值。,2.经验法则:,当资料分布呈对称形状时,有:,(1)约有68%的观测值落于 的区间内;,(2)约有95%的观测值落于 的区间内;,(3)约有97%的观测值落于 的区间内;,第41页/共58页,第四十二页,共59页。,五、相对(xingdu)离中趋势变异系数,定义:变异系数(xsh)又称离散系数(xsh),是标准差与均值的比值。(Coefficient of Variation),公式:,对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,用于对不同组别数据离散程度的比较,第42页/共58页,第四十三页,共59页。,例:甲乙两车间(chjin)工人日产量的均值分别为58件和65件,标准差分别为10件和13件,试计算其变异系数。,故甲车间(chjin)工人平均日产量的代表性大,工人技术熟练程度较均衡。,第43页/共58页,第四十四页,共59页。,哪名运动员的发挥(fhu)更稳定?,在奥运会女子10米气手枪比赛中,每个运动员首先进行每组10枪共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次,在2008年8月10日举行(jxng)的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩,如下表:,第44页/共58页,第四十五页,共59页。,最后的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅帕杰林娜以总成绩498.1环获得银牌,预赛排在第4名的格鲁吉亚(l j y)运动员妮诺萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在第3名的蒙古运动员卓格巴德拉赫蒙赫珠勒仅以479.6环的成绩名列第8名,由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。,第45页/共58页,第四十六页,共59页。,【例】评价(pngji)哪名运动员的发挥更稳定,发挥比较稳定的运动员是塞尔维亚的亚斯娜舍卡里奇和中国(zhn u)的郭文珺,发挥不稳定的运动员是蒙古的卓格巴德拉赫蒙赫珠勒和波兰的莱万多夫斯卡萨贡,第46页/共58页,第四十七页,共59页。,六、离中趋势的其它(qt)测度量,1.四分位差,四分位差是第三个四分位值与第一个四分位值之差的二分之一。用Q.D.表示。,意义:,剔除了极端值,说明50%数据分布的范围;,与中位数配合说明数据分布是否对称。,若分布对称,则Q2-Q1=Q3-Q2=(Q3-Q1)/2,若不相等,则是非对称的。,第47页/共58页,第四十八页,共59页。,2.异众比率,异众比率指非众数值的次数之和占总次数的比重,用VMo表示。,fMo 为众数值次数,N为总次数,含义:,异众比率数值越大,说明众数的代表性越低,即观测值差异(chy)较大;异众比率数值越小,说明众数的代表性越高,即观测值差异(chy)较小。,第48页/共58页,第四十九页,共59页。,3.平均差系数(xsh),第49页/共58页,第五十页,共59页。,4.3 数据(shj)的分布形状,一、偏斜度,偏斜度是对数据分布在平均数两侧的偏移(pin y)方向和偏移(pin y)程度所作的描述。,1.Pearson偏态系数,偏态系数以平均数与众数之差除以标准差来衡量偏斜程度,用SK表示。其计算公式为:,当SK=0时,呈对称分布;当SK0时,分布是右偏(正偏)的;当SK0,SK3时,表示频数分布比正态分布更集中,分布呈尖峰状态(高狭峰);,峰度系数K3,),(,K,=3),(,K,3,),第55页/共58页,第五十六页,共59页。,注意:用EXCEL计算的峰度系数经过处理使得正态分布的峰值系数为0,故结果大于0表示分布呈尖峰(jin fn)状态(高狭峰),结果小于0表示分布呈平坦峰(低阔峰)。,第56页/共58页,第五十七页,共59页。,数据(shj)的描述统计量,第57页/共58页,第五十八页,共59页。,感谢您的观看(gunkn)!,第58页/共58页,第五十九页,共59页。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服