收藏 分销(赏)

离散程度的测度偏度与峰度两个变量的相关关系.ppt

上传人:丰**** 文档编号:11729251 上传时间:2025-08-10 格式:PPT 页数:33 大小:997.50KB 下载积分:10 金币
下载 相关 举报
离散程度的测度偏度与峰度两个变量的相关关系.ppt_第1页
第1页 / 共33页
离散程度的测度偏度与峰度两个变量的相关关系.ppt_第2页
第2页 / 共33页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,离散程度的测度,变量取值的离散程度,反映各个变量之间的差异大小,从而反映分布中心指标对各个变量值代表性的高低,离散程度的常用测度指标,极差,四分位全距,变异系数,平均差,方差,标准差,1,极差(全距),2,3,1,4,2,数值,2,四分位全距,数据从小到大排列后,将数据分割为,4,等份的,3,个数分别称为第一、第二、第三个四分位数,12,13,15,16,17,数值,18,20,22,24,3,四分位,全距,13+15,2,20+22,2,Q2,12,13,15,16,17,数值,18,20,22,24,4,平均差,(简单,/,未分组),2,3,1,4,2,数值,1,、求算数平均数,=,2+3+1+4+2,5,=2.4,2,、构造新的数组,|,原数值,-,算数平均数,|,0.4,0.6,1.4,1.6,0.4,新数组,5,平均差,(简单,/,未分组),3,、平均差,=,新数组的算数平均值,0.4,0.6,1.4,1.6,0.4,新数组,0.4+0.6+1.4+1.6+0.4,5,6,平均差,(,加权,/,单项数列,),步骤,1,、,3,求算数平均值的方式不同,其余一样,7,标准差(根方差),1,、构造新的数组,(,原数值,-,算数平均数,),2,2,、对新数组求算数平均数,3,、再开平方根,得标准差,8,方差,方差,标准差,9,变异系数,比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差等测度指标来进行比较不合适。,我们引入变异系数可以消除测量尺度和量纲的影响,变异系数是标准差与其平均数的比,没有量纲,这样就可以进行客观比较了。因此,可以认为变异系数和极差、标准差和方差一样,都是反映数据离散程度的测度指标。其数据大小不仅受变量值离散程度的影响,而且还受变量值平均水平大小的影响。,10,变异系数,极差系数,平均差系数,标准差系数,11,偏度,变量值,频数(个),变量值,频数(个),偏度小,偏度大,12,皮尔逊偏度系数,13,皮尔逊偏度系数,14,皮尔逊偏度系数,15,鲍莱,偏度系数,鲍莱偏度系数,鲍莱,偏度系数的取值在,-1,与,1,之间。绝对值越大变量分布的偏斜程度越大,反之偏斜程度越小。,16,矩偏度系数,17,峰度及其测度,变量值,频数(个),变量值,频数(个),峰度小,峰度大,18,峰度及其测度,峰度是指次数分布曲线顶峰的尖平程度,是次数分布的又一重要特征。统计上,常以正态分布曲线为标准,来观察比较某一次数分布曲线,顶峰,尖平程度的大小。,根据变量值的集中与分散程度,峰度一般可表现为三种形态:尖顶峰度、平顶峰度和标准峰度。当变量值的次数在众数周围分布比较集中,使次数分布曲线比正态分布曲线顶峰更为隆起尖峭,称为尖顶峰度;当变量值的次数在众数周围分布较为分散,使次数分布曲线较正态分布曲线更为平缓,称为平顶峰度。可见,尖顶峰度或平顶峰度都是相对正态分布曲线的标准峰度而言的。,19,峰度及其测度,20,峰度及其测度,由统计计算分析可知,当次数分布为正态分布曲线时,,ku=3,,以此为标准就可比较分析各种次数分布曲线的峰度。当,ku3,时,表示分布曲线呈尖顶峰度,为尖顶曲线,说明变量值的次数较为密集地分布在众数的周围,,ku,值越大于,3,,分布曲线的顶端越尖峭。当,ku3,时,表示分布曲线呈平顶峰度,为平顶曲线,说明变量值的次数分布比较均匀地分散在众数的两侧,,ku,值越小于,3,,则分布曲线的顶峰就越平缓。一般当,ku,值接近于,1.8,时,分布曲线呈水平矩形分布形态,说明各组变量值的次数相同。当,ku,值小于,1.8,时,次数分布曲线趋向“,U”,型分布。实际统计分析中,通常将偏度和峰度结合起来运用,以判断变量分布是否接近于正态分布。,21,1.5,两个变量的相关关系,22,变量之间的依存关系,无论是在自然界还是社会经济领域,一种现象与另一种现象之间往往存在着依存关系,当我们用变量来反映这些现象的特征时,便表现为变量之间的依存关系。,如某种商品的销售额(,y,)与销售量(,x,)之间的关系、商品销售额(,y,)与广告费支出(,x,)之间的关系、粮食亩产量(,y,)与施肥量(,x1,)、降雨量(,x2,)、温度(,x3,)之间的关系等。,23,变量之间的依存关系,24,测度两变量相关程度的指标,1,2,3,4,5,数值,x,5,4,3,2,1,数值,y,1,、求,x,和,y,的算数平均数,均为,3,25,协方差,2,、构造新的数组,(原数值,x-x,的算数平均数),(原数值,y-y,的算术平均数),1,2,3,4,5,原数值,x,5,4,3,2,1,原数值,y,26,协方差,3,、协方差,=,新数组的算数平均值,=-2,新数值,-2,-1,0,1,2,新数值,2,1,0,-1,-2,27,协方差,1,2,3,4,5,数值,x,2,3,4,5,6,数值,y,协方差,=2,28,协方差,数组序号,变量值,数组序号,变量值,协方差,=,-2,此消彼长,协方差,=,2,共同进步,x,y,x,y,29,相关系数,正的协方差表达了正相关性,负的协方差表达了负相关性。对于同样的两个随机变量来说,计算出的协方差越大,相关性越强。,考虑如下问题,若身高和体重的协方差为,30,,这究竟是多大的一个量呢?若身高与鞋号的协方差为,5,,是否说明,相对于鞋号,身高与体重的的相关性更强呢?,这样横向对比超出了协方差的能力范围。考虑另一种情况,依然是计算身高与体重的协方差。数据完全不变,而只更改单位。我们的体重用克而不是千克做单位,计算出的协防差是原来数值的,1000,倍!,30,相关系数,x,和,y,的协方差,为了能进行这样的横向对比,我们需要用统一的方式来定量变量之间的相关的紧密程度。这时,我们引入相关系数。相关系数是“归一化”的协方差,x,和,y,的相关系数,31,相关系数,x,和,y,的相关系数,x,的标准差,x,和,y,的协方差,y,的标准差,32,相关系数,33,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服