ImageVerifierCode 换一换
格式:PPTX , 页数:47 ,大小:1.85MB ,
资源ID:5460943      下载积分:12 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5460943.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(《应用统计学》第四章.pptx)为本站上传会员【天****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

《应用统计学》第四章.pptx

1、应用统计学第四章第四章 描述性统计量描述性统计量2 目录页CONTENTS PAGE引导案例 100袋食品重量的统计资料某食品加工厂新增一条可以自动封装袋装食品的生产线。每袋食品的重量是50克,过于偏离这个标准,即被视为不合格品。为检验生产线的运转状况,质检人员随机从生产线上抽取了100袋食品,测得的重量数据如表4-1和图4-1所示。观察图4-1可知,100袋食品的重量存在差异,有的偏大一些,有的偏小一些,整体上呈现出一种离散状态;但这种离散又不是没有限度的,靠近中间的重量频数较高,偏离中间的重量则频数逐渐降低,整体上具有向中间某一确定位置集中的趋势;频数分布整体形态并不是完全对称的,而是略有

2、向右侧偏斜的倾向;从集中速度的变化上看,左侧从第二组开始速度加快,右侧从第三组开始速度加快,从而使频数分布图的形状开始变得陡峭起来。3 目录页CONTENTS PAGE4 目录页CONTENTS PAGE5 目录页CONTENTS PAGE 观察频数分布图,有助于对频数分布趋于集中的位置、离散程度的大小、分布图的对称性及集中速度变化的快慢形成粗略的判断,但远未达到精确的测定。集中位置在哪里?离散程度有多大?是否对称?偏斜了多少?集中速度变化是快还是慢?这些问题单凭肉眼观察是无法解决的,因此需要一种尺度,用以测量频数分布所表现出来的上述特征,这在数据处理活动中就形成了一系列描述性统计量的计算。6

3、 目录页CONTENTS PAGE第一节第三节第二节第四节集中趋势描述性统计量分布形态描述性统计量离散程度描述性统计量运用SPSS进行统计量描述7 目录页CONTENTS PAGE第一节集中趋势描述性统计量第三节分布形态描述性统计量第二节离散程度描述性统计量第四节运用SPSS进行统计量描述8 第四章描述性统计量第一节 集中趋势描述性统计量一、均值均值反映了同类现象在特定条件下所达到的平均水平。将数据中的全体观测值求和,再除以观测值的个数,即可得到该数据的均值,记作。其计算公式如下:式中,n代表样本量,即观测值的个数;代表第i个观测值。根据式,可计算表4-1中100袋食物重量样本数据的均值:均值

4、是用算术平均的方法,将各个观测值之间的差异抽象化,从而测定数据分布趋于集中的具体位置,同时也给出了全体观测值的一个代表性水平。实践中可能遇到各种形式的数据,计算均值时要注意根据具体情况灵活变通地加以运用。9 第四章描述性统计量第一节 集中趋势描述性统计量10 第四章描述性统计量第一节 集中趋势描述性统计量如果用 代表分组的变量值,代表各组频数,可总结出分组数据计算均值的公式如下:尽管式(4-2)是根据式(4-1)变换而来的,但它在统计计算中已经从形式上被固定下来,称为加权均值。通过观察可知:如果将式中的 看作被平均对象,则对平均的结果起着权衡轻重的作用,哪一个变量值所对应的频数大,计算结果就有

5、向其靠近的倾向。因此,频数在公式中又被称作权数。11 第四章描述性统计量第一节 集中趋势描述性统计量如果数据未被分组,则每一个被平均对象 所对应的权数 就是相等的,即都为1,此时加权均值的公式就会转换为原来的形式比较简单的均值定义公式。所以,也可以将式(4-2)看作是均值的一个代表性公式。此外,在式(4-1)中,假如被平均对象xi的变化是均匀或对称的,则公式又可进一步简化为:式(4-3)称作中距,式中的 代表最小的观测值,代表最大的观测值。式(4-1)(4-2)和(4-3)是计算均值的三种不同形式的公式,但它们所反映的内容是完全一致的。在一定条件下,三者之间可以互相转换,因此它们在实践中经常是

6、结合起来运用的。12 第四章描述性统计量第一节 集中趋势描述性统计量均值计算公式有两个重要的数学性质:第一,所有观测值与其均值的离差之和等于0,即 ;第二,所有观测值与其均值的离差平方和最小,即 最小。第一个数学性质表明,全体观测值与均值的正负离差可以相互抵消,从而使均值处于一个具有充分代表性的平衡的位置上;第二个数学性质表明,均值实现了与全体观测值之间的最佳拟合,全体观测值与任意一个不是均值的数值的离差平方和都要大于均值的离差平方和。均值的这两个数学性质从数理上说明了其作为全体观测值代表性水平的合理性,也正是由于这个原因,才使得均值成为最重要也是最常用的集中趋势描述性统计量。13 第四章描述

7、性统计量第一节 集中趋势描述性统计量二、中位数将全体观测值按照从小到大的顺序排成一列,处于中间位置的观测值就是该数据的中位数,记作。例如,9个家庭的人均月收入原始数据如表4-4所示,排序结果如表4-5所示。14 第四章描述性统计量第一节 集中趋势描述性统计量由表4-5可知,中位数为排序后的第5个观测值,即1 180元。由此可见,计算中位数的关键是确定其所在位置。当观测值个数n为奇数时,中位数的位置为 ;当观测值个数n为偶数时,可采用以下公式计算中位数:15 第四章描述性统计量第一节 集中趋势描述性统计量同理,可计算出表4-1中100袋食品重量样本数据的中位数为51克。16 第四章描述性统计量第

8、一节 集中趋势描述性统计量三、众数尽管根据同一数据所计算出来的均值、中位数和众数可能略有差异,但都不失为寻找和确定数据分布集中位置的合理方法。均值是通过计算得出的,中位数与众数则是通过寻找特定位置而确定下来的。因此,均值通常被称为计算平均数,而中位数与众数则被称为位置平均数。全体观测值都参与了均值的运算,因此,一般情况下均值要比中位数和众数具有更好的综合性。然而,均值的这一优点同时却又是它的缺点,当数据中存在偏大或偏小的极端值时,均值的计算结果也将随之偏大或偏小,这样反倒会降低其代表性。中位数与众数都是由位置确定的,因此不受极端值的影响。数据分布集中趋势明显并存在偏斜情况时,中位数与众数有时比

9、均值更具有说服力。因此,在数据处理活动中,均值、中位数和众数通常都是视具体情况而相互参照使用的。可以这样来概括:均值是全体观测值的重心,中位数是全体观测值的中心,众数是全体观测值的重点。17 第四章描述性统计量第一节 集中趋势描述性统计量四、均值、中位数和众数的比较不同观测值在样本数据中出现的次数是不尽相同的,出现次数最多的观测值就是该数据的众数,记作。例如,在表4-2所示的车间工人日产零件数的数据中,日产零件数为7件的人数最多,为50人,因此7件就是该数据的众数。需要注意的是,一个样本数据中有时可能有不止一个众数。例如,在表4-6所示的球员身高数据中,出现次数最多的观测值有两个,即178 c

10、m和188 cm,因此该数据有两个众数。另外,一个样本数据中有时可能没有众数。例如,在表4-4所示的9个家庭人均月收入的数据中,每个观测值都只出现了一次,因此该数据没有众数。因此,在实际数据处理活动中,众数一般只适用于数据规模较大且具有明显集中趋势的情况。在表4-1所示的数据中,经过清点可以确定,出现次数最多的观测值是53克,因此该数据的众数为53克。18 第四章描述性统计量第一节 集中趋势描述性统计量此外,在钟形分布下,均值、中位数和众数之间一般还具有以下比较确定的关系:对称分布下,均值=中位数=众数;左偏分布下,均值中位数众数;右偏分布下,均值中位数众数,如图4-3所示。经验表明,频数分布

11、偏斜程度较低时,三者之间的关系大体为:。19 目录页CONTENTS PAGE第一节集中趋势描述性统计量第三节分布形态描述性统计量第二节离散程度描述性统计量第四节运用SPSS进行统计量描述20 第二节 离散程度描述性统计量第四章描述性统计量一、极差、四分位差与平均差 极差(一)极差是指数据中的最大观测值与最小观测值之差,记作R。其计算公式为:(4-5)式中,和 分别代表最大观测值与最小观测值。根据式(4-5),表4-1中100袋食品重量的最小观测值为40克,最大观测值为61克,所以该数据的极差为21克。极差给出了全体观测值的最大变动范围,一般情况下,极差越大,表明频数分布的离散程度越大。极差计

12、算简便、含义直观,通常情况下也可以说明离散程度大小的问题,但极少被单独使用,这主要是因为其计算过程仅仅是基于数据中的两个特殊观测值,所以极易受极端值的影响。一旦最小观测值过小或最大观测值过大,就会出现夸大离散程度的情况。21 第二节 离散程度描述性统计量第四章描述性统计量 四分位差(二)四分位差就是数据中的上四分位数与下四分位数之差,记作。其计算公式为:(4-6)式中,和 分别代表上四分位数和下四分位数。将全体观测值按照从小到大的顺序排成一列,处于第1/4位置上的观测值就是该数据的下四分位数,处于第3/4位置上的观测值就是该数据的上四分位数。与确定中位数的方法类似,确定下四分位数位置的公式为:

13、4-7)确定上四分位数位置的公式为:(4-8)四分位差的计算122 第二节 离散程度描述性统计量第四章描述性统计量将全体观测值按照从小到大的顺序排成一列,则中位数将该数列分成数量相等的两组数。当观测值个数n为奇数时,每组有 个数,为第一组 个数的中位数,为第二组 个数的中位数;当观测值个数n为偶数时,每组有 个数,为第一组 个数的中位数,为第二组 个数的中位数。当数据量很大时,可应用Excel统计函数中的QUARTILE(array,quart)函数计算四分位数。其中,array参数用于指定要计算四分位数值的数组或数值型单元格区域;quart参数用于指定返回哪一个四分位值,其可取值为0(返回

14、最小值)、1(返回第一个四分位数,即下四分位数)、2(返回第二个四分位数,即中位数)、3(返回第三个四分位数,即上四分位数)、4(返回最大值)。依照上述说明,表4-1中100袋食品重量的下四分位数为47克,上四分位数为53.75克,因此该数据的四分位差为6.75克。四分位差的计算123 第二节 离散程度描述性统计量第四章描述性统计量四分位差给出了全体观测值中处于中间位置的50%观测值的变动范围。一般情况下,四分位差越大,表明中间50%观测值的离散程度越大,从而间接地反映出数据整体的离散程度也越大。四分位差避免了极差的缺陷,不再受最大观测值与最小观测值极端情况的影响。而且,由于中位数处于上下四分

15、位数之间,所以它能够在一定程度上说明中位数代表性的强弱。但由于四分位差也是基于数据中的两个特殊观测值而得出的,所以它与极差一样,缺乏对全体观测值离散状态的全面概括能力。四分位差的作用224 第二节 离散程度描述性统计量第四章描述性统计量 平均差(三)平均差是各个观测值与其均值离差的绝对值的均值,记作。其计算公式为:表4-1中100袋食品重量的均值为50.76克,根据式(4-9)计算100袋食品重量的平均差为:(4-9)平均差以均值作为衡量各个观测值离散程度的标准,计算出各个观测值相对于均值的离差并取绝对值,再就离差绝对值取均值,其计算结果可理解为全体观测值相对于均值的平均离散程度。与极差和四分

16、位差相比,平均差全面而完整地反映了数据整体离散程度的高低,应当说,已经算是比较完美的尺度了,但由于其计算过程中包含着取绝对值的步骤,这非常不便于进一步的数学推导,所以仍有加以改进的必要。25 第二节 离散程度描述性统计量第四章描述性统计量二、方差与标准差 样本方差与标准差(一)样本方差是各个观测值与其均值离差平方的均值,记作。其计算公式为:(4-10)根据式(4-10),计算表4-1中100袋食品重量样本数据的方差为:这一计算结果也可以理解为全体观测值相对于均值的平均离散程度。样本方差保持了平均差全面而完整的优点,又通过取离差平方的方式避免了取绝对值的过程,因而方便了今后的数学推导。26 第二

17、节 离散程度描述性统计量第四章描述性统计量如果仅仅是单纯描述样本数据的离散程度,以离差平方和 除以样本量n来计算样本方差也是合理的。但如果要以样本方差来推断总体方差,则分母必须取样本自由度。因为,数理统计的研究表明,分母为自由度 的样本方差是总体方差的无偏估计量;而分母为样本量n的样本方差则是有偏的。有关这方面的具体内容,请参见第五章参数估计。样本标准差是样本方差的平方根,记作s。其计算公式为:根据式(4-11),表4-1中100袋食品重量样本数据的标准差为:(4-11)27 第二节 离散程度描述性统计量第四章描述性统计量 总体方差与标准差(二)计算样本方差或样本标准差,有时是为了估计总体方差

18、或总体标准差。总体方差是用以描述总体数据离散程度的参数。其计算公式为:(4-12)式中,代表总体方差;代表总体均值;N代表总体容量;代表总体中的各个观测值。总体标准差是总体方差的平方根。其计算公式为:(4-13)28 第二节 离散程度描述性统计量第四章描述性统计量 准确理解方差与标准差(三)如果数据呈接近于对称的钟形分布,则有:约68%的观测值与均值的距离在1个标准差范围之内;约95%的观测值与均值的距离在2个标准差范围之内;几乎所有观测值与均值的距离在3个标准差范围之内,如图4-6所示。这一经验法则表明,可以通过生成与全体观测值的均值与标准差,反过来把握全体观测值整体。与标准差有关的一个经验

19、法则129 第二节 离散程度描述性统计量第四章描述性统计量切贝谢夫定理在更广泛的情形下,给出了均值、标准差与全体观测值之间的联系。该定理指出:在任意一组数据中,至少有()的观测值与均值的距离在z个标准差范围之内(z是任意大于1的值),如图4-7所示。切贝谢夫定理230 第二节 离散程度描述性统计量第四章描述性统计量在数据处理活动中,经常需要对不同样本数据之间的观测值大小进行比较。但由于变量性质不同,观测值之间往往是无法进行比较的。标准得分正是为适应这一需要而采取的一种数据加工方法。样本数据中某一观测值的标准得分等于该观测值与其均值之差再除以标准差,记作。其计算公式为:(4-14)标准得分的计算

20、结果给出了该观测值之间相对位置的远近,同时又消除了计算单位的限制。不同样本数据之间原本无法直接比较的观测值,可以通过计算标准得分来进行大小比较。标准得分331 第二节 离散程度描述性统计量第四章描述性统计量三、离散系数方差与标准差具有平均差的优点,且便于数学推导,因而在数据处理活动中被广泛应用。但通常情况下,它们只适用于描述单个变量数据的离散程度,如果需要描述两个不同性质变量的离散程度,方差与标准差还是有缺陷的。从计算公式看,有两个因素决定方差和标准差的计算结果:一是数据的离散程度,数据的离散程度越高,计算出来的数字结果就会越大;离散程度越低,这个数字结果就会越小。二是参与运算的全体观测值本身

21、的数值大小,观测值本身的数值越大,计算出来的数值结果就会越大;观测值本身的数值越小,这个数字结果就会越小。显然,第二个因素与离散程度的高低是无关的,因此,需要从方差和标准差中剔除第二个因素的影响,才能更精确地显示出数据离散程度本身的高低。离散系数是标准差与均值之比,记作。其计算公式为:(4-15)32 目录页CONTENTS PAGE第一节集中趋势描述性统计量第三节分布形态描述性统计量第二节离散程度描述性统计量第四节运用SPSS进行统计量描述33 第三节 分布形态描述性统计量第四章描述性统计量一、偏度偏度是衡量频数分布形态对称性的统计量,记作SK。其计算公式为:(4-16)偏度计算结果为0,表

22、明频数分布的形态是对称的;如果小于0,则表明是左偏;如果大于0,则表明是右偏。计算结果的绝对值越大,表明左偏或右偏的程度越大,特别是当计算结果的绝对值大于1时,通常被认为是高度偏态。34 第三节 分布形态描述性统计量第四章描述性统计量二、峰度峰度是衡量频数分布尖削或陡峭程度的统计量,记作KU。其计算公式为:(4-17)35 第三节 分布形态描述性统计量第四章描述性统计量分布趋于集中的速度变化较慢,分布形态比较平坦;大于0,称为尖顶峰,表明频数分布趋于集中的速度变化较快,分布形态比较尖削或陡峭,如图4-8所示。36 目录页CONTENTS PAGE第一节集中趋势描述性统计量第三节分布形态描述性统

23、计量第二节离散程度描述性统计量第四节运用SPSS进行统计量描述37 第四节 运用SPSS进行统计量描述第四章描述性统计量一、由“Ferquencies”计算描述统计量(1)打开“表4-1”对应的SPSS数据集“data4.1”。在SPSS菜单栏中选择【Analyze】【Descriptive Statistics】【Frequencies】菜单命令,系统弹出如图4-9所示的“Frequencies”对话框。38 第四节 运用SPSS进行统计量描述第四章描述性统计量(2)选择变量“食品重量spzl”,单击 按钮,将其移到“Variable(s):”列表框中。单击【Statistics】按钮,系统

24、弹出如图4-10所示的“Frequencies:Statistics”对话框。39 第四节 运用SPSS进行统计量描述第四章描述性统计量(3)在“Percentile Values”栏内选择“Quartiles”复选框;在“Central Tendency”栏内选择“Mean”“Median”“Mode”复选框,以计算集中趋势描述统计量均值、中位数和众数;在“Disperion”栏内选择“Std.deviation”“Variance”“Range”复选框,以计算集中趋势描述统计量标准差、方差和极差;在“Distribution”栏内选择“Skewness”和“Kurtosis”复选框,以计算

25、偏度和峰度。40 第四节 运用SPSS进行统计量描述第四章描述性统计量(4)单击【Continue】【OK】按钮,系统输出描述性统计量计算结果,如图4-11所示。41 第四节 运用SPSS进行统计量描述第四章描述性统计量二、由“Descriptives”计算描述统计量(1)打开“表4-1”对应的SPSS数据集“data 4.1”。在SPSS菜单栏中选择【Analyze】【Descriptive Statistics】【Descriptives】菜单命令,系统弹出如图4-12所示的“Descriptives”对话框。(2)选择变量“食品重量spzl”,单击 按钮,将其移到“Variable(s)

26、列表框中。如果需要计算各个观测值的标准得分,可选择“Save standardized values as variable”复选框,系统将在数据浏览界面输出标准得分的计算结果。单击【Options】按钮,系统弹出如图4-13所示的“Descriptives:Options”对话框。42 第四节 运用SPSS进行统计量描述第四章描述性统计量43 第四节 运用SPSS进行统计量描述第四章描述性统计量(3)在“Descriptives:Options”对话框中选择“Mean”复选框;在“Dispersion”栏内选择“Std.deviation”“Variance”“Range”复选框;在“D

27、istribution”栏内选择“Kurtosis”和“Skewness”复选框。(4)单击【Continue】【OK】按钮,系统输出描述性统计量计算结果,如图4-14所示。44 第四节 运用SPSS进行统计量描述第四章描述性统计量三、由“Explore”计算描述性统计量(1)打开“表4-1”对应的SPSS数据集“data4.1”。在SPSS菜单栏中选择【Analyze】【Descriptive Statistics】【Explore】菜单命令,系统弹出如图4-15所示的“Explore”对话框。(2)选择变量“食品重量spzl”,单击 按钮,将其移到“Dependent List:”列表框中。在“Display”栏内选择“Statistics”单选按钮,单击【Statistics.】按钮,系统弹出如图4-16所示的“Explore:Statistics”对话框。45 第四节 运用SPSS进行统计量描述第四章描述性统计量46 第四节 运用SPSS进行统计量描述第四章描述性统计量(3)在“Explore:Statistics”对话框中选择“Descriptive”复选框,单击【Continue】【OK】按钮,系统输出描述性统计量计算结果,如图4-17所示。谢谢观看

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服