1、单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,201916 Sunday,模块四数据特征的描述2,#,模块四数据特征的描述,任务,1,总量与相对量的测度,任务,2,集中趋势的测度,任务,3,离散程度的测度,模块四数据特征的描述2,模块四数据特征的描述2,知识目标,掌握总量指标的含义、种类和计量方法,掌握相对指标的含义、种类和计量方法,能力目标,能够正确运用总量指标与相对指标对研究对象进行描述,能够对常用相对指标进行计算,模块四数据特征的描述2,任务引入,我国,2016,年和,2017,年的国内生产总值及三次产业增加值资料见表。,我国,2016,年和,2017,年的
2、,GDP,资料 单位:万亿元,模块四数据特征的描述2,要求:,(1),判断表中指标类型。,(2),计算动态相对指标,反映,2016,年到,2017,年,GDP,总量及三次产业增加值的变化。,(3),分别用结构相对指标和比例相对指标反映,2016,年和,2017,年我国,GDP,的内部结构。,模块四数据特征的描述2,任务分析,对调查数据整理后,通过统计表或统计图的展示还不够,总体数据特征的描述还需要使用相应的综合指标来完成。这些综合指标有总量指标、相对指标和平均指标三种类型。本任务的目的是引导大家认识总量指标和相对指标,并掌握这两类指标的计算方法。,模块四数据特征的描述2,相关知识,一、总量指标
3、,1.,总量指标的含义,总量指标是描述社会经济现象总规模、总水平的指标,一般以绝对数的形式存在,又叫绝对数。总量指标是认识现象数量特征的起点指标,也是计算其他形式指标的基础。,模块四数据特征的描述2,2.,总量指标的计量单位,总量指标计量单位有实物单位、价值单位、劳动单位三类。,实物单位反映了事物的自然属性和特征,具体的表现形式有自然单位、度量衡单位、标准实物单位、复合单位等。,价值单位即货币计量单位,如元、万元、亿元等,以价值单位计算的价值量指标可以反映某一类或若干类事物价值量的总规模,如,GDP,总量、商品销售额、工资总额等。,劳动单位一般在生产性企业使用,是制定劳动定额或统计产出的一种计
4、量工具,如工日、工时等。,模块四数据特征的描述2,3.,总量指标的种类,总量指标通常是简单加总的结果,求和符号为“”。,总量指标的种类,模块四数据特征的描述2,时期总量反映现象在一定时间范围内发展变化的总规模,又称流量。,时点总量反映现象在某一时点或瞬间状态上的总规模,又称存量。,总体单位总量是一项调查中调查单位的总数量。,总体标志总量是总体各单位某一标志的总和。,模块四数据特征的描述2,二、相对指标,1.,相对指标的含义,对比分析通常有两种方法:一是差额比较法,二是相对程度比较法。,相对指标是两个有相互联系的指标的对比,用以反映现象之间的对比关系,又称相对数。其计算公式为:,。,模块四数据特
5、征的描述2,2.,相对指标的计量,相对指标的计量形式有有名数和无名数两种。,有名数一般表现为复名数的形式,如人,/,平方公里、元,/,人、千克,/,人等,表现现象的强度、密度和普遍程度等。,无名数是一种抽象化的数值,如系数、倍数、成数、百分数和千分数等。,模块四数据特征的描述2,3.,相对指标的种类及计量方法,(1),计划完成程度相对指标,计算公式如下:,相对指标的种类,模块四数据特征的描述2,1),短期计划检查是将按月度、季度或年度统计的实际完成数与计划任务数进行对比。,计划数是绝对数时,可将实际完成数与计划任务数直接对比计算计划完成程度。,计划数是相对数时,需要用实际完成百分比与计划完成百
6、分比进行对比来计算计划完成程度。,计划完成程度检查的类型,模块四数据特征的描述2,2),中、长期计划检查是对,5,年或,5,年以上计划任务的检查。,中、长期计划的检查有水平法和累计法两种方法。,水平法适合于只规定计划期末要达到某种水平的现象。计算公式为:,累计法适合于规定计划期全期累计应达到某个规模的现象。计算公式如下:,模块四数据特征的描述2,(2),结构相对指标,结构相对指标是总体中的一部分数值与总体全部数值对比的结果,以反映总体内部的构成情况一般用百分数表示,各部分占总体的比重之和应等于,100%,。计算公式如下:,模块四数据特征的描述2,(3),比例相对指标,比例相对指标是总体中某一部
7、分数值与另一部分数值对比的结果,反映总体中各部分数值之间的对比关系。计算公式如下:,(4),比较相对指标,比较相对指标是在同一时间不同空间条件下同类指标数值对比的结果。计算公式如下:,模块四数据特征的描述2,(5),强度相对指标,强度相对指标是两个性质不同但又有密切联系的两个总量指标对比的结果,强度相对指标反映现象的强度、密度和普遍程度。计算公式如下:,(6),动态相对指标,动态相对指标是某一指标在不同时间上的数值对比,反映现象的动态变化。计算公式如下:,模块四数据特征的描述2,任务实施,1.,判断指标类型,2.,计算动态相对指标,3.,计算结构相对指标,4.,计算比例相对指标,模块四数据特征
8、的描述2,知识目标,了解集中趋势的含义,掌握算术平均数的应用条件及计算方法,掌握众数和中位数的应用条件及确定方法,掌握几何平均数的应用条件及计算方法,能力目标,能够使用,Excel,中的统计函数计算算术平均数、众数、中位数、几何平均数,能够根据所学知识选择合适的集中趋势代表值反应现象的一般水平,模块四数据特征的描述2,任务引入,某学校,136,名学生月消费支出额的原始数据见表。,要求:选择合适的方法计算,136,名学生月消费支出的平均水平。,模块四数据特征的描述2,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,任务分析,数据整理后形成的频数分布表及统计图形只是数据描述的初步
9、。对数据分布的特征更加准确的描述,则需要更精确的统计方法,这就是集中趋势的测度方法和离散趋势的测度方法。本任务的主要目的是引导大家学习数据集中趋势的测度方法。,模块四数据特征的描述2,相关知识,一、集中趋势及其度量方法,集中趋势是一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中心点所在的位置。,在选择测度数据集中趋势的方法时,一是要考虑数据的类型,二是要考虑数据的分布特征。,模块四数据特征的描述2,集中趋势的测度方法,模块四数据特征的描述2,模块四数据特征的描述2,2.,加权算术平均数,加权算术平均数是对已分组的数据资料计算平均数的形式。计算公式如下:,当权数为比重或频率形式 时,计算平
10、均数的公式为:,模块四数据特征的描述2,(1),由单项式数列计算加权算术平均数,(2),由组距式数列计算加权算术平均数,(3),加权算术平均数的权数,(4),平均数的两个数学性质,性质之一:各变量值与其算术平均数离差之和等于零,即,性质之二:各变量值与其算术平均数离差平方和最小,即,最小值。,模块四数据特征的描述2,三、众数,众数是一组数据中出现频率最高的数值,用“,M,o,”,表示。,众数示意图,a),单众数,b),双众数,c),无众数,模块四数据特征的描述2,对于大部分数值型数据,将原始数据整理成组距式频数分布表后,计算众数需要使用下列公式推算:,下限公式:,上限公式:,式中,,L,是众数
11、所在组的下限,,U,是众数所在组的上限,,1,是众数所在组的次数与前一组次数之差,,2,是众数所在组的次数与后一组次数之差,,i,是众数所在组的组距。,模块四数据特征的描述2,四、中位数,中位数是一组数据按大小顺序排列后,处于中间位置上的数据,用“,M,e,”,表示。,1.,根据未分组的数据确定中位数,首先要对数据进行排序,然后确定中位数所在位置,最后确定中位数的具体数值。中点位置是,(,n,为变量值的个数,),,该位置上的变量值就是中位数。,模块四数据特征的描述2,若是偶数项,数据就没有明确的居中观测值。,中位数示意图,a),奇数项,b),偶数项,模块四数据特征的描述2,2.,根据单项式分组
12、数列确定中位数,计算步骤为:,(1),计算累积频数,(,向上累积或向下累积,),。,(2),确定中位数所在组:首先包含,的累积频数所在组就是中位数所在组。,(3),中位数所在组的变量值即为中位数。,模块四数据特征的描述2,3.,根据组距式分组数列计算中位数,计算步骤为:,(1),计算累积频数,(,向上累积或向下累积,),。,(2),确定中位数所在组:首先包含,的累积频数所在组就是中位数所在组。,模块四数据特征的描述2,(3),根据上限公式或下限公式推算中位数。,下限公式,(,采用“向上累积”,),:,上限公式,(,采用“向下累积”,),:,式中,,f,m,是中位数所在组的次数,,S,m-1,是
13、向上累积时中位数所在组前一组的累积频数,,S,m+1,是向下累积时中位数所在组前一组的累积频数。,模块四数据特征的描述2,五、算术平均数、众数、中位数的关系,算术平均数、众数、中位数是反映数据分布集中趋势的三个主要测度值。,模块四数据特征的描述2,六、几何平均数,几何平均数是,n,个变量值乘积的,n,次方根,用,G,表示。几何平均数是适用于特殊数据的平均数,主要用于计算平均比率和平均速度。,算术平均数、众数、中位数的关系图,a),对称分布,b),右偏态分布,c),左偏态分布,模块四数据特征的描述2,1.,简单几何平均数,适用于未分组数据,其计算公式可以表示为:,式中,,x,1,、,x,2,、,
14、、,x,n,为,n,个变量值,,n,个变量值的乘积,x,1,x,2,x,n,表示变量值的总量,乘积的,n,次方根 表示变量值的平均数,,为连乘的符号。,模块四数据特征的描述2,2.,加权几何平均数,适用于已分组数据,其计算公式可以表示为:,式中,f,1,、,f,2,、,、,f,n,为各组变量的频数,,为连乘符号。,3.,应用几何平均数应注意两点,第一,当一组数据中有一项数值为,0,或负数时就不能计算几何平均数。第二,当被平均的速度或比率的数值差别不大时,几何平均数与算术平均数的计算结果相差不大;当各速度或比率的数值差别较大时,两种平均数的计算结果差别明显,一般几何平均数小于算术平均数。,模块四
15、数据特征的描述2,任务实施,一、利用,Excel,中的函数对表的原始数据计算算术平均数、中位数、众数,1.,数据准备,模块四数据特征的描述2,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,1.,简单几何平均数,方法一:,点击函数按钮,f,x,,如图所示。,选择“统计”函数,再选择“,AVERAGE”,函数,如图所示。,鼠标移至“,Number1”,框,并选中存放原始数据的单元格区域,这里是“,A1,:,H17”,,这时,对话框底部就给出了计算结果,这里计算的平均数为,300.617 647 1,,如图所示。,方法二:,单击任一空单元格,输入“,=AVERAGE(A1,:,H
16、17)”,,按“回车”键确认,得到结果为,300.617 647 1,。,模块四数据特征的描述2,点击“函数”按钮,模块四数据特征的描述2,选择“统计”函数和“,AVERAGE”,函数,模块四数据特征的描述2,“AVERAGE”,对话框,模块四数据特征的描述2,3.,利用“,MEDIAN”,函数计算中位数,方法一:,点击函数按钮,f,x,,选择“统计”函数,再选择“,MEDIAN,”,函数,鼠标移至“,Number1,”框,并选中存放原始数据的单元格区域,这里是“,A1,:,H17,”,这时,对话框底部就给出了计算结果,这里的中位数为,305,,如图所示。,方法二:,单击任一空单元格,输入“,
17、=MEDIAN(A1,:,H17),”,按“回车”键确认,得到结果,305,。,模块四数据特征的描述2,“MEDIAN”,对话框,模块四数据特征的描述2,4.,利用“,MODE,”函数计算众数,方法一:,点击函数按钮,f,x,,选择“统计”函数,再选择“,MODE,”,函数,鼠标移至“,Number1,”框,并选中存放原始数据的单元格区域,这里是“,A1,:,H17,”,这时,对话框底部给出了计算结果,这里的众数为,320,,如图所示。,方法二:,单击任一空单元格,输入“,=MODE(A1,:,H17),”,按“回车”键确认,得到结果,320,。,模块四数据特征的描述2,“MODE”,对话框,
18、模块四数据特征的描述2,二、利用,Excel,的单元格操作对表的分组数据计算平均数、众数、中位数,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,对于组距式变量数列,首先计算各组的组中值,再进行以下操作。,1.,计算算术平均数,计算各组的支出总额,:单击,D2,单元格,输入“,=B2C2,”后,按“回车”键确认,得出第一组,6,个人的消费支出总额;按住,D2,单元格的填充柄,下拖至,D9,单元格,得到其他组的消费支出总额,如图所示。,计算总体的支出总额,:单击,D10,单元格,点击求和符号“”,选中,D2,到,D9,单元格,按“回车”键确认,可计算出,136,人的消费开支总额
19、,如图所示。,计算平均每人的月均支出额,:单击任一单元格,(,放置计算结果的单元格,),,这里是,E5,单元格,输入“,=D10/C10,”,按“回车”键确认,得到加权算术平均数计算结果,299.632,,如图所示。,模块四数据特征的描述2,加权算术平均数计算表,模块四数据特征的描述2,2.,计算中位数,对于已分组资料计算中位数没有相应的函数,采用下限公式计算,计算方法如下:,模块四数据特征的描述2,单击任一单元格,这里选中,D6,单元格,输入“,=300+(68-66)/30)50,”,点击“确认”按钮,即可计算出中位数,303.333 3,,如图所示。,中位数计算表,模块四数据特征的描述2
20、,3.,计算众数,对于已分组资料计算中位数没有相应的函数,采用下限公式计算,计算方法如下:,模块四数据特征的描述2,单击任一单元格,这里是,C6,单元格,输入“,=300+(3/(3+6)50,”,按“回车”键确认,即可计算出众数,316.666 7,,如图所示。,众数计算表,模块四数据特征的描述2,三、结果说明,1.,根据原始数据计算的结果更准确。,2.,算术平均数是,136,名学生月消费支出的合适代表值。,模块四数据特征的描述2,知识目标,了解离散程度的含义,掌握异众比率、四分位差、极差、平均差、标准差、方差、变异系数的计算方法及其适用条件,能力目标,能够使用,Excel,中的统计函数计算
21、离散指标,能够针对一组特定数据,利用离散指标并结合集中趋势测度值解释数据的特征,模块四数据特征的描述2,任务引入,选择相应的方法对模块二任务,2,中,136,名学生的月消费支出额计算离散指标,并对该组数据的离散程度进行描述。,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,任务分析,任务,2,对,136,名学生月均消费支出额的集中趋势进行了测度,计算出了月均消费支出额的代表值,代表值将每名学生每月支出的差异给抽象掉了,然而这种差异仍然是存在的,若想了解这种差异的程度,则需要另一类指标来测度,这就是离散指标。本任务的目的是学习离散程度的测度方法。,模块四数据特征的描述2,相关知
22、识,一、离散程度及其测度方法,数据的离散程度是一组数据各变量值远离其中心值的程度,也称离中趋势。,离散程度的测度方法,模块四数据特征的描述2,二、常用离散指标的计算,1.,异众比率,异众比率主要用于衡量众数对一组数据的代表程度,用非众数组的频数之和占总频数的比重表示。,模块四数据特征的描述2,2.,四分位差,四分位差的意义是,约有,50%,的数据应落在上四分位数和下四分位数之间。,四分位数及四分位差示意图,模块四数据特征的描述2,3.,极差,极差是一组数据的最大值与最小值之差,又称为全距,用“,R,”,表示。,极差是离散指标中最简单的计算方法,但它只强调了两个极端的数值,而忽视了其他的观察值。
23、,模块四数据特征的描述2,4.,平均差,平均差是各变量值与其平均数离差绝对值的平均数,用“,A.D,”,表示。,(1),简单平均差,简单平均差适用于未分组资料。计算公式为:,(2),加权平均差,加权平均差适用于已分组资料。计算公式为:,模块四数据特征的描述2,5.,方差和标准差,方差是各变量值与其算术平均数离差平方的算术平均数。标准差是方差的平方根。,标准差与平均差的意义基本相同,都表示各变量值与其算术平均数的平均离差程度,但在数学处理上有所不同。平均差是通过绝对值的方法消除离差的正负号,而标准差则是通过平方的方法消除离差的正负号,标准差在数学处理上比平均差更为合理。,模块四数据特征的描述2,
24、(1),总体的方差和标准差,根据未分组资料计算总体方差,(,2,),和标准差,(,),可以使用简单式,计算公式如下:,式中,,X,代表总体单位的变量值,,代表总体的均值,,N,代表总体单位数。,模块四数据特征的描述2,根据已分组资料计算总体方差和标准差需要使用加权式,计算公式如下:,式中,,X,代表总体分组数据中各组的组中值,,代表总体的均值,,F,代表总体分组数据中各组的频数,,F,代表各组频数之和,(,即分组条件下的总体单位数,),。,模块四数据特征的描述2,模块四数据特征的描述2,模块四数据特征的描述2,(3),经验法则,经验法则表明,当一组数据呈对称分布时:,约有,68.27%,的数据
25、在平均数加减,1,个标准差的范围内,(,1,),。,约有,95.45%,的数据在平均数加减,2,个标准差的范围内,(,2,),。,约有,99.73%,的数据在平均数加减,3,个标准差的范围内,(,3,),。,如果有数据落在,3,倍的标准差范围之外,这些数据就被称为异常值或离群点。,模块四数据特征的描述2,(4),是非变量的标准差,是非变量是指只有两种变量值表现的变量。,具有某种属性的变量值用“,1,”表示,不具有某种属性的变量值用“,0,”表示。,是非变量的标准差实际就是比例的标准差。,模块四数据特征的描述2,总体比例的标准差和方差分别是:,总体比例的标准差,总体比例的方差,样本比例的标准差和
26、方差分别是:,样本比例的标准差,样本比例的方差,模块四数据特征的描述2,6.,离散系数,离散系数是绝对数形式的离散指标与算术平均数相除的结果,用比率反映一组数据离散程度的大小,一般用百分数表示,也称为变异系数。实际中,通常用标准差与算术平均数相除,这时计算的离散系数称为标准差系数,计算公式如下:,模块四数据特征的描述2,模块四数据特征的描述2,任务实施,一、利用,Excel,对表的原始数据计算四分位差、极差、标准差、方差,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,136,名学生月消费支出额资料 单位:元,模块四数据特征的描述2,1.,数据准备,2.,使用,Excel,中
27、“数据分析”工具的“描述统计”解读数据特征,“描述统计”操作步骤,模块四数据特征的描述2,选择“描述统计”,:,单击“工具”菜单。,单击“数据分析”选项,出现“数据分析”对话框。,在“分析工具”中选择“描述统计”,单击“确定”按钮。,“描述统计”对话框设置,:,在“输入区域”输入“,A,1,:,A,136”,或选中数据所在单元格区域“,A1,:,A136”,。,“分组方式”选择“逐列”。,在“输出区域”输入任一单元格以放置输出结果,这里输入“,C,1”,或选中单元格,C1,。,在“汇总统计”和“平均数置信度,(%)”,前点击选中,如图所示。,模块四数据特征的描述2,“描述统计”对话框设置,模块
28、四数据特征的描述2,输出描述统计量,:单击“确定”按钮,显示描述统计量的计算结果,如图所示。,Excel,输出的描述统计结果,模块四数据特征的描述2,结果解释:,(1)“,平均”是数据的平均数,(2)“,标准误差”是样本平均数的抽样误差。,(3)“,中值”即中位数。,(4)“,模式”即众数。,(5)“,标准偏差”即样本的标准差。,(6)“,样本方差”就是样本标准差的平方。,(7)“,峰值”也称峰态系数,用来表明数据分布曲线的陡峭程度。,模块四数据特征的描述2,(8)“,偏斜度”也称偏态系数,用来表示一组数据的非对称性程度,即向左或向右偏斜的程度。,(9)“,区域”即极差,是最大值与最小值之差。
29、,(10)“,最小值”是全部数据中的最小者。,(11)“,最大值”是全部数据中的最大者。,(12)“,求和”是全部数据的总和。,(13)“,计数”是数据的个数。,(14)“,置信度,(,95.0%,)”,是指置信度为,95%,时的,t,分布临界值。,模块四数据特征的描述2,3.,使用,Excel,中相应的函数功能计算离散指标,(1),四分位差,方法一,:,进入“,QUARTILE,”对话框:“插入”“函数”“统计”“,QUARTILE,”函数“确定”。,“,QUARTILE,”,函数对话框设置:点击任一单元格准备存放四分位数,这里选中,I5,单元格;在“,QUARTILE”,对话框的“,Arr
30、ay,”,框中输入存放原始数据的单元格区域,这里是“,A1,:,H17,”,(,或用鼠标选中原始数据所在的单元格区域,),;在“,Quart,”框中输入“,1,”,对话框底部就给出了下四分位数,Q,L,为,239,,如图所示。,模块四数据特征的描述2,下四分位数对话框,模块四数据特征的描述2,执行重复操作:在“,Quart”,框中输入“,2,”,得到中位数,305,;在“,Quart,”框中输入“,3,”,得到上四分位数,Q,U,=367.25,。,四分位差:,Q,d,=Q,U,-Q,L,=367.25-239=128.25,模块四数据特征的描述2,方法二,:,单击任一空单元格,这里选中,I5
31、,单元格,输入“,=QUARTILE(A1,:,H17),,,1),”,按“回车”键确认,即得到下四分位数,239,,结果如图所示。,重复操作,在任一单元格输入“,=QUARTILE(A1,:,H17),,,2),”,按“回车”键确认,得到中位数,305,;输入“,=QUARTILE(A1,:,H17),,,3),”,按“回车”键确认,得到上四分位数,367.25,。,模块四数据特征的描述2,下四分位数函数计算,模块四数据特征的描述2,(2),极差,R,方法一,:,进入“,MAX,”对话框:“插入”“函数”“统计”“,MAX,”,函数“确定”。,设置“,MAX,”,对话框:鼠标移至“,Numb
32、er1,”框,再选中存放原始数据的单元格区域,这里是“,A1,:,H17,”,这时,对话框底部就给出了一组数据的最大值,这里的最大值是,510,,如图所示。,重复操作,选择“,MIN,”,函数,得到最小值,110,。,极差,R,=,最大值,-,最小值,=510-110=400,模块四数据特征的描述2,最大值“,MAX”,对话框,模块四数据特征的描述2,方法二,:单击任一空单元格,输入“,=MAX(A1,:,H17),”,按“回车”键确认,得到最大值,510,;输入“,=MIN(A1,:,H17),”,按“回车”键确认,得到最小值,110,。,模块四数据特征的描述2,(3),方差,s,2,方法一
33、,:,进入“,VAR,”对话框:“插入”“函数”“统计”“,VAR,”,函数,(,样本方差,),“确定”。,在“,VAR,”,对话框中的“,Number1,”框中,选中存放原始数据的单元格区域,这里是“,A1,:,H17,”,这时,对话框底部就给出了样本方差,7 446.786 057,,如图所示。,方法二,:单击任一空单元格,输入“,=VAR(A1,:,H17),”,按“回车”键确认,即可得到样本方差,7 446.786 057,。,模块四数据特征的描述2,样本方差“,VAR”,对话框,模块四数据特征的描述2,(4),标准差,s,方法一,:,进 入“,STDEV,”对话框:“插入”“函数”“
34、统 计”“,STDEV,”函数,(,样本标准差,)“,确定”。,在“,STDEV,”,对话框中的“,Number1,”,框,选中“,A1,:,H17,”,对话框底部就给出了样本标准差,86.294 762 63,,如图所示。,方法二,:单击任一空单元格,输入“,=STDEV(A1,:,H17),”,(,样本标准差函数,),,按“回车”键确认。或者,使用数学函数“,QURT,”对样本方差开平方,在任一单元格内输入“,=QURT(7 446.786 057),”,单击“确认”按钮,即可得到样本标准差,86.294 762 63,。,模块四数据特征的描述2,样本标准差“,STDEV”,对话框,模块四数据特征的描述2,二、利用,Excel,对分组数据计算标准差,步骤,1,:将分组资料输入,Excel,工作表,如图所示。,标准差计算表,模块四数据特征的描述2,模块四数据特征的描述2,谢 谢,Thanks,模块四数据特征的描述2,