收藏 分销(赏)

调查数据的分析.pptx

上传人:w****g 文档编号:4809504 上传时间:2024-10-13 格式:PPTX 页数:79 大小:510.27KB 下载积分:16 金币
下载 相关 举报
调查数据的分析.pptx_第1页
第1页 / 共79页
调查数据的分析.pptx_第2页
第2页 / 共79页


点击查看更多>>
资源描述
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析第一节第一节 数据集中趋势的测度数据集中趋势的测度一、均值一、均值二、中位数二、中位数三、众数三、众数一、均值 (mean)1、集中趋势的最常用测度值 2、易受极端值的影响 3、用于数值型数据,不能用于分类数据和顺序数据(一)简单均值(simple mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n,则(二)加权均值(weighted mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xk k相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k,则加权均值例题1按年龄分组按年龄分组(岁)(岁)xi人数人数fiXifi1815270193362720122402110210合计合计 701347加权均值例题2l 二、中位数(median)1、将数据排序后处于中间位置上的值。MMe e50%50%2、不受极端值的影响 3、可以用于顺序数据和数值型数据,但不能用于分类数据未分组数值型数据的中位数【例例】9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9中位数中位数 1080分组数据中位数的确定分组数据中位数的确定 首先确定中位数首先确定中位数组,然后用下列组,然后用下列公式计算公式计算:或或或或三、众数(mode)1、一组数据中出现次数最多的变量值2、不受极端值的影响3、一组数据可能没有众数或有几个众数众数的计算公式下限公式:下限公式:四、众数、中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值众数、中位数、均值的特点和应用1、众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2、中位数不受极端值影响数据分布偏斜程度较大时应用3、均值易受极端值影响数据对称分布或接近对称分布时应用第二节第二节 数据离散程度的测度数据离散程度的测度一、极差一、极差二、异众比率二、异众比率三、平均差三、平均差四、方差和标准差四、方差和标准差五、标准差系数五、标准差系数一、极差(range)1、一组数据的最大值与最小值之差 计算公式为:R=max(xi)-min(xi)2、离散程度的最简单测度值3、易受极端值影响 例题l1450 1500 1550 1600 1650 1700 1750 l 900 1200 1400 1600 1800 2000 2300 两组数据的平均数均为1600,但极差差别较大,因此,第一组数据的差异程度较小,平均数代表性比第二组大。二、异众比率异众比率:非众数组次数与总次数之比。用来衡量众数的代表性。三、平均差v各变量值与其均值离差绝对值的算术平均数。v反映了各变量值与均值的平均差异。v计算公式为:未分组数据:分组数据:四、方差和标准差v标准差:各变量值与其均值离差平方的算术平均数的平方根。1、最常用的测度值。2、反映了各变量值与均值的平均差异。标准差的计算例题1(未分组数据)已知以下数据:900 1200 1400 1600 1800 2000 2300要求:计算该组数据的标准差。例题2(分组数据)l某班学生年龄分布情况如下:年龄人数频率(%)18 19 20 213013 6 1602612 2合计50100计算过程如下例题3(分组数据)工资(元)人数频率(%)1000-200030302000-300042423000-400020204000以上 8 8合计100100计算过程表格工资(元)人数频率(%)1000-200030 30337080003370802000-300042 4215120015123000-400020 20176720001767204000以上 8 830108800301088合计100 10081640000816400计算过程:五、标准差系数标准差系数:标准差与其相应的均值之比。标准差系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例例例例 】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据如表。试比较产品销售额与销售利润的离散程度。据如表。试比较产品销售额与销售利润的离散程度。标准差系数(例题分析)结结论论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度。v v1 1=536.25536.25309.19309.19=0.5770.577v v2 2=32.521532.521523.0923.09=0.7100.710第三节第三节 动态数据的分析动态数据的分析 一、一、水平水平分析指标分析指标 二、二、速度分析速度分析指标指标 三、三、长期趋势的分析长期趋势的分析一、一、水平分析指标水平分析指标 (一)发展水平(一)发展水平(二)平均发展水平(二)平均发展水平(三)增长量(三)增长量(四)平均增长量(四)平均增长量(一)发展水平(一)发展水平l现象在不同时间上的观察值。说明现象在某一时间上所达到的水平。l按照发展水平在序列中的位置可分为最初水平、最末水平和中间水平。l按照研究目的分为基期水平和报告期水平(计算期水平)。(二)(二)平均发展水平平均发展水平 1、概念:、概念:也称为序时平均数,是对不同时间也称为序时平均数,是对不同时间发展水平求平均数。发展水平求平均数。2 2、序时平均数的计算序时平均数的计算(1)绝对数时间数列的序时平均数)绝对数时间数列的序时平均数 时期数列的序时平均数时期数列的序时平均数2 2、序、序时平均数的计算时平均数的计算时点数列的序时平均数时点数列的序时平均数连续变动的连续时点数列连续变动的连续时点数列 非连续变动的连续时点数列非连续变动的连续时点数列2 2、序、序时平均数的计算时平均数的计算l间隔相等的间断时点资料间隔相等的间断时点资料2 2、序、序时平均数的计算时平均数的计算 l间隔不等的间断时点资料间隔不等的间断时点资料2 2、序、序时平均数的计算时平均数的计算(2 2)相对数或平均数时间序列的序时平均数)相对数或平均数时间序列的序时平均数(三)增长量 1 1、概念:报告期水平与基期水平之差,说明、概念:报告期水平与基期水平之差,说明现象在现象在一定一定时期内增长的绝对数量。时期内增长的绝对数量。2、分类分类:逐期增长量:逐期增长量:报告期水平与报告期水平与前期前期水平之差水平之差累计累计增长量:报告期水平与固定时期水平之增长量:报告期水平与固定时期水平之差差 设时间数列中各期设时间数列中各期设时间数列中各期设时间数列中各期发展水平为:发展水平为:发展水平为:发展水平为:逐期增长量逐期增长量累计增长量累计增长量二者的关系:二者的关系:(四)平均增长量l观察期内各逐期增长量的平均数,描述现观察期内各逐期增长量的平均数,描述现象在一定时期内平均每期增长的数量。象在一定时期内平均每期增长的数量。l计算公式为计算公式为二、速度分析指标二、速度分析指标 (一)发展速度一)发展速度 (二)增长速度(二)增长速度 (三)平均发展速度和平均增长速度(三)平均发展速度和平均增长速度 (四)增长(四)增长1%的绝对值的绝对值(一)发展速度(一)发展速度1 1、概念:报告期水平与基期水平之比,说、概念:报告期水平与基期水平之比,说明现象在一定时期内相对的明现象在一定时期内相对的发展程度发展程度。2 2、分类、分类:环环比比发发展展速速度度:报报告告期期水水平平与与前前一一期期水水平平 的比值。的比值。定定基发展速度:报告期水平基发展速度:报告期水平与固定与固定时期时期水水平的比值。平的比值。3 3、环比发展速度与定基发展速度的关系:、环比发展速度与定基发展速度的关系:(1 1)各各环环比比发发展展速速度度的的连连乘乘积积等等于于相相应应期期的的定基定基发展速度发展速度 (2 2)两两个个相相邻邻的的定定基基发发展展速速度度,用用后后者者除除以以前者,等于相应时期的环比发展速度前者,等于相应时期的环比发展速度 (二)增长速度(二)增长速度l环比增长速度=环比发展速度1l定基增长速度=定基发展速度1(三)平均发展速度和平均增长速度(三)平均发展速度和平均增长速度1、概念:、概念:平均发展速度:各环比发展速度的平均数平均发展速度:各环比发展速度的平均数,说明现说明现象每期变动的平均程度象每期变动的平均程度。平均增长速度:说明现象逐期增长的平均程度。平均增长速度:说明现象逐期增长的平均程度。2、计算 (1 1)几何平均法(水平法)几何平均法(水平法)特点:着眼于期末水平算例基年第1年第2年第3年第4年第5年总产值(万元)270.1273.80 289.20 314.40 322.30 340.70环比发展速度(%)-101.37 101.62 108.71 102.51 105.71定基发展速度(%)-101.37 107.07 116.40 119.33 126.14某企业总产值资料:(2 2)方程式法(累计法)方程式法(累计法)算例【例】某公司2010年实现利润15万元,计划今后三年共实现利润60万元,求该公司利润应按多大速度增长才能达到目的。解:解:累计法查对表累计法查对表平均每年增平均每年增长长 各年发展水平总和为基期的各年发展水平总和为基期的 1年年2年年3年年4年年5年年14.9114.90246.92398.61572.90773.1715.0115.00247.25399.34574.24991.0415.1115.10247.58400.06575.571075.57(四)增长(四)增长1%的绝对值的绝对值 说明速度每增长一个百分点而增加的绝对量,用于弥补速度分析中的局限性。计算公式为:例:假定有两个生产条件基本相同的企业,各年的例:假定有两个生产条件基本相同的企业,各年的例:假定有两个生产条件基本相同的企业,各年的例:假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如下表:利润额及有关的速度值如下表:利润额及有关的速度值如下表:利润额及有关的速度值如下表:甲、乙两个企业的有关资料甲、乙两个企业的有关资料年年 份份甲甲 企企 业业乙乙 企企 业业利润额利润额(万元万元)增长率增长率(%)利润额利润额(万元万元)增长率增长率(%)200350006020046000208440 速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要结合基期水平进行分析。结合基期水平进行分析。甲企业甲企业甲企业甲企业20042004年增长年增长年增长年增长1%1%绝对值绝对值绝对值绝对值5005000 0/100/1005 5 0 0万元万元万元万元乙企业乙企业乙企业乙企业20042004年增长年增长年增长年增长1%1%绝对值绝对值绝对值绝对值60/10060/1000.60.6万元万元万元万元三、长期趋势的分析 (一)时距扩大法 (二)移动平均法 (三)配合趋势模型法(一)时距扩大法l 把时间序列中各期指标数值按较长的时距加以归并,形成一个新的时间序列,以消除原数列中各种偶然因素的影响,呈现出现象的长期趋势。例:某企业某年各月产值资料例:某企业某年各月产值资料(单位:万元)(单位:万元)月份123456789101112产值323247314318298347335320344326358351某企业某年各季产值资料某企业某年各季产值资料(单位:万元)(单位:万元)季度季度1234产值产值8849639991035(二)移动平均法 1、基本原理:、基本原理:消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势。2、移动平均方式:、移动平均方式:选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的 N项计算一系列序时平均数。3、移动平均法的特点、移动平均法的特点(1)对原序列有修匀或平滑的作用。时距项数N越大,对数列的修匀作用越强。(2)移动平均项数为偶数时,需移正。(3)平均时距项数N与季节变动长度一致才能消除季节变动。(4)移动平均会使原序列失去部分信息,平均项数越大,失去的信息越多。年份年份销售量(台)销售量(台)4年移动平均数年移动平均数5年移动平均数年移动平均数199419951996199719981999200020012002200320042005200620072008300600400700800600900800120010008001400130016001600562.5625687.5762.5775875962.510251112.5120013755606206807608609009401040114012401360 例:某企业商品销售量数据(三)配合趋势模型法(三)配合趋势模型法l通过数学方法对时间数列配合一个合适通过数学方法对时间数列配合一个合适的的趋势方程趋势方程,使其与原数列达到最优拟,使其与原数列达到最优拟合。合。趋势模型法的基本程序计算趋势值及预测判断趋势类型计算待定参数定性分析长期趋势类型直线趋势方程:直线趋势方程:曲线趋势方程:曲线趋势方程:一、一、相关与回归的基本问题相关与回归的基本问题 二、相关与回归分析二、相关与回归分析第四节第四节 相关与回归分析相关与回归分析 (一)变量间的关系变量间的关系 (二)相关关系的类型(二)相关关系的类型 (三)相关关系分析方法与步骤(三)相关关系分析方法与步骤一、一、相关与回归的基本问题相关与回归的基本问题l确定性的函数关系:Y=f(X)l不确定性的统计关系-相关关系相关关系 (一)变量间的关系(一)变量间的关系l按照涉及的变量多少:按照涉及的变量多少:简单相关 复相关l按照按照变量相关关系的表现形式分为变量相关关系的表现形式分为 线性相关散布图接近一条直线 非线性相关散布图接近一条曲线l按照变量相关关系变化的方向分为按照变量相关关系变化的方向分为 正相关变量同方向变化(同增同减)负相关变量反方向变化(一增一减)(二)相关关系的类型(二)相关关系的类型 1、相关关系的分析方法相关关系的分析方法 (1)相关分析)相关分析 分析变量之间相关形态及相关程度分析变量之间相关形态及相关程度 (2)回归分析)回归分析 确定变量间相关的具体数学形式确定变量间相关的具体数学形式(二)相关关系分析方法与步骤(二)相关关系分析方法与步骤 2、相关关系的分析步骤相关关系的分析步骤 1)定性分析变量之间是否存在相关关系;2)分析变量间相关的方向、形态等;3)测定相关的程度相关系数;4)拟合回归方程式,说明变量间的数学关系;5)对回归方程的拟合程度进行测定。(一)相关分析(一)相关分析 1、相关表 (1)简单相关表 (2)分组相关表二、二、相关与回归分析相关与回归分析2 2、相关图、相关图 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 不相关不相关不相关不相关不相关不相关 1、对变量之间关系密切程度的度量。2、对两个变量之间线性相关程度的度量称为简单相关系数。3 3、相关系数、相关系数简单相关系数的计算相关系数的特点u相关系数的取值在-1与1之间。u当r=0时,表明X与Y没有线性相关关系。u当 时,表明X与Y存在一定的线性相关关系:若 ,表明X与Y为正相关;若 ,表明X与Y为负相关。u 当 时,表明X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。(二)一元线性回归分析1、基本形式:2、回归系数估计:例:例:7 7家饮料公司的广告支出与销售量数据如下:家饮料公司的广告支出与销售量数据如下:要求:1)建立线性回归方程(以广告支出为自变量);2)预测当广告支出为7000万元时的销售量。例题计算
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服