收藏 分销(赏)

调查数据处理和分析.ppt

上传人:胜**** 文档编号:779282 上传时间:2024-03-14 格式:PPT 页数:51 大小:690KB
下载 相关 举报
调查数据处理和分析.ppt_第1页
第1页 / 共51页
调查数据处理和分析.ppt_第2页
第2页 / 共51页
调查数据处理和分析.ppt_第3页
第3页 / 共51页
调查数据处理和分析.ppt_第4页
第4页 / 共51页
调查数据处理和分析.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、工作任务五工作任务五 调查数据处理和分析调查数据处理和分析学习目标学习目标 v1.知识目标v(1)理解数据处理的涵义;v(2)了解调查数据的审查的内容、方法和基本步骤;v(3)掌握市场调查缺失数据的处理技术和方法;v(4)了解数据分析的的涵义、特点和原则;v(5)掌握数据分析的方法。v2.技能目标v(1)会调查数据的编码、录入与汇总;v(2)会运用统计表,统计图表达调查数据信息;v(3)会运用总量、相对和动态指标对调查数据进行分析;v(4)会运用集中趋势分析技术对调查数据进行分析;v(5)会运用离中趋势分析技术对调查数据进行分析。5.1数据处理数据处理5.1.1数据处理概述数据处理概述v1.数

2、据处理的含义v数据处理,又称数据资料整理,是指将调查所得的原始资料按照调查目的和调查任务的要求,运用科学的方法进行加工整理,使之条理化、系统化,并能反映调查现象总体特征的综合资料的工作过程。v2.数据处理的内容v主要有以下几个方面:对调查所得原始资料进行审查;缺失数据的处理;调查数据的排序、分类、编码、录入、汇总;将整理后的数据绘制成图表。5.1.2调查数据的审查调查数据的审查1.数据审查的内容数据审查的内容(1)数据资料的完整性(2)数据资料的准确性(3)数据资料的及时性(4)数据资料的一致性5.1.2调查数据的审查调查数据的审查2.数据资料准确性的审查方法数据资料准确性的审查方法(1)经验

3、判断,即根据已有的经验,判断数据的真实性和准确性。(3)计算审核,即根据调查项目有关指标之间存在的数量关系,检查所接受资料数据的正确性,审查过程中,主要看各个数字在计算方法和计算结果上有无错误。(2)逻辑检查,就是根据调查项目之间的内在联系和实际情况,对数据进行逻辑判断,看其是否有违背常理或者前后矛盾的地方。5.1.3有问题问卷的处置有问题问卷的处置1.无效问卷(1)回答不完全。如果一份问卷中至少有三分之一的问题没有回答,这份问卷应视为无效问卷。(2)调查对象不符合要求。如有的调查中规定某类的人员不能成为调查对象,如果问卷是由这类人员作答,就是无效问卷。(3)答案选择高度一致,即回答没有什么变

4、化。如,不管什么问题都选择第一个答案。(4)截止日期后收回的问卷,即这些问卷其回答的可靠性很低,提供的极有可能是虚假信息。虚假信息的危害非常大,甚至比缺乏信息带来的还要大,所以这些问卷要全部作废。5.1.3有问题问卷的处置有问题问卷的处置2.不满意的问卷(1)模糊不清。可能由于调查员记录的原因,把“”画在两个答案之间。(2)前后不一致或有明显错误的。如一个年龄为20岁的被访者职称是教授;一个月收入低于1 000元的被访者却拥有一处豪宅等。(3)模棱两可。要求单项选择的闭式问题却选择了多个答案。(4)不符合作答要求。比如跳答或不按要求回答。5.1.3有问题问卷的处置有问题问卷的处置3.有问题问卷

5、的处理方法(1)退回问卷重新调查(2)放弃不用(3)视为缺失数据的处理,如果不满意问卷数量所占比例较少,而且涉及的变量不是关键变量,在无法退回问卷做重新调查时,可以按缺失数据的处理方式进行处理。5.1.3缺失数据的处理缺失数据的处理1.推理插补推理插补,是对缺失或不一致的数据通过推断来确定。这种推理一般是根据数据资料中其他回答项的数据推理得来的。例如,一个三项数值的和是100,其中的两项分别是30和40,剩下的一项数值可以推算出是30。其数据间的逻辑关系是,第三项数值是三项数值之和与已知两项数值之差。5.1.3缺失数据的处理缺失数据的处理2.均值插补均值插补,是对缺失或不一致的数据用数列的均值

6、来代替的插补方法。(1)当原数列没有明显升降趋势和季节波动时,用整个数列的平均值插补缺项。(2)当原数列各期增(减)量大体相同时,可以用前期数据加平均增(减)量来插补缺项。5.1.3缺失数据的处理缺失数据的处理2.均值插补均值插补,是对缺失或不一致的数据用数列的均值来代替的插补方法。(1)当原数列没有明显升降趋势和季节波动时,用整个数列的平均值插补缺项(2)当原数列各期增(减)量大体相同时,可以用前期数据加平均增(减)量来插补缺项。5.1.3缺失数据的处理缺失数据的处理3.比例插补,是根据事物之间的比例关系推算所缺数据的插补方法。4.热平台插补热平台插补是使用相似类型被调查者的已有记录的信息(

7、供者)来代替一个缺失的或的或不一致的数据(受者)。热平台插补有序贯热平台插补和随机热平台插补两种基本类型。5.1.4调查数据资料的排序调查数据资料的排序调查数据资料的排序是指把收集到的数据资料按照某一数量标志或指标数值的大小顺序重新排列。一般来说,录入数据清单的数据资料是无序的,不能反映现象的本质和规律性,为了使用方便,通常要将收集到的所有数据资料进行排序。5.1.5 数据资料的分类(分组)审核后的数据资料只有进行分类(分组)和汇总,才能为市场分析提供系统化和条理化的综合指标数据,这也是保证数据资料客观准确的重要条件。1、分组的类型1)按品质标志分组2)按数量标志分组3)简单分组4)复合分组5

8、.1.5 数据资料的分类(分组)2、分组(分类)的步骤v第一,选择恰当的分组标志v第二,确定分组形式v第三,确定组距和组数v第四,确定组限与组中值组距=组中值=缺下限的开口组组中值=缺上限的开口组组中值=5.1.6调查数据的编码、录入调查数据的编码、录入1.调查数据的编码(1)编码的含义利用计算机对调查资料进行加工整理时,需要对调查项目进行编码,以保证计算机对录入信息的高效处理。所谓编码,就是将调查表中的各个项目进行编号,将其所承载的信息转化为符号或数字代码,通过计算机语言对调查资料进行进行分类汇总和统计分析。5.1.6调查数据的编码、录入调查数据的编码、录入(2)编码的作用v1)减少数据录入

9、和分析的工作量,节省费用和时间,提高工作效率。v2)将定性数据转化为定量数据,把整个问卷的信息转化为规范标准的数据库,进而可以利用统计软件,采用统计分析方法进行定量分析。v3)减少误差。量化的数据简单易懂,不像文字资料容易丢失重要信息,在编码过程中,还可以利用编码修正回答误差,替代缺失值,因此编码有助于减少调查误差。5.1.6调查数据的编码、录入调查数据的编码、录入(3)几种常见的编码方法v对甄别条件的设定、甄别质量的控制和主持人的主持水平要求高;v所取得的信息是方向性的,不易精确地进行定量分析,不能将结论推及总体;v有些涉及隐私、保密等问题,不容易当众询问;v由于受时间的限制,需在有限时间内

10、完成规定的内容,容易造成无法深入讨论。5.1.6调查数据的编码、录入调查数据的编码、录入1)顺序编码法顺序编码法又称系列编码法,是指用一个标准对信息资料进行分类,并按照一定的顺序用连续的数据或字母进行编码的方式。例如,一项对家庭年收入的调查项目,把不同年收入的家庭划分为以下五个档次。20000元及以下 (1)2000040000元 (2)4000060000元 (3)6000080000元 (4)80000元及以上 (5)5.1.6调查数据的编码、录入调查数据的编码、录入2)分组编码法分组编码法又称区间编码法,是根据调查事物的特性和信息资料分类及其处理的要求,将具有一定位数的代码单元分成若干个

11、组,每一个组的数字均代表一定的意义。分组编码法编码简单,便于计算机处理,但位数过多,容易造成系统维护上的困难。5.1.6调查数据的编码、录入调查数据的编码、录入个人基本情况的个人基本情况的调查调查性别居住地家庭人口数月收入水平回答编码回答编码回答编码回答编码 男 1大城市 1单身 13000元以下 1 女 2中小城市 2两人 230006000元 2县镇 3三口之家 360009000元 3农村 4四人及以上 4900012000元 412000元以上 5若某被调查者的信息是:女性,居住地某大城市,单身,月收入30006000元,信息码是2112。5.1.6调查数据的编码、录入调查数据的编码、

12、录入3)信息组码编码法信息组码编码法,是指把调查信息资料区分成一定的组,每个组给予一定的组码进行编码的方法。某地市场商品价格变动情况的调查,调查组码分类如下:级别名称码百货组0125食品组2650服装组5170家电组7180其他组811005.1.6调查数据的编码、录入调查数据的编码、录入4)表意式文字编码法表意式文字编码法,又称助记编码法,是用数字、文字、符号等表明编码对象的属性,并依此方式进行信息资料编码的方法。例如,用210BXJ表示容量为210升的进口电冰箱,其中210为暗箱容量,BX表示冰箱,J表示进口。这种编码方法表现直观,易于理解,便于记忆。5.1.6调查数据的编码、录入调查数据

13、的编码、录入2.调查数据的录入调查数据的录入(1)数据录入的含义v数据录入,是将经过编码的数据资料输入到计算机存储设备中的过程。市场调查发达的国家在数据采集中常常采用计算机辅助电话调查(CATI)、计算机辅助面访(CAPI)等调查方式,计算机录入工作在调查访问时就完成了。5.1.6调查数据的编码、录入调查数据的编码、录入(2)数据录入质量的检查v1)数据库软件自动检查法v通过数据库结构的编辑,可以对录入的过程进行逻辑检查,避免数据录入过程中出现某种类型的逻辑错误。v2)重复输入数据v重复输入数据的核查方式主要有双机录入或三机录入。双机录入,是指将同一份问卷,分别由两个录入人员在计算机上进行两次

14、录入,将两次录入的结果逐一进行比较,相同的部分被认定为没有错误,不同部分立即检查问卷进行核对,及时修正错误;5.1.6数据资料的显示数据资料的显示1.统计表统计表(1)统计表的结构统计表从结构形式上看,一般由表号、总标题、横行标题、纵栏标题和数字资料等几个部分组成。(2)统计表的种类统计表根据制表的方式不同,可分为简单表和交叉表。5.1.6数据资料的显示数据资料的显示2.统计图统计图(1)条形图 5.1.6数据资料的显示数据资料的显示(2)折线图 5.1.6数据资料的显示数据资料的显示(3)圆形图 5.2调查数据的分析调查数据的分析 1.数据分析的的涵义调查数据分析,是根据研究的目的和要求,运

15、用科学的方法和手段,对调查数据进行定性和定量分析,揭示现象的本质和规律,为决策和管理提供咨询服务的过程。数据分析所采用的主要是一些统计分析技术。5.2调查数据的分析调查数据的分析 2.调查数据分析的特点(1)数据分析过程要定性分析和定量分析相结合(2)数据的定量分析以统计分析方法为主(3)数据分析不能孤立于被调查研究的现象独立地进行(4)数据分析过程是一次认识上的质的飞跃5.2调查数据的分析调查数据的分析3.调查数据分析的基本原则(1)科学性原则是指在数据分析中,应该根据调查数据的属性和特点、调查数据的来源渠道、调查研究的任务和目的,选择科学合理的分析方法进行分析。(2)客观性原则是指在数据分

16、析中,必须遵守实事求是原则,充分了解研究对象的各种实际情况,尊重调查数据事实,保证分析结果的公正与客观。(3)目的性原则是指数据分析必须围绕调查研究的任务和目的来进行,其分析的结果必须能够满足调查研究的需要。(4)系统性原则是指数据分析要将所研究的现象进行分解,然后对各种复杂的联系进行分析和综合。5.2.2总量指标分析总量指标分析总量指标的计算方法有直接计算法、推算与估算法。(1)直接计量法是指对研究的现象进行直接读数、点数或测量后,将总量数值计算出来的方法。(2)推算与估算法1)因素关系推算法。因素关系推算法是指利用社会经济现象的各个影响因素之间的关系,根据已知因素来推算未知因素的方法。2)

17、比例关系推算法。比例关系推算法是指利用各种相关现象的比例关系进行推算的一种方法。3)平稳关系推算法。平稳关系推算法是指利用各种平稳关系来推算未知指标的方法。5.2.3 相对指标分析相对指标分析(1)结构相对指标 结构相对指标是在对总体进行分组的基础上,各组数值与总体数值对比得到的相对数。用来反映社会经济现象总体内部的构成情况,说明总体内各部分在总体中的地位。结构相对指标通常用百分数表示,其计算公式为:总体的全部数值总体各部分(各组)数值结构相对指标=100%5.2.3 相对指标分析相对指标分析(2)比例相对指标比例相对指标又称比例相对数,是在同一时间内同一经济现象的总体内部不同部分指标数值之间

18、的比例关系,用来表示总体内部各组成部分的构成比例。比例相对指标可用百分数或系数来表示,也可用1:m:n的连比形式表示,其计算公式为:总体中另一部分(组)数值总体中某一部分(组)数值比例相对指标=5.2.3 相对指标分析相对指标分析(3)比较相对指标比较相对指标是把同一时间内同类经济现象的指标在不同空间状态下的数值对比构成的相对指标。它可以反映同类事物在不同国家、不同地区或不同单位之间的差异程度,一般用百分数、系数或倍数表示。计算公式为:另一地区(单位)的同类指标数值某一地区(单位)的某类指标数值比较相对指标=5.2.3 相对指标分析相对指标分析(4)强度相对指标。强度相对指标是由两个性质不同但

19、又有联系的总量指标进行对比的比值,用来反映社会现象之强度、密度、普及程度。其计算公式为:5.2.4 动态指标分析动态指标分析 2004 200420082008年我国城年我国城镇镇人均人均纯纯收入收入年 份2004年2005年2006年2007年2008年人均纯收入(元)942210493117591378615781环比发展速度(%)111.4112.1117.2114.5定基发展速度(%)100111.4124.8146.3167.5环比增长速度(%)11.412.117.214.5定基增长速度(%)11.424.846.367.5增长1%绝对值(元)94.2104.9117.6137.9

20、5.2.5 数据的集中趋势分析数据的集中趋势分析(1)众数。众数是总体中各单位在某一标志上出现次数最多的变量值。大学生每周上网次数的大学生每周上网次数的调查调查表表上网次数被访问者一次18二次20三次21四次33五次15六次13七次10合 计1305.2.5 数据的集中趋势分析数据的集中趋势分析(2)中位数。中位数是将总体各单位的变量值按大小顺序排列,处于中间位置的那个变量值。5.2.5 数据的集中趋势分析数据的集中趋势分析案例案例5-13 某项对消费者每月去大型超市购物次数的调查,20个被调查者每月去大型超市的次数按顺序排列是:0,1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,

21、5,5,6,7,则中位数是多少?解:这说明中位数的位置在第10位和第11位中间,因此,中位数应是第10个数与第11个数的算术平均数。即等于35.2.5 数据的集中趋势分析数据的集中趋势分析(3)算术平均数 1)简单算术平均数,是在未分组的资料条件下计算简单算术平均数,其公式为:5.2.5 数据的集中趋势分析数据的集中趋势分析2)加权算术平均数,在资料已分组并得出次数分布资料时,要计算加权算术平均数,其公式为:5.2.5 数据的集中趋势分析数据的集中趋势分析 2010 2010年某院校大学生生活年某院校大学生生活费费用支出情况用支出情况学生人数组中值生活费用支出 元 人数乘组中值 500以下29

22、40011 600 5007007760046 200 7009002780021 600 9001100以上24100024 0001100以上13120015 600合 计170119 000 5.2.6 数据的离中趋势分析数据的离中趋势分析(1)极差极差是数据中最变量大值和最变量小值之差。其基本公式为:极差=最变量大值最变量小值案例案例5-16 某高校有8位学生,他们每月的生活费支出分别是:500、550、600、650、700、750、800、850元则他们生活费支出的极差:极差=850500=350(元)极差受最变量大值和最变量小值的影响,如果因特殊原因出现特别大或特别小的数值,极差

23、就不能确切反映各数据真实的变异程度。5.2.6 数据的离中趋势分析数据的离中趋势分析(2)平均差平均差,即平均离差。它是将各变量值与平均数离差绝对值的总和除以离差的项数。计算公式分为简单和加权两种。1)对于未分组资料,采用简单式计算,其公式为:5.2.6 数据的离中趋势分析数据的离中趋势分析2)对于分组资料,采用加权式计算,其公式为:为各组单位数(次数)。5.2.6 数据的离中趋势分析数据的离中趋势分析20102010年某院校大学生生活年某院校大学生生活费费用支出情况用支出情况生活费用支出 元 500以下294003008700500700776001007700700900278001002

24、7009001100以上24100030072001100以上1312005006500合 计17032800生活费用支出 元 500以下2940030087005007007760010077007009002780010027009001100以上24100030072001100以上1312005006500合 计170328005.2.6 数据的离中趋势分析数据的离中趋势分析(3)平均差系数平均差系数是将平均差除以相应的平均指标得到的数值。计算公式为:平均差系数=%5.2.6 数据的离中趋势分析数据的离中趋势分析(4)均方差(标准差)1)对于未分组资料,采用简单式计算,其公式为:2)对于分组资料,采用加权式计算,其公式为:式中,表示标准差。5.2.6 数据的离中趋势分析数据的离中趋势分析(5)均方差系数均方差系数是均方差与相应的平均数对比而得出的相对数值。其计算公式为:式中,表示均方差系数5.2.6 数据的离中趋势分析数据的离中趋势分析标标准差系数准差系数计计算表算表甲组70144乙组15707甲组:乙组:

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
百度文库年卡

猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服