资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,数值型数据:平均数,1/85,平均数,(,mean,),集中趋势最惯用测度值,一组数据均衡点所在,表达了数据必定性特征,易受极端值影响,主要用于数值型数据,2/85,平均数分类,1)、简单算术平均数,2)、加权算术平均数,3)、几何平均数,3/85,1)、简单算术平均数,定义:,它是用总体或样本变量总和除以总体或样本数据个数所计算平均数,计算公式:,4/85,例:某车间20个工人某日产量 平均数,数据:,32 41 28 41 32 45 32 61 32 28 32 41 61 32 32 61 41 28 32 28,工人平均日产量:,5/85,2)、加权算术平均数,按日产量分组(件),工人(人),28,4,32,8,41,4,45,1,61,3,累计,20,简单算术平均数大小与变量值大小相关,而加权平均数大小不但受到各组变量值大小影响,而且受各组变量值出现频率也就是权数大小影响。,6/85,加权平均数,(权数对均值影响),甲乙两组各有10名学生,他们考试成绩及其分布数据以下,甲组:,考试成绩(,x,):0 20 100,人数分布(,f,):1 1 8,乙组:,考试成绩(,x,):0 20 100,人数分布(,f,):8 1 1,7/85,平均数,(数学性质),1.,各变量值与平均数离差之和等于零,2.,各变量值与平均数离差平方和最小,8/85,几何平均数,(,geometric mean,),n,个变量值乘积,n,次方根,适合用于比率数据平均,主要用于计算平均增加率,计算公式为,5.,可看作是平均数一个变形,9/85,几何平均数,(例题分析),【例】某水泥生产企业1999年水泥产量为100万吨,与1999年相比增加率为9%,年与相比增加率为16%,20与年相比增加率为20%。求各年年平均增加率。,年平均增加率114.91%-1=14.91%,10/85,众数、中位数和平均数比较,11/85,众数、中位数和算术平均数,(1)众数、中位数和算术平均数分布关系,(2)众数、中位数和算术平均数特点,(3)众数、中位数和算术平均数应用场所,12/85,众数、中位数和算术平均数分布关系,从分布角度看,众数一直是一组数据分布最高峰值,中位数是处于组数据中间位置上值,而算术平均数则是全部数据算术平均。,13/85,众数、中位数和算术平均数特点,众数是一组数据分布峰值,是位置代表值。其特点是不受极端值影响,含有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。,中位数是一组数据中间位置上代表值,与中位数类似还有四分位数,它们也都是位置代表值,其特点是不受极端值影响。,算术平均数是就全部数据计算,它含有优良数学性质,是实际中应用最广泛集中趋势测度值。其主要特点是易受数据极端值影响,,14/85,众数、中位数和算术平均数应用场所,从当数据呈对称分布或靠近对称分布时,三个代表值相等或靠近相等,这时应选择算术平均数作为集中趋势代表值,因为算术平均数包含了全部数据信息,而且易被大多数人所了解和接收;,当数据为偏态分布,尤其是当偏斜程度较大时,我们应选择众数和中位数位置代表值,这时它们代表性要比算术平均数好。,另外,算术平均数只适合用于定量数据,而对于定性数据则无法计算算术平均数,但能够计算众数和中位数定性数据。而调和平均数和几何平均数则不一定适合定量数据,因为当一组数据中出现0或负数时,无法计算调和平均数或几何平均数。,15/85,4.2 离散程度度量,4.2.1 分类数据:异众比率,4.2.3 数值型数据:方差和标准差,4.2.4 相对位置度量:标准分数,4.2.5 相对离散程度:离散系数,16/85,离散趋势,数据分布另一个主要特征,反应各变量值远离其中心值程度(离散程度),从另一个侧面说明了集中趋势测度值代表程度,不一样类型数据有不一样离散程度测度值,17/85,分类数据:异众比率,18/85,异众比率,(,variation ratio,),1.对分类数据离散程度测度,2.非众数组频数占总频数百分比,3.计算公式为,4.用于衡量众数代表性,19/85,异众比率,(例题分析),解:,在所调查50人当中,购置其它品牌饮料人数占70%,异众比率比较大。所以,用“可口可乐”代表消费者购置饮料品牌情况,其代表性不是很好,不一样品牌饮料频数分布,饮料品牌,频数,百分比,百分比(%),可口可乐,旭日升冰茶,百事可乐,汇源果汁,露露,15,11,9,6,9,0.30,0.22,0.18,0.12,0.18,30,22,18,12,18,累计,50,1,100,20/85,数值型数据:方差和标准差,21/85,极差,(,range,),一组数据最大值与最小值之差,离散程度最简单测度值,易受极端值影响,未考虑数据分布,7,8,9,10,7,8,9,10,R,=max(,x,i,)-min(,x,i,),计算公式为,22/85,平均差,(,mean deviation,),各变量值与其平均数离差绝对值平均数,能全方面反应一组数据离散程度,计算公式为,未分组数据,23/85,例 已知A、B两组学生成绩如表所表示,试分别计算其平均差。,甲组,乙组,成绩,成绩,68,-7,7,60,-15,15,72,-3,3,72,-3,3,78,3,3,82,7,7,82,7,7,96,21,21,累计,20,46,24/85,解 A、B两组学生算术平均数采取简单算术平均数公式,易算得=75分。,则AD(A)=(分),AD(B)=(分),由以上计算可知,即使A、B两组学生平均成绩相同,但B组计算得到平均差大,则表明其平均成绩代表性要较A组差。,25/85,方差和标准差,(,variance,and,standard deviation,),数据离散程度最惯用测度值,反应了各变量值与均值平均差异,依据总体数据计算,称为总体方差或标准差;依据样本数据计算,称为样本方差或标准差,4 6 8 10 12,x,=,8.3,26/85,样本方差和标准差,(simple,variance,and,standard deviation,),未分组数据:,未分组数据:,方差计算公式,标准差计算公式,注意:,样本方差用自由度,n,-1去除!,27/85,样本方差,自由度(degree of freedom),一组数据中能够自由取值数据个数,当样本数据个数为 n 时,若样本均值x 确定后,只有n-1个数据能够自由取值,其中必有一个数据则不能自由取值,比如,样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据能够自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值,28/85,例 某车间抽取10个工人工资如表所表示,试计算标准差。,工号,工资,/,元,离差,离差平方,X,1,1280,41,1681,2,1300,61,3721,3,1120,-119,14161,4,1200,-39,1521,5,1250,11,121,6,1400,161,25921,7,1340,101,10201,8,1230,-9,81,9,1100,-139,19321,10,1170,-69,4761,累计,12390,0,81490,29/85,解:依据表所表示资料,应采取标准差公式来计算。,10名工人算术平均数和标准差为:,=1239(元),95.15(元),30/85,结论,在平均水平相等情况下,经过计算标准差,能够用来比较两个同类社会经济现象平均数代表性:标准差越大,表明标志变动程度越大,平均数代表性越弱;标准差越小,表明标志变动程度越小,平均数代表性越强。,31/85,离散系数,(,coefficient of variation,),1.标准差与其对应均值之比,2.对数据相对离散程度测度,3.消除了数据水平高低和计量单位影响,4.用于对不一样组别数据离散程度比较,5.计算公式为,32/85,变异系数实例,经过甲乙两家电器企业工人工资信息进行搜索整理后了解到:甲企业工人平均工资为1600元,标准差为230元;乙企业工人平均工资为1500元,标准差为220元。,解答:,从标准差来看,似乎甲企业标志变异程度高于乙企业,但从标志变异系数来看,乙企业标志变异程度高于甲企业,说明甲企业工人平均工资代表性要更强。,33/85,4.3 偏态与峰态度量,4.3.1 偏态及其测度,4.3.2 峰态及其测度,34/85,偏态与峰态分布形状,扁平分布,尖峰分布,偏态,峰态,左偏分布,右偏分布,与标准正态分布比较!,35/85,偏 态,36/85,偏态,(,skewness,),统计学家Pearson于1895年首次提出,数据分布偏斜程度测度,2.偏态系数,=0,为对称分布,3.偏态系数,0,为右偏分布,4.偏态系数,0,故又称正偏;,当左偏时,3时,称为高峰度;,当 3时,称为低峰度。,42/85,偏态与峰态分布形状,扁平分布,尖峰分布,偏态,峰态,左偏分布,右偏分布,与标准正态分布比较!,43/85,峰度公式,44/85,偏度与峰度实例,某企业8个销售点一年销售额(万元)分别为331,333,347,351,341,358,345和362,累计2768,求这组数据峰度和偏度。且已知方差为105,平均值为346。,45/85,偏态与峰态,(从直方图上观察),按销售量分组(台),结论,:,1.为右偏分布,2.峰态适中,140,150,210,某电脑企业销售量分布直方图,190,200,180,160,170,频,数,(天),25,20,15,10,5,30,220,230,240,46/85,第五节 调查设计,5.1 调查方案结构,5.2 调查问卷设计,47/85,调查方案结构,48/85,调查方案结构,(survey plan),调查方案内容,调,查,目,调查对象调查单位,调,查,项,目,其,他,49/85,调查目(objective of survey),1.调查要到达详细目标,回答“为何调查?”,调查之前必须明确,50/85,调查对象和调查单位,(Respondent and Survey unit),调查对象:,调查研究总体或调查范围,调查单位:,需要对之进行调查单位。能够是调查对象全部单位(全方面调查),也能够是调查对象中一部分单位(非全方面调查),回答“向谁调查?”,调查对象,调查单位,51/85,调查项目,(Survey items),调查详细内容,通常表现为表格或问卷,回答“调查什么?”,Q,1 ,Q,2 ,Q,3 ,Q,4 ,52/85,方案设计中其它问题,1.明确调查所采取方法,2.确定调查资料所属时间和调查工作期限,3.调查组织与实施细则,53/85,调查问卷设计,54/85,什么是问卷?,(questionnaires),用来搜集调查数据一个工具,调查者依据调查目标和要求所设计,由一系列问题、备选答案、说明以及码表组成一个调查形式,不一样调查问卷在详细结构、题型、措词、版式等设计上会有所不一样,但在结构上普通都由,开头部分,、,甄别部分,、,主体部分,和,背景部分,组成,55/85,问卷基本结构,问卷基本结构,开头,甄别,主体,背景,问候语,填写说明,问卷编号,56/85,开头部分,(问候语),女士/小姐/先生,您好!我是市场调查企业访问员,我们正在进行一项相关公众医疗保险意识方面调查,目标是想了解人们对医疗保险看法和意见,方便更加好地促进医疗保险事业发展。您回答无所谓对错,只要真实地反应了您情况和看法,就到达了这次调查目标。希望您能主动参加,我们对您回答完全是保密。调查要耽搁您一些时间,请您谅解。谢谢您支持与合作!,57/85,开头部分,(填写说明),填写要求:,请您在所选择答案题号上画圈,对只许选择一个答案问题只能画一个圈;对可选多个答案问题,请在你认为适当答案上画圈,需填写数字题目在留出横线上填写,对于表格中选择答案题目,在所选栏目内画勾,对注明要求您自己填写内容,请在要求地方填上您意见,58/85,开头部分,(问卷编号),用于识别问卷、调查者、被调查者姓名和地址等,便于校对检验、更正错误,问卷编号,001,59/85,甄别部分,甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要部分,然后针对特定被调查者进行调查,经过甄别,能够筛选掉与调查事项有直接关系人,以到达避嫌目标,能够确定哪些人是合格被调查者,哪些人不是,甄别目标是确保被调查者合格,能够作为该市场调查项目标代表,从而符合调查研究需要,60/85,甄别部分,S1请问您或您家庭有没有在以下行业工作呢?,1广告、公关机构,2市场研究、咨询、调查机构,3电视,广播,报纸等媒介机构 终止访问,4轿车制造,5轿车批发、零售,6以上皆无继续访问,S2请问您年纪是:,120岁以下终止访问,220岁30岁,330岁40岁,440岁50岁,550岁以上终止访问,61/85,主体部分,是调查问卷关键内容,包含所要调查全部问题,主要由问题和答案所组成,Q1.您在购置汽,车时主要考虑,哪些原因?,Q2.您认为这款,汽车加速性,能怎么样?,62/85,背景部分,通常放在问卷最终,主要是相关被调查者一些背景资料,该部分所包含各项问题,可使研究者依据背景资料对被调查者进行分类比较分析,1.您详细做,什么工作?,2.您受教,育程度?,63/85,背景部分,A出 示 卡 片请 问 您 教 育 程 度?,(901),没 受 过 正 式 教 育 1,小 学,初 中 2,高 中,职 高,中 专,技 校 3,大 专,大 学 或 以 上 4,B出 示 卡 片请 问 您 职 业 和 职 位 是 什 么?,(902),普 通 职 员,工 人1,部 门 经 理 负 责 人/高 级 管 理 人 员 2,公 司 老 板,厂 长,总 经 理 3,专 业 人 员 4,个 体 户,自 营 职 业 5,失 业,待 业 6,学 生7,离 退 休 人 员 8,其 他(请注明)9,64/85,提问项目设计,65/85,提问项目设计,提问内容尽可能短,用词要确切、通俗,可按6W准则加以推敲。6W即,Who,(谁),,Where,(何处),,When,(何时),,Why,(为何),,What,(什么事),,How,(怎样),一项提问只包含一项内容,防止诱导性提问,防止否定形式提问,防止敏感性问题,66/85,用词要确切、通俗,请问您使用什么牌子洗发水?,请问您最近三个月使用什么牌子洗发水?,您最近一段时间使用什么品牌化装品?,您最近一个月使用什么品牌化装品?,您以为这种电视机画面质量怎么样?,您认为这种电视机画面是否清楚?,67/85,一项提问只包含一项内容,您以为这种新款轿车加速性能和制动性能怎么样?,您以为这种新款轿车加速性能怎么样?,您以为这种新款轿车制动性能怎么样?,68/85,防止诱导性提问,人们认为长虹牌彩电质量不错,你以为怎么样?,您以为长虹牌彩电质量怎么样?,69/85,防止否定形式提问,您以为这种产品新包装不美观吗?,您以为这种产品新包装美观吗?,70/85,回答项目(答案)设计,71/85,回答类型与方法,回,答,类,型,与,方,法,开放性问题,(自由回答型),封闭性问题,(选择回答型),两项选择法,多项选择法,次序选择法,评定尺度法,双向列联法,限制选择型,多项选择型,单项选择型,72/85,开放性问题,对问题回答未提供任何详细答案,由被调查者依据自己想法自由作出回答,属于自由回答型,优点:比较灵活,适合于搜集更深层次信息,尤其适合于那些还未搞清各种可能答案或潜在答案类型较多问题。而且能够使被调查者充分表示自己意见和想法,有利于被调查者发挥自己创造,缺点:因为会出现各种各样答案,给调查后资料整理带来一定困难,73/85,开放性问题,您认为我国当前广告宣传中,存在,主要问题是什么?,您对这种捷达新款车有何更详细看法?,74/85,封闭性问题,对问题事先设计出了各种可能答案,由被调查者从中选择,问题答案是标准化,有利于被调查者对问题了解和回答,也有利于调查后资料整理,对答案要求较高,对一些比较复杂问题,有时极难把答案设计周全,问题答案是选择回答型,所以设计出答案一定要穷尽和互斥,回答方法有:两项选择法、多项选择法、次序选择法、评定尺度法、双向列联法五种,75/85,封闭性问题,(两项选择法),答案只有两项,要求被调查者选择其中之一往返答,优点:被调查者只需在二者之中选择一项,回答比较轻易;调查后数据处理也很方便,缺点:得到信息量较少;当被调查者对两项答案均不满意时,极难作出回答,您有手机吗?,1.有 2没有,76/85,封闭性问题,(多项选择法),在设计问卷时,对一个问题给出三个或三个以上答案,让被调查者从中选择进行回答,依据要求选择答案多少不一样,有以下类型,单项选择型:,要求被调查者对所给出问题答案选择其中一项,多项选择型:,要求被调查者对所给出问题答案中,选出自己认为适当答案,数量不受限制,限制选择型:,要求被调查者在所给出问题答案中,选出自己认为适当答案,但数量要受一定限制,77/85,封闭性问题,(单项选择法实例),单项选择型,您以为哪种类型广告宣传效果最好?,(选一项),1电视广告,2广播广告,3杂志广告,4报纸广告,5路牌广告,78/85,封闭性问题,(多项选择法实例),多项选择型,请问您在购置小轿车时,主要考虑哪些原因?,(选出您认为适当答案),1价格 6维修费用,2款式 7乘坐舒适,3品牌 8行使平稳,4耗油量 9加速性能,5售后服务 10制动性能,79/85,封闭性问题,(次序选择法),问题答案有多个,要求被调查者在回答时,对所选答案按要求次序或主要程度加以排列。其中,对所选答案数量能够进行一定限制,也能够不进行限制,问题答案不但能够反应所要调查内容,而且能够反应出被调查者对问题看法,从而增加了信息量,您在购置这种牌子电视机时,主要是考虑哪些原因?,1产品品牌,2价格合理,3售后服务,4外形美观,5维修方便,(按主要程度进行排序),80/85,封闭性问题,(评定尺度法),问题答案,由表示不一样等级形容词组成,,并按照一定程度排序,由被调查者依次,选择,您对这种新款轿车是否感到满意?,1非常满意;2比较满意;3普通,4不太满意;5不满意。,81/85,封闭性问题,(双向列联法),将两类不一样问题综合到一起,通惯用表格来表现,表横向是一类问题,纵向是另一类问题,这种问题结构能够反应两方面原因综合作用,提供单一类型问题无法提供信息,能够节约问卷篇幅,82/85,封闭性问题,(双向列联法实例),神龙富康,捷,达,桑塔纳,1.,耗油量低,2.,外观大方,3.,乘坐舒适,4.,整车价格合理,5.驾驶轻易,6.,制动性好,7.,维修方便,8.,零配件齐全,9.,故障率低,10.,售后服务周到,请在您赞同项目空格内划“”,83/85,问题次序设计,84/85,问题次序设计,问题安排应含有逻辑性,问题次序应先易后难,能引发被调查者兴趣问题放在前面,开放性问题放在后面,版面格式设计,问卷结构安排要合理,问卷主体部分要突出、醒目,不要编排过密,各问题之间要留出一定空间,外表及内容印刷要美观,85/85,
展开阅读全文