1、第四章 调查数据的推断分析调查数据往往是来自总体的一个随机样本,通过对样本数据的处理,可以获得样本的数据特征。然而,调查研究的目的是要揭示总体的数量特征和变化规律,所以,就存在一个如何用样本信息去推断总体数量特征的问题.调查数据的推断分析是调查数据分析中的一项经常性内容,也是一项十分重要的数据分析工作。本章主要介绍调查数据推断分析的基本方法,内容包括参数估计、假设检验和方差分析.第一节 参数估计一、参数估计的一般问题(一)统计量与参数所谓参数估计,就是用样本统计量推算总体分布中的参数。参数是描述总体特征的概括性数字度量。因总体是确定的且通常未知,所以参数通常也是未知的,是一个需要估计的常数.推
2、断问题中人们所关心的参数通常有:均值()、方差()、成数(P)。统计量是根据样本数据计算出的概括性数字度量,是样本的函数,它反映着样本的信息;样本的随机性决定统计量是随机变量。与所需要认识的参数相对应,推断问题中,最常用的统计量有:样本均值: (用来估计总体均值)样本成数: (用来估计总体成数)样本方差:或 (用来估计总体方差)估计问题中,统计量又称为估计量。(二)统计量的抽样分布统计量是一个随机变量,称它的概率分布为抽样分布。由于概率分布能很好地描述一个随机变量的性质,故用抽样分布来描述统计量的性质。知道概率分布,便可计算任一随机事件发生的概率;反映在估计问题中,知道抽样分布,意味着不仅可以
3、计算估计误差这一随机事件发生的概率,而且可以控制估计误差.所以,抽样分布理论是统计推断的基础,是学习的重点。考虑到实际问题中,因客观条件的不同或研究目的的不同,在一些情况下,我们只可能获得较少的数据,即样本容量不可能很大,当时,就接受H0,即并不小于,反之,则拒绝,即。同理,对:=0,:而言,应将检验的显著水平全部放在H0的右侧进行检验。(五)统计结论的两类错误假设检验所得到的统计结论,完全是根据样本观察值计算出的检验统计量的数值是否落在的接受域内而作出的,是在一定概率意义下进行的。由于样本的随机性,检验判断时,有可能犯以下两类错误.(以:,:为例)。第一类错误:=0确实成立,但由于样本随机性
4、,也可能小于,即落在接受域外,见图44.H1H0图4-4 假设检验中的两类错误图示这就导致把“实际成立”因而应该“接受的问题错误当成“拒绝”,我们把这类统计结论的错误称为第一类错误或弃真错误。显然就规定,而言,犯第一类错误的概率就是,即检验规定的显著性水平。第二类错误:如果实际上是来自且10,在这种场合按理不应接受,但同样因样本的随机性,仍可能落在的接受域内,因而,导致把分布错作而接受下来,这类统计结论错误称为第二类错误或采伪错误。记犯第二类错误的概率为,结合图4-4来看,的大小显然就是在分布下的的阴影面积,即对其作标准化处理,则有:其中:一般,是显性的,但是隐性的,不易看出。观图44,不难发
5、现影响值变化的因素有:(1)当其他条件不变时,大则小;反之,小必导致大,换句话说,在其他条件不变的情况下,要同时减小犯两类错误的概率是不可能的.(2)在规定的水平下,单侧检验犯第二类错误的可能性小于双侧检验。(3)其他情况不变,增加样本容量n,值将有效地减小。(4)其他情况不变,假设下的0与1间的距离将直接影响值。通过以上分析,我们应该在合适的及的要求下进行统计假设检验。通常值控制在15,值多控制在10%30%。统计学家Neyman和Pearson提出的原则是:在控制犯第一类错误的概率的条件下,尽量使犯第二类错误的概率减少。其含义是:原假设要受到维护,使它不致于轻易被否定;若检验结果否定了原假
6、设,则说明否定的理由是充分的,同时,作出否定判断的可靠程度(1)也得到保证。二、几种基本的统计假设检验方法统计假设检验方法很多,最基本的假设检验方法有四种,即检验法,检验法,检验法和检验法.(一)检验法检验法是在已知总体分布中的方差时,对一个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验的方法。检验法也可用于大样本下非正态总体的成数检验。1一个正态总体均值的检验考虑下面三种类型的假设检验:(1): :0;(2): ;(3): 。所构造的检验统计量为:当时,统计量服从(0,1)。给定显著性水平,则有:(1): :0检验规则为:当时,拒绝;当时,接受。上述三个假设检验的拒绝域如图45,
7、拒绝域的面积为.()()()000(3)(1)(2)图4-5 假设检验中的拒绝域图示【例4。11】 完成生产线上某件工作的平均时间不少于15。5分钟,标准差为3分钟。对随机抽选的9名职工讲授一种新方法,训练期结束后这9名职工完成此项工作的平均时间为13.5分钟。这个结果是否说明用新方法所需时间比用老方法所需时间短?设=0。05,并假定完成这件工作的时间服从正态分布。解:根据题意,要检验的假设为 15.5由于总体服从正态分布,且总体方差已知,所以选取检验统计量其观测值为:查表得,由于,所以拒绝原假设,也即说明用新方法所需时间明显较短。2两个正态总体均值之差的检验考虑下面三种类型的假设检验(1):
8、 :;(2): :;(3): :。我们知道,经标准化后,为:于是,构造检验统计量 当时,统计量服从(0,1).给定显著性水平,检验问题(1)、(2)、(3)的检验规则分别为:(1)当时拒绝,时接受;(2)当时拒绝,-时接受.【例4。12】 有两种方法可用于制造某种产品。经验表明,这两种方法生产的产品的抗拉强度都近似服从正态分布.方法1和方法2给出的标准差分别为3公斤和4公斤。从方法1和方法2生产的产品中分别随机抽取10个和14个产品,所得样本均值分别为20公斤和17公斤。试问这两种方法生产的产品的平均抗拉强度是否不同。()解:按题意,建立假设: 由于两个总体都近似服从正态分布,且总体方差已知,
9、所以选取检验统计量 其观测值为查表得=1.96,由于,所以拒绝原假设,也即认为这两种方法不能生产出抗拉强度相同的产品。3大样本下总体成数的检验考虑下面三种类型的假设检验:(1) ;(2) ;(3) 。当时,样本成数的抽样分布近似服从正态分布。于是构造检验统计量当时,统计量近似服从(0,1)。【例4。13】 某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占20%以上。随机抽取400张检查,发现错误的发票有100张,即占25。这是否可以证明负责人的判断正确?()解:按题意建立假设:0。2选取检验统计量为其观测值为查表得。由于,所以拒绝,也即认为这些数据可以证明负责人的判断是
10、正确的。(二)检验法检验法是在未知总体方差时,对一个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验的方法。1一个正态总体均值的检验考虑下面三种类型的假设检验:(1): :0;(2): ;(3): 。由于未知,应选取的检验统计量为:我们知道,当时,统计量服从自由度为的分布。给定显著性水平,检验问题(1)、(2)、(3)的检验规则分别为:(1)当时拒绝,时接受;(2)当时拒绝,25000由于总体近似服从正态分布,总体方差未知,所以选取检验统计量其观测值为:查分布表得,(14)=1.7613。由于 (14),所以只能接受,也即没有充分理由相信轮胎厂所生产轮胎的平均寿命高于国家标准.2两个
11、正态总体均值之差的检验(总体方差未知但相等)考虑下面三种类型的假设检验(1): :(2): :(3): :我们知道,于是检验统计量为其中:当时,统计量服从自由度为的的分布.给定显著性水平,检验问题(1)、(2)、(3)的检验规则分别为:(1)当时拒绝,时接受;(2)时拒绝,时接受。【例4.15】 有甲、乙两台机床加工同样产品,从它们所生产的产品中分别随机抽取8件和6件,测得产品直径(单位:)数据为:假定两个总体都服从正态分布,且方差相等。试问甲、乙两台机床加工的产品平均直径有无显著差异?()解:按题意建立假设: 由于两个总体都服从正态分布,方差虽未知但相等,所以选取检验统计量其观测值为:查获(
12、12)=2。1788。由于36.191,所以拒绝原假设,即这批玻璃杯折射率的标准差显著地超过了标准,该超市应该拒绝接受这批玻璃杯。(四)检验法检验法是对两个正态总体方差间的关系(方差之比)进行检验的方法。考虑下面三种类型的假设检验:(1);(2);(3)。其中,分别为两个正态总体的方差.若从两个总体中分别随机抽取容量为为这两个样本的方差,我们已经知道统计量的概率分布,于是把F作为两个总体方差是否相同的检验统计量.显然,在原假设成立的条件下,服从自由度分别为和的分布.对给定的显著性水平,查分布表可得出相应的临界值,检验问题(1)、(2)、(3)的规则分别为:(1)当或时拒绝,否则接受;(2)当时
13、拒绝,时接受;(3)当时拒绝,时接受。【例4.17】 在本章例4.15中,我们假定甲、乙两台机床加工产品的直径服从正态分布,且方差相等。但从样本测得的数据是和,即两个样本方差存在着一定的差异,因而需要检验这两个总体的方差是否真的相等。(=0.1)解: 由题意可建立假设:,。要检验原假设是否成立,可选择为检验统计量,本例的观测值为在显著性水平的条件下,查自由度为的分布,其临界值为:因为,所以接受原假设,即虽然这两个样本的方差存在着一定的差异,但这种差异并不显著。综上所述,2检验法和检验法都是针对方差的检验法,2检验法检验一个正态总体的方差,检验法检验两个正态总体的方差之比。第三节 方差分析前两节
14、中我们讨论过两个总体均值之差的估计和检验问题。社会实践活动中,往往需要对多个总体进行比较研究,并分析它们之间变异的原因.如果沿用两个总体比较的方法,不仅计算工作冗烦,而且由于不能同时利用全部观察数据的信息,推断所得结论的精确度也较低。如果采用方差分析来解决这类问题,就可以取得较好的结果.方差分析是20世纪20年代发展起来的一种统计方法,它被广泛应用于分析心理学、生物学、工程、医药、质量管理等试验数据,也用于社会经济调查得到的观察数据。从本质上讲,方差分析也是一种假设检验。它通过对样本全部观测数据的波动进行分析,然后分解,将某因素下各组样本数据间可能存在的系统性波动与随机波动加以比较,据此推断各
15、总体之间是否存在显著性差异,若存在显著性差异,也就说明该因素的影响是显著的.一、方差分析的一般性问题(一)基本概念为了更好地理解方差分析的含义,我们先通过一个例子来说明方差的有关概念及方差分析所要解决的问题.【例4.18】 五种治疗荨麻疹的药,要比较它们的疗效。为此,将30个病人随机分成5组,每组6人,令同组的病人使用同一种药,并记录下病人从用药开始到痊愈所需天数,如表42所示:表4-2 五种治疗荨麻疹药治愈病人天数药物A治愈所需天数XijA16877108A2466356A3644523A4746635A5945776一般而言,治愈所需天数越短,说明药物的疗效越好.医务人员想了解的是这5种药
16、的疗效是否存在显著性差异?这相当于要判断“药物对“治愈所需天数是否有显著影响,做出这种判断最终可归纳为检验这5种药物治愈病人所需时间的均值是否相等。如果它们的均值相等,就意味着“药物”对“治愈所需天数”是没有影响的,也就是5种药物的疗效没有显著差异;如果均值不相等,则意味着“药物”对“治愈所需天数”是有影响的,5种药物间的疗效有显著差异。方差分析中,把所要检验的对象称为因素,因素的不同表现称为水平或处理,每个水平下得到的样本数据值称为观测值。如在上述例子中,我们要分析药物对治愈所需天数是否有影响,这里的“药物是所要检验的对象,我们把它称为“因素,不同的药是“药物”这一因素的具体表现,我们称之为
17、“水平”或“处理”;每一种药的治愈所需天数(样本数据)被称为观测值。由于这里只涉及到“药物一个因素,因此称为单因素5水平的试验.当我们把因素的每一个水平看作是一个总体,例子中有5种药,便有5个总体.表4-2中的数据值是从这5个总体中随机抽取的样本数据(各样本数据的个数可相等,也可不等,本例是相等的情形)。如果把因素看作分类型自变量,不同的药物便是它的不同取值;治愈所需天数看作数值型因变量,不同的天数就是因变量的取值,如此,方差分析所要回答的问题便是:分类型自变量对数值型因变量是否有显著性影响?(二)分析思想在上例中,记因素(药物)为,有5种药,即有5个水平,分别记为、,也就是说有5个总体,记这
18、五个总体的均值分别为、。为了观察每一个总体的样本观测值,作散点图47。A1 A2 A3 A4 A5从散点图上直观地看出,不同药物的治愈所需天数存在着明显的差异,而且,即使是同一种药物,治愈所需天数也存在着差异,和治愈所需的时间较长,治愈所需时间最短,这表明药物与治愈所需时间之间有一定的关系。如果药物与治愈所需时间没有关系,那么,不同的药物治愈所需天数应该差不多,表现在散点图上,各药物治愈所需时间的均值应大体上处于同一高度,即、应大体上相等.如果我们提出假设:,问题便转化为对进行检验了。如何检验呢?首先,分析某一总体下观察值不等的原因。比如总体,由于样本的随机性,随机性因素的影响造成来自总体的6个样本观察值不等,这种观察值间的波动称为随机性波动。其次,分析不同药物间样本观察值不等的原因,即不同总体之间的样本观察值不等的原因,不难发现原因有两个,一是随机性因素影响,二是不同药物本身的疗效所致。我们把后一原因造成的数据波动称为系统性波动。如此,不同总体间样本观察值的不等,说明既有随机性波动,又有系统性波动.如果把衡量因素(药物)同一水平(同一总体)下样本数据波动的名词称为组内误差,那么,衡量因素