资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,厦门大学社会学系,#,1,第八讲:单总体的假设检验,2,单总体假设检验的分类,Z,检验,(一端和两端),t,检验,(一端和两端),Z,检验,(,一端和两端),F,检验,(,一端和两端,),均值,单总体,比例,方差,3,一、基本知识,4,1、,建立假设,:,陈述原,/,零,/,虚无假设,H,0,和研究,/,备择假设,H,1,一般我们把实际被检验的假设称为零假设,(,用符号,H,0,来表示,),并用这与备择假设,(,H,1),相对比,.,一般来讲,零假设总是假设几个组之间不存在差异,或几个变量之没有关系,而备择假设则假设它们之间存在正相关或负相关的关系,.,实际上,研究者一般都预期零假设是错误的,应予以否定,并据此而接受备择的,H,1.,但为了计算概率分布,在操作过程中,却必须先把,H,0,看作正确的,.,如果我们能证明,H,0,是正确的可能性很少,那么就可以据此顨 排除抽样误差的说法,百认为,H,1”,可能”是对的。,检验假设的基本原则是直接检验,H,0,,因而间接地检验,H,1,,目的是排除抽样误差的可能性。,5,2,、选择显著性水平和否定域,P153,所谓否定域(,CR,),就是抽样分布内一端或两端的小区域,如果样本的统计值在此区域范围内,则否定原假设。,我们可以指定否定域在抽样分布的一端,也可以是两端。究竟是一端还是两端,则要视研究假设(,H1,)的性质而定,。,6,与否定域相关连的统计学概念是显著度(,level of significance,),表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否定域内的机会。,显著度(,P,)的大小,视研究的需要而定,但在当前的社会学研究中,一般是以,p0.05,作为准则,.,当然,显著度愈小,便 愈难否定原假设,也即愈难证明研究假设,/,备择假设是对的,.,7,3.,一端检验与二端检验,在何种情况下选择一端检验还是二端检验,?,取决于是否可以确定研究假设,(H1),的方向,.,如果,H1,能定出方向,如,则为一端检验,.,如果,H1,定不出方向,如,则样本的统计值落在抽样分布的右端或左端的可能性是相同的,因而要用二端检验,.,如果所选定的显著度相同的,二端检验比一端检验更难否定原假设,/,虚无假设,.,所以,要求成立研究假设时最好是尽可能清楚,.,8,假,设,研究的问题(以总体均值,M,的检验为例),两端检验,左端检验,右端检验,uu0,u,u0,u,u0,u=u0,uu0,u u0,9,4,、两种错误,(type,和,type),当我们以样本的统计值来检验假设时,最后的结果无论是否定还是接受,都可能犯错误,.,第一种错误,(,弃真的错误,):,是指否定,H0,但实际上,H0,是正确的概率,.,第二种错误,(,纳伪的错误,),:是指接受,H0,,但实际上,H0,是错误的概率。,这两种错误是成反比的,是对立的。,10,真实情况,所做决策,接受,H0,拒绝,H0,H0,为真,正确,犯第,类错误(弃真),H0,不真,犯第,类错误(纳伪),正确,11,5,、两种检验的角度:参数检验与非参数检验,(,1,)参数检验(,Z,、,T,、,F,)要求总体具备一些条件:,正态分布;定距测量层次;方差齐性等,(,2,)非参数检验(,X2,),总体分布不易确定(也就是不知道是不是正态分布);,分布呈非正态而无适当的数据转换方法;,等级资料;,一段或两段无确定数据等(比如一段的数据是,50,是一个开区间),但由于非参数检验不理会总体的情况,在推论时就较为困难,准确性也会因此而影响。因此,在总体确实具备某些条件时,参数检验要比非参数检验法好。,12,二、检验的基本步骤,1.,建立假设,:,陈述原假设,H,0,和研究假设,H,1,2.,选择显著性水平,和否定域,3.,求抽样分布,4.,计算,检验统计量,5.,做判断,13,三、单个总体均值和比例的假设检验,(一)单个总体均值的检验,(二)单个总体比例的检验,14,(一)单个总体均值的检验,15,1.大样本总体均值检验(两端),1.假定条件:,总体服从正态分布,2.,原假设为:,H,0,:,M,=,M,0,;,研究假设为:,H,1,:,M,M,0,3.使用,z,统计量(通常,n,100,),Z,检验,N,(,0,,,1,),16,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度,近似服从正态分布,,其总体均值为,M,0,=0.081mm,,,总体标准差为,s,=,0.025,。今换一种新机床进行加工,抽取,n,=200,个零件进行检验,得到的椭圆度均值为,0.076,mm,。,试问新机床加工零件的椭圆度的均值与以前有无显著差异?,(,0.05),例题1,17,例题1,(计算结果),H,0,:,M,=0.081,H,1,:,M,0.081,=,0.05,n,=,200,临界值,|,1.96,检验统计量:,Z,0,1.96,-1.96,.0,05,拒绝,H,0,拒绝,H,0,.0,05,决策:,结论:,拒绝,H,0,,,接受,H,1。,从总体上看,在,0.05,的显著性水平上,新机床加工的零件的椭圆度与以前有显著差异,解:,18,大样本总体均值假设检验(一端),1.假定条件,:,总体服从正态分布,2.,研究假设有符号,3.使用,z,统计量,19,大样本总体均值的假设检验(一端),左侧:,H,0,:,0,H,1,:,0,Z,0,拒绝,H,0,20,某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于,1000,小时。已知灯泡使用寿命服从正态分布,标准差为,20,小时。在总体中随机抽取,100,只灯泡,测得样本均值为,960,小时。批发商是否应该购买这批灯泡?,(,0.05),例题2,21,H,0,:,1000,H,1,:,1000,=,0.05,n,=,100,临界值,1.65,检验统计量:,在,=0.05的水平上拒绝,H,0,因此,从总体来看,在,0.05,的显著性水平上,这批灯泡的使用寿命低于1000小时,决策:,结论:,-1.65,Z,0,拒绝域,例题2(计算结果),解:,22,2,、小样本单总体均值的两端,t,检验,1.假定条件,总体为正态分布,2.使用,t,统计量(,t,的分布形态决取于自由度。,Df=n-1,),23,已知初婚年龄服从正态分布,根据,9,个人抽样调查得到,x=23.5,s=3,,是否可以认为该地区初婚年龄已经超过,20,岁。,24,(二)单个总体比例的检验,25,1.,大样本单总体比例的检验,假定条件,有两类结果,总体服从二项分布,比例检验的,z,统计量,P,0,为假设的总体比例,为样本中计算出来的比例,26,某研究者估计本市居民家庭的电脑拥有率为,30%。,现随机抽查了,200,的家庭,其中,68,个家庭拥有电脑。试问研究者的估计是否可信?(,=0.05,),例题,4,27,例题,4,(计算结果),H,0,:,p,=0.3,H,1,:,p,0.3,=0.05,n,=200,临界值(,Z):,检验统计量:,在,=0.05的水平上接受,H,0,从总体来看,研究者的估计可信,决策:,结论:,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,解:,28,2.,小样本总体比例的两端检验,29,单均值和单比例假设检验的,spss,应用,30,31,32,上图即调查了,2239,人,文化程度平均为,3.48,,标准差为,1.010,,标准误是,0.021,。,下图是,t,检验的结果,即在假设总体文化程度为,3,的情况下,计算,t,值为,22.536,,自由度为,2238,,两端,t,检验的概率,P,小于,0.001,,所以可以否定虚无假设,也就是可以认为流动农民的文化程度不是,3,。样本均值与假定的总体均值之间的差为,0.481,,样本均值与虚无假设的差的,95%,的置信区间为,0.44,,,0.52,。因为总体均值,95%,的置信区间,=,均值,1.96,标准误,可以推测总体的,95%,的置信区间是,3.481.960.021,,即,33,四、两总体的假设检验,(,一,),均值差异的假设检验,(,二,),比例差异的假设检验,34,(,一,),均值差异的假设检验,35,1,、大样本的,z,检验,研究两个随机样本的均值的差异,1,、假定条件,随机抽样,总体服从正态分布,两个总体的标准差是相等的,如果样本的个案数比较大,,n,1,+n,2,100,,采用,Z,检验,36,例题,3,调查甲乙两地农民每年家庭请客送礼情况发现,甲地调查了,132,户,平均每家送礼,57,元,标准差为,11,元,;乙地调查了,118,户,平均每户为,52,元,标准差为,14,元。在,0.05,的显著性水平下,甲乙两地农民送礼的平均支出是否相等?,37,解:,H,0,:x,1,=x,2,H,1,:,x,1,x,2,=,0.05,n,=,250,临界值,|Z,(0.05),|,1.65,决策:,在,0.05,的显著性水平上,拒绝,H,0,,接受,H,1,结论:,从总体上来看,甲乙两地在送礼的平均支出上存在显著性差异,38,2,、两个均值的小样本比较,如果样本较小,,n1+n2100,则用,t,检验,Df=n,1,+n,2,-2,39,例题,为了测量一项新教学法是否有效,假设某班从学生中随机抽取了两个样本,一个作为实验组,(n1=15),另一个作为控制组,(n2=15),对实验组的同学采用新教学法进行辅导,而控制组不参加,.,经过一段时间之后,两组学生在一次测验中的成绩如下,:,实验组同学的平均成绩为,85,分,标准差为,13,分,控制组学生的平均成绩为,75,分,标准差为,17,分,那么在,a=0.05,的显著性水平下,是否可以确定这种新教学方法可以提高学生的成绩,?,40,3,、两个配对样本的,T,检验,前后两次调查同一总体所得的样本,前面讲的都是两个相互独立的样本,通常用于试验组和控制组的调查中,前后两期的数据是属于同一个样本,两个是相关样本,而不是相互独立的样本,X,d,表示样本差异的均值,S,d,样本差异的标准差,41,【,例,】,一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减轻,8.5,公斤以上。为了验证该宣称是否可信,调查人员随机抽取了,10,名参加者,得到他们的体重记录如下表,在,a=0.05,的显著性水平下,调查结果是否支持该俱乐部的声称?:,训练前,94.5,101,110,103.5,97,88.5,96.5,101,104,116.5,训练后,85,89.5,101.5,96,86,80.5,87,93.5,93,102,42,样本差值计算表,训练前,训练后,差值,d,i,94.5,101,110,103.5,97,88.5,96.5,101,104,116.5,85,89.5,101.5,96,86,80.5,87,93.5,93,102,9.5,11.5,8.5,7.5,11,8,9.5,7.5,11,14.5,合计,98.5,43,解:,H,0,:,m,1,m,2,8.5,H,1,:,m,1,m,2,8.5,a,=0.05,df=10-1=9,查附表5,,-,t0.05,(9,),=-1.833,H,0,值,a,拒绝域,接受域,1-,置信水平,因为,t,t,0.05,,,在接受域中,不能否定虚无假设,44,解:,H0:m1,m2 8.5,H1:m1,m2,8.5,a=0.05,df=10-1=9,查附表5,,t,0.05,(,9,),=1.833,因为,t,t,0.05,,,在否定域中,可以否定虚无假设,有证据表明该俱乐部的宣称是可信的.,45,4,、两个百分比的差异,如果要检查两个比例,(,或百分比,),在总体中是否有差异,若样本数较大,两个随机样本比例或百分比差的抽样分布接近正态分布,可用,Z,检验,选择的检验统计量为,:,46,例,5,:比较一个城镇和一个农村地区的小家庭的比例是否相等,在城市调查了,150,户,小家庭的比例为,0.82,,农村地区调查了,200,户,小家庭的比例为,0.51,,在,0.01,的显著度下,两个地区的小家庭的比例是否存在显著性差异?,47,解,:,(1),虚无假设,:H,0,:P,1,=p,2;,研究假设,:H1:,P,1,p,2,(2),已知显著性水平,a=0.05,因研究方向不确定,所以采用两端检验,查表得,Z,临界值,=1.96,(3),根据调查已知,:P1=0.82,P2=0.51,n1=150 n2=200,所以,48,代入公式得:,49,与,0.01,显著性水平的取值进行比较,发现此数值属于否定域范围内,因此否定原假设(两者不存在差异),而接受研究假设(城镇地区小家庭的比例和农村地区存在差异),显然,城镇地区小家庭的比例高于农村地区。,50,均值差异比较与检验的,spss,的应用,对均值的比较和检验主要在,compare means,模块中,.,1.means,过程,是对指定变量的分组综合描述统计,包括均值,方差,中位数,最大值和最小值等统计量的计算,即当观测量按一个分类变量分组时,means,过程可以对其进行分组计算,比较各组均值的大小,.,如要计算男性和女性的平均月收入,.,用,means,过程求若干组的描述统计量,目的在于比较,但是各组之间的均值差异是否真的存在,则需要进行检验,ANOVA(,方差分析法,),可以提供检验结果,51,2.T,检验过程,独立样本的,T,检验,(independent-samples t test),是用两个不相关样本的均值来估计两个总体的均值是否相等的检验方法,.(,样本一定来自两个不相关总体,),配对样本的,t,检验,(paired-sample t test),是通过两个相关或配对样本两次测量结果的比较来检验两个总体的差异是否显著,这种相关或配对样本常常来自实验前后被观测的样本或者跟踪调查的样本等,.,52,3.one-way ANOVA,过程,单因素方差分析用于检验多个独立的均值差异是否显著,如检验三个减肥计划体重下降的效果是否相同,进而判断哪一种训练计划效果更好,或者三个训练计划哪两个之间的差异最显著。,53,Means,过程,1,、建立数据文件,数据文件至少要求有一个连续变量(定距变量)、一个定类变量,对描述的连续变量进行基本的描述统计,而定类变量用来分组。,2,。,Analyze-compare meansmeans,54,55,两个分类变量放在均放在第一层,56,57,58,两个分类变量放在不同层,59,60,61,62,独立样本的,t,检验(,independent-sample t test,),独立样本的,t,检验,要求被检验的两个样本相互独立,没有匹配关系。检验的目的是比较两个样本均值的大小,并对其进行假设检验,确定两个样本的均值是否在存在统计上显著差异,即确定两个样本分属的两个总体的均值是否存在差异。,检验之前,要用,f,检验对两个样本乾地方差齐性(即等方差)的检验,确认两个总体的方差是否相同后,用,t,检验法对这两个样本的均值进行检验。,63,方差齐性检验,64,Analyzecompare meansindependent-samples T Test,65,66,67,方差齐性检验,方差不相等,68,配对样本的,t,检验(,paired-samples t test,),要求被比较的两个样本有配对关系,指的是对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对在一些重要指标上个案两两匹配成对的两个不同样本进行测试所获得的两组数据。,配对样本的特点:样本之间是独立的,彼此存在较强的相关关系。均值配对是比较常见的例子。如学生期中和期末成绩的比较。,69,analyzecompare meanspaired-samples T Test,70,71,72,说明流动人口的月平均伙食支出与月平均居住支出有较大关系,两个变量差的均值,
展开阅读全文