1、社会统计学复习社会统计学复习1.变量层次:四个层次的特征变量层次:四个层次的特征2.单变量分布的简化单变量分布的简化3.双变量的相关双变量的相关4.抽样分布抽样分布5.参数估计参数估计6.假设检验假设检验一、测量层次一、测量层次1.定类层次定类层次(nominallevel)2.定序层次定序层次(ordinallevel)3.定距层次定距层次(intervallevel)4.定比层次定比层次(ratiolevel)1243关于测量层次的总结关于测量层次的总结测量层次测量层次 数学特征数学特征=、30,不不管管原原分分布布如如何何,抽样分布接近正态分布抽样分布接近正态分布抽样分布的均值就是总体的
2、均值。抽样分布的均值就是总体的均值。抽样误差就是抽样分布中均值的标准差。抽样误差就是抽样分布中均值的标准差。那那么么,抽抽样样分分布布的的均均值值两两旁旁,包包括括多多少少个个样本均值呢?样本均值呢?如图:如图:五、参数估计五、参数估计点估计点估计区间估计区间估计区间估计的公式区间估计的公式区间估计与必要样本容量区间估计与必要样本容量区间估计与假设检验的关系区间估计与假设检验的关系二者的区别二者的区别二者的相同点二者的相同点二者的相互转化二者的相互转化(利用置信区间进行假设检验)(利用置信区间进行假设检验)六、六、假设检验假设检验主要问题:主要问题:1、假设检验的基本思想、假设检验的基本思想2
3、、假设检验的步骤、假设检验的步骤3、假设检验中的两类错误、假设检验中的两类错误4、总结、总结假设检验的基本思想假设检验的基本思想假设检验的基本思想假设检验的基本思想基于小概基于小概率原理的反证法。两个特点:率原理的反证法。两个特点:n采用采用反证法反证法n依据的是依据的是小概率原理小概率原理小概率事件小概率事件在一次观察中几乎不可能发生的原则。在一次观察中几乎不可能发生的原则。建立总体假设建立总体假设H0,H1抽样得到样抽样得到样本观察值本观察值12选择统计量选择统计量确定确定H0为真为真时的抽样分布时的抽样分布3根据具体决策根据具体决策要求确定要求确定确定分布上的临确定分布上的临界点界点C和
4、检验规则和检验规则计算检验统计算检验统计量的数值计量的数值比较并作出检验判断比较并作出检验判断7456假设检验的步骤假设检验的步骤总体均值、比例和方差的假设检验总体均值、比例和方差的假设检验1、总体方差已知时对正态总体均值或均值差的检、总体方差已知时对正态总体均值或均值差的检验验Z检验法检验法2、总体方差未知时对正态总体均值或均值差的检、总体方差未知时对正态总体均值或均值差的检验验t检验法检验法3、大样本总体均值或均值差的检验、大样本总体均值或均值差的检验Z检验法检验法4、大样本总体比例或比例差的假设检验、大样本总体比例或比例差的假设检验采用采用Z检验法检验法5、小样本总体方差的假设检验、小样
5、本总体方差的假设检验采用采用卡方检验卡方检验法法一些常见的错误观念一些常见的错误观念接受原假设接受原假设=原假设正确原假设正确接受原假设时,接受原假设时,原假设正确的可能性原假设正确的可能性(判断正确的概率)(判断正确的概率)=1-“差异显著差异显著”=有很大差异有很大差异对同一检验问题,两个假设互换位置,对同一检验问题,两个假设互换位置,检验结论并没有什么不同。检验结论并没有什么不同。典型的数据分析方法(部分)典型的数据分析方法(部分)集中趋势集中趋势离散趋势离散趋势相关回归相关回归假设检验假设检验众数众数定类变量定类变量品质相关品质相关 2检验检验异众比异众比中位数中位数等级相关等级相关四
6、分位差四分位差Z、t检验检验定序变量定序变量均值均值相关回归相关回归标准差标准差F、t检验检验定距变量定距变量归纳:归纳:定类定类-定类定类定类定类-定序定序X2检定检定定序定序-定序定序Z、T检定检定定类定类-定距定距定序定序-定距定距F检定检定定距定距-定距定距描述统计与推断统计中相关回归分析的差别描述统计与推断统计中相关回归分析的差别描述统计描述统计:不需要对随机误差项作出各种假定不需要对随机误差项作出各种假定,各种各种参数估计值是具体数值参数估计值是具体数值,是对总体存在的是对总体存在的相关关系的描述相关关系的描述,不存在显著性检验不存在显著性检验.推断统计推断统计:需要对随机误差项作
7、出各种假定需要对随机误差项作出各种假定,各种参各种参数估计量是随机变量数估计量是随机变量,抽取的样本不同时抽取的样本不同时,得到的估计值也不同得到的估计值也不同.可以用来推断总体可以用来推断总体.需要进行各种检验需要进行各种检验.相关分析与回归分析相关分析与回归分析相关分析是用一个指标来表明现象间依存相关分析是用一个指标来表明现象间依存关系的密切程度。回归分析是用数学模型关系的密切程度。回归分析是用数学模型近似表达变量间的平均变化关系。近似表达变量间的平均变化关系。相关分析可以不必确定变量中哪个是自相关分析可以不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量都变量,哪个是因变量,其所涉
8、及的变量都是随机变量。是随机变量。相关分析与回归分析相关分析与回归分析回归分析必须事先确定具有相关关系的变回归分析必须事先确定具有相关关系的变量中哪个为自变量,哪个为因变量。一般量中哪个为自变量,哪个为因变量。一般地说,回归分析中因变量是随机的,而把地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。自变量作为研究时给定的非随机变量。一定要始终注意把定性分析和定量分析结一定要始终注意把定性分析和定量分析结合起来,在定性分析的基础上开展定量分合起来,在定性分析的基础上开展定量分析。析。样本回归函数与总体回归函数区别样本回归函数与总体回归函数区别总体回归线是未知的,只有一条。样本
9、回归总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。便可以拟合一条样本回归线。总体回归函数中的总体回归函数中的 和和是未知的参数,表现是未知的参数,表现为常数。而样本回归函数中的为常数。而样本回归函数中的是随机是随机变量,其具体数值随所抽取的样本观测值不变量,其具体数值随所抽取的样本观测值不同而变动。同而变动。样本回归函数与总体回归函数区别样本回归函数与总体回归函数区别总体回归函数中的总体回归函数中的Et是与未知的是与未知的总体回归线之间的纵向距离,它是总体回归线之间的纵向距离,它是不可直接观测的。
10、而样本回归函数不可直接观测的。而样本回归函数中的是与样本回归线之间的纵中的是与样本回归线之间的纵向距离,当根据样本观测值拟合出向距离,当根据样本观测值拟合出样本回归线之后,可以计算出的样本回归线之后,可以计算出的具体数值。具体数值。练习:练习:1我我们们的的研研究究假假设设是是:不不同同类类的的专专业业卫卫生生技技术术人人员员对对当当地地的的卫卫生生事事业业的的发发展展有有不不同同的的满满意意程程度度。为为求求证证这这一一假假设设,我我们们从从全全部部卫卫生生技技术术人人员员中中抽抽取取一一个个随随机机样样本本n=490,下下表表就就是是两两个个变变量量的的交交互互分分类类资资料料。试试写写出
11、出虚虚无无假假设设;计计算算卡卡方方值值;如如果果所所选选取取的的显显著著程程度度是是0.05,则则统统计计结结果果是是支支持持还还是是否否定定研研究究假假设设?试试计算相关系数。计算相关系数。专业卫生技术人员对卫生事业发展的态度专业卫生技术人员对卫生事业发展的态度态态度度卫卫生生人人员员总数总数西西医医医医士士护护士士中中医医满意满意10854414207一般一般3133132299不满意不满意1453108184总数总数28411854344902以以下下是是婚婚姻姻美美满满与与文文化化程程度度的的随随机机抽抽样样调调查查结结果果问问:文文化化程程度度与与婚婚姻姻美美满满状状况况是是否否相相关关?提出研究结论。提出研究结论。显著性水平为显著性水平为0.05文化文化婚姻婚姻大大学学中中学学小小学学美满美满一般一般不美满不美满9165830183473.以以下下是是生生活活期期望望值值与与个个人人成成就就的抽样调查:的抽样调查:生活期望值生活期望值108764321个人成就个人成就791042132求求(1)回回归归直直线线;(2)相相关关系系数数和和判判定定系系数数并并解解释释其其意意义义;(3)是是否否具具有有推推论意义论意义显著性水平显著性水平0.05