1、社会科学研究定量方法大连海事大学刘巍第三章第三章统计分析统计分析第第1 1节节 统计分析的作用和原则统计分析的作用和原则第第2节节单变量统计描述单变量统计描述第第3节节双变量统计分析双变量统计分析第第1 1节节 统计分析的作用和原则统计分析的作用和原则一、统计分析的作用一、统计分析的作用统计分析就是帮助人们提高控制数字的统计分析就是帮助人们提高控制数字的能力,透过这些庞杂的数字和复杂的关能力,透过这些庞杂的数字和复杂的关系去把握其内在的规律性的一种有利的系去把握其内在的规律性的一种有利的工具。工具。统计分析的作用统计分析的作用1 1、可对资料进行简化和描述可对资料进行简化和描述是统是统计分析作
2、用之一计分析作用之一描述统计:以精简的数字来综合大量的描述统计:以精简的数字来综合大量的事实,对研究变量自身特征作出清晰的事实,对研究变量自身特征作出清晰的描述。描述。注意:在用某种精简的数字对大量资料注意:在用某种精简的数字对大量资料进行概括综合时,必然要损失掉某些信进行概括综合时,必然要损失掉某些信息。所以,要用多种精简数字来综合和息。所以,要用多种精简数字来综合和描述资料的不同特性。描述资料的不同特性。统计分析的作用统计分析的作用2 2、可对变量之间的关系进行描述和深入的分可对变量之间的关系进行描述和深入的分析析是社会研究的最重要的内容之一是社会研究的最重要的内容之一统计分析为深入描述和
3、分析变量间关系,进而统计分析为深入描述和分析变量间关系,进而达到理论解释提供了十分有利的手段。达到理论解释提供了十分有利的手段。运用实验的方法研究多个变量之间的因果关系运用实验的方法研究多个变量之间的因果关系存在许多困难,统计分析对社会研究的一大贡存在许多困难,统计分析对社会研究的一大贡献就是通过事后解释使探讨变量间复杂的因果献就是通过事后解释使探讨变量间复杂的因果联系成为可能。联系成为可能。3 3、可通过样本资料推断总体可通过样本资料推断总体二、统计分析的步骤和原则二、统计分析的步骤和原则统计分析的步骤:统计分析的步骤:1 1、对应用统计分析的前提条件进行考察对应用统计分析的前提条件进行考察
4、2 2、制定统计分析方案制定统计分析方案(1 1)再次确定自变量和因变量再次确定自变量和因变量(2 2)定义复合变量定义复合变量(3 3)变量分组变量分组(4 4)提出统计计算的要求并提出适当的统计方法。提出统计计算的要求并提出适当的统计方法。3 3、选择统计分析方法的原则选择统计分析方法的原则(1 1)社会研究的目的社会研究的目的(2 2)研究资料的性质,主要包括四个方面:变量的测量层次研究资料的性质,主要包括四个方面:变量的测量层次 资料的收集方法资料的收集方法 数据的分布形态数据的分布形态 变量的个数变量的个数4 4、对于统计结果的解释对于统计结果的解释第第2 2节节 单变量统计描述单变
5、量统计描述一、变量的分布一、变量的分布变量的分布为两类:变量的分布为两类:1 1、频次分布、频次分布 2 2、频率分布、频率分布 二、统计表与统计图二、统计表与统计图 单变量统计描述单变量统计描述三、集中趋势分析三、集中趋势分析集中趋势是从一组数据中抽象出的一个代表值,集中趋势是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。以代表现象的共性和一般水平。集中趋势的作用:说明某一社会现象在一定条集中趋势的作用:说明某一社会现象在一定条件下数量的一般水平;对不同空间的同类现象件下数量的一般水平;对不同空间的同类现象或同一现象在不同时间的状态进行比较;分析或同一现象在不同时间的状态进行比
6、较;分析某些社会现象之间的依存关系。某些社会现象之间的依存关系。常用的测量指标:常用的测量指标:1 1、众数:出现频率最高的变量值。、众数:出现频率最高的变量值。2 2、中位数:是将观察总数一分为二的变量值。、中位数:是将观察总数一分为二的变量值。3 3、平均数、平均数 单变量统计描述单变量统计描述四、离中趋势分析四、离中趋势分析离中趋势:用以概括描述数据间差异程度的统计指标。离中趋势:用以概括描述数据间差异程度的统计指标。常用的测量指标:常用的测量指标:1 1、异众比率:非众数的各变量值的总频数在观察总数、异众比率:非众数的各变量值的总频数在观察总数中的比例。中的比例。2 2、极差:等于最大
7、观察值与最小观察值间的差。是对、极差:等于最大观察值与最小观察值间的差。是对定序及定序以上尺度的变量离散程度的测量。定序及定序以上尺度的变量离散程度的测量。3 3、四分互差:、四分互差:Q=Q3 Q=Q3 Q1Q1 是对定序及定序以上是对定序及定序以上尺度的变量离散程度的测量。四分位数:尺度的变量离散程度的测量。四分位数:4 4、方差与标准差:只适用于定距变量。、方差与标准差:只适用于定距变量。5 5、离散系数与标准分数:、离散系数与标准分数:离散系数是标准差与平均数之百分比。离散系数是标准差与平均数之百分比。标准分数标准分数第第3 3节节 双变量统计分析双变量统计分析一、列联表(交互分类表)
8、一、列联表(交互分类表)交互分类:同时依据两个变量的值,将交互分类:同时依据两个变量的值,将所研究的个案分类。目的是将两变量分所研究的个案分类。目的是将两变量分组,比较两组的分布状况,以寻找变量组,比较两组的分布状况,以寻找变量间的关系。间的关系。双变量统计分析双变量统计分析二、消减误差比例相关系数有各种类型,其中大部分含有消减误差比例的意义。消减误差比例:指一种对变量间关系的测定,简称PRE。PRE值表示:用一个社会现象(x)来解释另一个社会现象(y)时,能够消除百分之几的错误,即x对y的解释力有多大。PRE=E1E2/E1 双变量统计分析双变量统计分析三、相关分析三、相关分析相关:指两个变
9、量间存在一种连带关系,相关:指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个即当一个变量的值发生变化时,另一个变量的值也相应地发生变化。变量的值也相应地发生变化。双变量统计分析双变量统计分析按照变量的不同测量层次对各种相关系数简单按照变量的不同测量层次对各种相关系数简单介绍:介绍:1 1、定类变量定类变量定类变量定类变量 用于测量两个定用于测量两个定类变量的相关系数,主要有类变量的相关系数,主要有Lambda Lambda 与与Tau-yTau-y两两种。种。(1 1)LambdaLambda()系数分为:对称形式)系数分为:对称形式用于测量两个变量间的关系是对等的,即用于测量
10、两个变量间的关系是对等的,即无自变量与因变量之分。非对称形式无自变量与因变量之分。非对称形式测量测量两个变量间的关系有自变量与因变量之分。两个变量间的关系有自变量与因变量之分。(2 2)Tau-yTau-y系数:用于测量变量间非对称系数:用于测量变量间非对称关系的。关系的。双变量统计分析双变量统计分析2 2、定序变量定序变量定序变量定序变量 如果测量两个定如果测量两个定序尺度变量间的关系,可用序尺度变量间的关系,可用GammaGamma系数、系数、dyxdyx系系数和斯皮尔曼等级相关系数。数和斯皮尔曼等级相关系数。(1 1)GammaGamma(G G)系数:分析两个变量间)系数:分析两个变量
11、间的对等关系,即无自变量与因变量之分。的对等关系,即无自变量与因变量之分。(2 2)dyxdyx系数:等级相关系数,两个变量系数:等级相关系数,两个变量间的关系是非对称的。间的关系是非对称的。(3 3)斯皮尔曼斯皮尔曼(Spearman)(Spearman)等级相关系数等级相关系数()():考虑单个个案在两个变量上的等级差异,:考虑单个个案在两个变量上的等级差异,测量两变量间对等相关关系。测量两变量间对等相关关系。双变量统计分析双变量统计分析3 3、定距变量定距变量定距变量定距变量 测量两个定距变量相关系测量两个定距变量相关系数的最常用指标是皮尔森(数的最常用指标是皮尔森(PearsonPea
12、rson)相关系数()相关系数()。)。(要求(要求N50N50而且两个变量的分布应近似于正态分布。)而且两个变量的分布应近似于正态分布。)4 4、定类变量定类变量定距变量定距变量 两个变量中,自变量为定两个变量中,自变量为定类变量,因变量为定距变量时,采用相关比率来测量类变量,因变量为定距变量时,采用相关比率来测量两者间相关程度。(又称两者间相关程度。(又称etaeta平方系数平方系数 E E)5 5、定类变量定类变量定序变量定序变量 对一个定类变量例如性别,对一个定类变量例如性别,与一个定序变量例如收入水平关系的分析:与一个定序变量例如收入水平关系的分析:第一,用第一,用thetathet
13、a系数(系数(),专门测量定类变量与定序),专门测量定类变量与定序变量间关系有无和强度,非对称关系。变量间关系有无和强度,非对称关系。第二,采用第二,采用系数和系数和Tau-yTau-y系数,即将定序变量作为定系数,即将定序变量作为定类变量处理。类变量处理。双变量统计分析双变量统计分析6 6、定序变量定序变量定距变量定距变量 处理一个定处理一个定序变量例如教育水平,与一个定距变量序变量例如教育水平,与一个定距变量如年均收入之间的关系,采用二种办法:如年均收入之间的关系,采用二种办法:第一,第一,将定序变量看作定类变量,采用将定序变量看作定类变量,采用相关比例测量法。相关比例测量法。第二,第二,
14、将定序变量看作定距变量,采用将定序变量看作定距变量,采用相关系数。相关系数。双变量统计分析双变量统计分析小结:在分析两个变量关系时,选择哪小结:在分析两个变量关系时,选择哪种相关系数,主要考虑两个方面:种相关系数,主要考虑两个方面:1 1、变量的测量层次;变量的测量层次;2 2、变量关系的类别,即是对等的还是变量关系的类别,即是对等的还是非对称的。非对称的。双变量统计分析双变量统计分析四、一元方差分析四、一元方差分析一元方差分析是关于一个定类变量和一个定距一元方差分析是关于一个定类变量和一个定距变量的分析,二元方差分析是关于二个定类变变量的分析,二元方差分析是关于二个定类变量和一个定距变量的分
15、析,量和一个定距变量的分析,-依此类推,依此类推,n n元方差分析是关于元方差分析是关于n n个定类变量和一个定距变个定类变量和一个定距变量的分析,二元以上的方差分析都叫多元方差量的分析,二元以上的方差分析都叫多元方差分析。分析。双变量统计分析双变量统计分析五、一元回归分析五、一元回归分析对相关的两个变量间关系的具体形态的一种深对相关的两个变量间关系的具体形态的一种深入分析。入分析。1 1、一元回归模型:对于已知相关的两个变量一元回归模型:对于已知相关的两个变量x x与与y y,假设它们之间是一种线性关系。,假设它们之间是一种线性关系。2 2、散点图与回归直线:直观地看出散点图与回归直线:直观地看出x x与与y y关系关系形态。形态。3 3、回归系数与回归系数与相关系数:都是描述两个定相关系数:都是描述两个定距变量间的线性关系的指标。距变量间的线性关系的指标。4 4、回归分析的作用:回归分析模型是一种因回归分析的作用:回归分析模型是一种因果关系模型,作用大于相关分析。增加了预测果关系模型,作用大于相关分析。增加了预测功能。功能。第三章结束