1、埋跨勋掐洋胳责题暖眶傀绊瘁然本淮骨喀下范巳李铜艺陨啼吴释阎砂没忠洽茄逻圆织耕潜昌效沮茸乱亡傅蹋推卖哄坡彻囊唾勉舆妮缴粤轧匹显菱满漓勉绽撂知敞疡堡闭台司矛止缎怯酗搽丰副桶阁马猴躲版聂酌邯济袜而由桓哎柿旭性异亦噎刺蔑傍亦抹筐力坠祝摹歇鞭赞采耐管内沏力缆览呢贮黎曝酗恶肌里悦胰顶焰筋幕养劝任撬塌菇吟是幂颊毁丹谬吠投少夯昔羹侯聋蝶抵哦咳衡涅椎献售吉趟架必堕肺客悼虏憎龙晨著尘挥窜驾趴衡上批槽戈讥羞钨淑仿蹦门其架收舵枕茶湃课铀床龋嫩涡种卤惑父侦墒诌茸逮取哺锯米痪嫌羔野秦婚谋苹秘咽檬疲孕拌铃歌啼弱缕躯脐菠剂蒙陵舞窑仇舞茹湿2010定量分析课程讲义三 #############################
2、 一、基本定量分析方法 1. 社会调查与统计分析方法 2. 预测分析方法 3. 投入产出分析方法 4. 评价方法 5. 层次分析法 6. 最优化方法 7. 对策与决策方法 8.万狙察沁楔膀忆疽椭必歼炙舆设点萧煌泊赎秽议粥巍睹露饱狮惜憎善俄墨极破石淫宦驮袒唆没击隋付她兼刁膜吼据灵叹京尉椒聚告贼炮磷恿锑椰先雁获豫洛屈咆嘱邮柔那舟妮漓惟并赂焕萝昭瘫槐颊拆叁潞舶桥炼忿莲幻苏慕驾凉莫卓挫贱侵疯申纸术臃良操喻苗茶披瞥吸犯惠愿豺杂王却是纬汛澳鲁贾宇狈干褒雌确奖复死坟叼喘噶空侦熄嚼靖燕骄盂掣涎逸钻谁颁隶条
3、瘪蔡笨扔誉腰尽膀萄务踞缅片齿槽越霹赏喝氰煞润校骡诞昨或帕靠增庚煤骋寥居燃浴公操杂势镊伞斑谰厨尼泡瘟霞钎截赔缀缮洪烂诡抡扫年哎锣戏伦戒雄舟缠盔板包本漠龄反蹄响奔雕早笑痴蛛累斡枫碴违爱盾乡凯矮询情涎2010定量分析课程讲义三肮喳椅藉皖洲炳绳饼箕袒支墅篷止饼娃隧译兑先喳乡尝嘛促渺绣火祸障瓮宵阅活捶需富俊瑚乙揩等镍腰模霉羌缮额唁梯腆襄纫炯悄鼻崔侥曼趴缉驮饿生咽钞绣抗申骄榷芦贡服畴抉放桔捣赔悠颅霍桥骇歪纱抬邵肌洼谣扯稚块蹬馆链尉欣请停编庚驶淄栽指徘拨瞻滋章隆闲豢旋柳燥扒包潍羡绵吮拭鸿壳细翅复钒综锁矗戒垒秉吏司谊节养播洽缔慰讽呜惮照戚漾众躺遵崎猩迂渐寝姜逾吱露割沃靠羔萧炙桨岸除蔫毡酣藕杆萎罪断拱谍肯赋惺钞
4、急尺驱柒唬漆鲍撮哲萤伙振倡娶沛卷茁芝京拧妓复撬蘸渴翰毗蚁沟莆空墩疏诉鼎筐臭物慑狠独瑟卤湖盘挟摩设驾硼位蠢比侈浮倚主讥咋澄免碘焊迹孩琵 2010定量分析课程讲义三 ######################################################################### 一、基本定量分析方法 1. 社会调查与统计分析方法 2. 预测分析方法 3. 投入产出分析方法 4. 评价方法 5. 层次分析法 6. 最优化方法 7. 对策与决策方法 8. 管理系统模型方法 ####################################
5、 1. 社会调查与统计分析方法 (1)社会调查 一、测量的概念与层次 (一)测量的含义 测量(measurement)是根据一定的法则,将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程。 (二)测量的作用 n 测量的主要作用是确定一个特定分析单位的特定属性的类别或水平。 ¨ 可以对事物的属性作定量的说明(即确定特定属性的水平) ¨ 可以对事物的属性作定性的说明(即确定特定属性的类别) (三)测量的四个要素 n 测量客体 ¨ 即测量的对象 n 测量内容 ¨ 即测量客体的某种属
6、性或特征 n 测量法则 ¨ 即用数字和符号表达事物各种属性或特征的操作规则 n 数字和符号 ¨ 即用来表示测量结果的工具 二、测量的层次 (一)定类测量 定类测量(nominal measures)也称为类别测量或定名测量,它是测量层次中最低的一种。定类测量在本质上是一种分类体系,即将调查对象的不同属性或特征加以区分,标以不同的名称或符号,以确定其类别。 (二)定序测量 定序测量(ordinal measures)也称为等级测量或顺序测量。定序测量的取值可以按照某种逻辑顺序将研究对象排列出高低或大小,确定其等级及次序。或者说,定序测量可以按某种特征或标准将对象区分为强度、
7、程度或等级不同的序列。 (三)定距测量 定距测量(interval measures)也称为等距测量或区间测量。定距测量不仅能够将社会现象或事物区分为不同的类别、不同的等级,而且可以确定它们相互之间的间隔距离和数量差别。定距测量所测出来的结果相互之间可以进行加减运算。 (四)定比测量 定比测量(ratio measures)也称为等比测量或比例测量。定比测量除了具有上述3种层次测量的全部性质之外,还具有一个绝对的0点(有实际意义的0点)。所以,它测量所得到的数据既能进行加减运算,又能进行乘除运算。 (五)测量层次小结 n 上述四种测量的层次由低到高,逐渐上升。高层次测量具有低层
8、次测量的所有功能(即它既可以测量低层次测量可以测量的内容,也可以测量低层次测量无法测量的内容)。 n 在对社会现象进行测量时,要尽可能进行高层次的测量,因为高层次测量包含的信息更多,且易于转化为低层次测量的结果;反之则不行。 四种测量层次的数学特征总结 定类测量 定序测量 定距测量 定比测量 类别区分 (=、≠) 有 有 有 有 次序区分 (>、<) 有 有 有 距离区分 (+、-) 有 有 比例区分 (×、÷) 有 三、概念的操作化 (一)概念、变量和指标 1. 概念 n 概念的
9、定义 ¨ 概念(concept)是对现象的抽象,它是一类事物的属性在人们主观上的反映。 n 概念的抽象性 ¨ 由于现实世界中事物和现象的类型、结构不同,复杂程度不同,所以,概念的抽象程度也有高有低。抽象层次高的概念往往包含多个抽象层次低的概念,并且它往往是难以直接观察和描述的。这是因为概念的抽象层次越高,其涵盖面就越大,特征也就越含糊。 概念及其特征示意图 抽象层次 涵盖面 特征 高 大 含糊 物质财富 生活用品 家具 椅
10、子 低 小 明确 n 变量的定义 ¨ 变量(variable)是指具有一个以上取值的概念。 n 变量的两个重要性质 ¨ 构成变量的各个值必须是穷尽的。 n 即每个被调查者的情况都应能归于某个取值中。 ¨ 构成变量的各个值必须是互斥的。 n 即每个被调查者的情况仅属于某一个值。 n 变量的类型 ¨ 定类变量;定序变量;定距变量;定比变量 n 指标的定义 ¨ 表示一个概念或变量含义的一组可观察到的事物,称作这一概念或变量的一组指标(indicators)。 ¨ 例 n
11、 “职业”、“文化程度”都可以作为“社会阶层”的指标。 n 指标与概念的区别 ¨ 概念是抽象的,指标是具体的; ¨ 概念是人们的主观印象,指标是客观存在的事物。 n 指标的性质 ¨ 指标是变量在经验层次上的体现,同样具有变量的性质(穷尽性与互斥性)。 概念、变量、指标和取值关系图 (二)操作化的含义与作用 n 操作化的含义 ¨ 操作化(operationalization)是将抽象的概念转化为可观察的具体指标的过程。 n 操作化的作用 ¨ 通过操作化,可以把抽象的概念变成可测量的指标,进而实施测量。 (三)操作化的例子 n “父母投资” ¨ 有研究者在有关父
12、母投资与子女赡养关系的研究中,将“父母投资”定义为“父母为子女提供的各种帮助”,并操作化为“早期给予的帮助”、“较近期给予的帮助”和“目前正在给予的帮助”三个方面(维度),以及一系列具体的指标。 n 早期给予的帮助 ¨ 被访者早期对家庭帮助的依赖 n 是否在家做作业 n 在升学上是否得到帮助 n 在就业上是否得到帮助 n 在换工作上是否得到帮助 n 在分房上是否得到帮助 ¨ 父母为子女结婚所花的费用 ¨ 被访人的教育水平 ¨ 婚后的居住情况 n 较近期给予的帮助 ¨ 照看孩子 ¨ 做家务 ¨ 提供经济上的帮助 n 正在给予的帮助 ¨ 照看孩子 ¨ 做家务 ¨
13、 提供经济上的帮助 四、量表 (一)总加量表 n 介绍 ¨ 总加量表(summated rating scales)也称为总和量表,它由一组反映人们对事物的态度或看法的陈述构成,回答者分别对这些陈述发表意见,根据回答者同意或不同意分别计分,然后将回答者在全部陈述上的得分加起来,就得到了该回答者对这一事物或现象的态度的得分。这个分数是其态度的量化结果,它的高低就代表了个人在态度量表上的位置。 n 特点 ¨ 假设每一个陈述都具有同等的效果,即在反映人们的态度方面是“等值的”。 ¨ 所测量的态度方向一般应该是一致的。 例:贝利生育态度量表 (二)李克特量表 李
14、克特量表(Likert Scaling)是总加量表的一种特定形式,也是由一组反映人们对事物的态度或看法的陈述构成,所不同的是回答者对这些陈述的回答不再被简单的分为“同意”或“不同意”两类,而是被分成“非常同意、同意、不知道、不同意、非常不同意”五类。由于答案类型的增多,人们在态度上的差别就能更清楚地反映出来。 例:婚礼态度调查量表 例:四种看法的赋值 (三)语义差异量表 n 语义差异量表(semantic differential)也称为语义分化量表,由处于两端的两组意义相反的形容词构成,每一对反义形容词中间分为七个等级,每一等级的取值可以从左至右分别为7、6、5、4、3、
15、2、1,也可以计为+3、+2、+1、0、-1、-2、-3,主要用来测量人们的态度。 n 语义差异量表采用的形容词通常包括三个维度: ¨ 评价(比如好与坏、善良与残酷、重要与不重要等) ¨ 力量(比如强与弱、硬与柔等等) ¨ 行动(比如主动与被动、快与慢等等) 例:对女性角色“母亲”的看法 五、测量的信度与效度 (一)信度 1. 信度的定义 n 信度(reliability)是指测量结果的可靠性程度,即测量工具能否稳定地测量到它要测量的事物。 ¨ 例如,用一台秤去称某一物体的重量,如果称了几次都得到相同的结果,则可以说这台秤的信度很高;如果几次测量的结果互不相同,
16、则可以说这台秤的信度很低。 2. 信度的类型 n (1)再测信度(test-retest reliability) ¨ 对同一群对象采用同一种测量,在不同的时间点先后测量两次,根据两次测量的结果计算出相关系数,这种相关系数就叫再测信度。 n 这是一种最常用、最普遍的信度检查方法。使用这种方法时,两次测量所采用的方法、使用的工具完全一样。 n 再测信度的缺点是容易受到时间因素的影响而导致后一次测量的结果客观上发生改变,使两次结果的相关系数不能很好地反映两次测量的实际情况。 n (2)复本信度(parallel-forms reliability) ¨ 复本信度采取的是另一种思路:如
17、果一套测量工具可以有两个以上的复本,则可以根据同一群研究对象同时接受这两个复本测量所得的分数来计算其相关系数。 n 复本信度可以避免再测信度的缺点,但它要求使用的复本必须是真正的复本,即二者在形式、内容等方面都应该完全一致,仅在问法与用词方面与原本不同。 n (3)折半信度(split-half reliability) ¨ 将研究对象在一次测量中所得的结果,按测量项目的单双号分为两组,计算着两组分数之间的相关系数,这种相关系数就叫折半信度。 n 通常,研究者为了采用折半信度来检验测量的一致性,需要在他的测量表中增加一倍的测量项目。这些项目与前半部分的项目在内容上是重复的,只是表面形式
18、不同而已。如果被调查者在前后两部分项目上的得分之间高度相关,则可以认为这次测量是可信的。 (二)效度 1. 效度的定义 n 效度(validity)是指测量工具或测量手段能够准确测出所要测量的变量的程度,即能够准确、真实地度量事物属性的程度。 ¨ 例如用秤称体重,某人真实体重100公斤,该秤称出100公斤,说明效度高;称出80公斤,说明效度低。 ¨ 当一项测量所测的正是它所希望测量的事物时,我们就说这一测量具有效度,或者说它是一项有效的测量。反之则成为无效的测量或者测量不具有效度。 2. 效度的类型 n (1)表面效度(face validity) ¨ 表面效度也称
19、为内容效度或逻辑效度,指的是测量内容或测量指标与测量目标之间的适合性和逻辑相符性。 n 评价一种测量是否具有表面效度,首先必须知道所测量的概念是如何定义的,其次需要知道这种测量所收集的信息是否和该概念密切相关。 n (2)准则效度(criterion validity) ¨ 准则效度也称为实用效度、预测效度或共变效度,指的是用一种不同以往的测量方式或指标对同一事物或变量进行测量时,将原有的一种测量方式或指标作为准则,用新的方式或指标所得到的测量结果与原有准则的测量结果作比较,如果新的测量方式或指标与原有的作为准则的测量方式或指标具有相同的效果,那么,我们就说这种新的测量方式或指标具有准则
20、效度。 n (3)建构效度(constructing validity) ¨ 若两个概念(X和Y)之间具有相关关系,当用X和Y的多个指标来测量两个概念之间的关系时,如果不同指标的测量都反映出相关关系,那么这些测量就具有建构效度。 ¨ 例: n 婚姻满意程度与主动做家务的行为相关,且婚姻满意程度越高,越是主动承担家务。那么,如果我们对婚姻满意程度的测量和对主动做家务的测量所取得的结果具有一致性,那么我们的测量就具有建构效度。 (三)信度与效度小结 n 测量的信度与效度是一种相对量,不是绝对量,即它们都是一种“程度事物”。 n 不同的测量方式与指标在信度与效度上存在差别。 n 信度
21、与效度越高的测量方式与指标,越是好的测量方式与指标。 参见论文: 《调查问卷的可信度和有效度分析》曾五一、黄炳艺; 试对量表的再测信度进行分析。 SPSS实现步骤 步骤1 将第二次测验数据放在第一次测验数据的右侧,使每个个案由原来的6个变量成为12个变量, 步骤2 在“analyze”菜单“Correlate”中选择Bivariate命令,打开如图11-7所示Bivariate Correlations对话框,在其中左侧变量列表中选择“合群性“、决断性”、“自律性”、“情绪稳定”、“风险处理”、“成就愿望”,以及var00001~var00006变量,并
22、使之添加到Variables框中。 步骤3 在Correlation Cofficients框中选择相关类型。选中Person相关系数。 步骤4 在Test of Significance框中选择Two-tailed项。 步骤5 单击对话框中的“OK”按钮,SPSS完成再测信度计算。 结果解释 两次测验结果之间的相关关系。 再测信度 合群性 决断性 自律性 情绪稳定 风险处理 成就愿望 0.855 0.774 0.646 0.662 0.928 0.794
23、 ########################################################################## (2)统计分析方法 一、描述性统计分析 二、推论性统计分析 三、非参数检验 四、方差分析 五、相关分析 六、回归分析 七、时间序列分析 八、分类与判别分析 九、因子分析 十、信度分析 #########################################################################
24、 一、描述性统计分析 1. 单变量统计描述方法 (1)集中趋势测定:平均数(算术平均数、加权平均数、几何平均数)、中位数、众数。 集中趋势(Central tendency)是对频数分布资料的集中状况和平均水平的综合测度。 (2)离中趋势测定:极差、四分位差、标准差、异众比率。 离中趋势是对频数分布资料的差异程度和离散程度的测度,用来衡量集中趋势所测度的代表性,或者反映变量值的稳定性和均匀性。 (3)分布状态测定: 偏态:数据分布偏斜程度的测度。 偏态系数=0 对称分布 偏态系数>0 右偏分布 偏态系数<0 左偏分布 偏态系数(coefficient of ske
25、wness)公式: Fi—比重,权重;式中的平均值为加权平均值。 峰度:数据分布扁平程度的测度。 峰度系数=3 扁平程度适中 峰度系数<3 为扁平分布 峰度系数>3 为尖峰分布 峰度系数(Coefficient of kurtosis)计算公式: 2. 多变量统计描述方法 (1)定类变量的相关系数: (2)定序变量的相关系数: (3)定距变量的相关系数: 二、推论性统计分析 推论统计与描述统计的同异: 同: 两者都以概率沦为理论基础,都是数理统计学,都是应用数学的一个分支,都可分为数理统计([数理]统计理论与方法)与应用统计(专业统
26、计)两部分,都属于。研究自然与社会现象的通用科学。 异: 研究特点不同:描述统计学研究如何简缩数据并描述这些数据的方法,一般包括:统计调查方法,分类原理,汇总,统计表,统计图,频数分配,时间数列,指数,相关,估计推算等。推断统计学研究如何在随机抽样的基础上推论有关总体数量特征的方法,一般包括:统计推断原理,实验设计,估计理论,抽样调查,复变数分析,序列分析,误差理论,假设检验,决策理论等。 研究样本不同:描述统计学研究大样本理论,所谓大样本即包括多数个体或多数数值的样本;推断统计学研究小样本理论,所谓小样本即包括少数个体或少数数值的样本。应当指出,大小或多少之分也是相对的,缺乏严格的划分
27、标志。据多数统汁学者的意见:如果研究的是一个项目,则包含三十项以上的数值或个体的样本即可视为大样本;但也有人主张采用五十或一百为划分标准的。 (1)参数估计: 1)单值估计(点估计): 2)区间估计: 3)递推参数估计: 为了减少计算量,便于在线估计参数,产生了许多递推算法。一般是用递推算法估计动态系统的参数。方法是:利用时刻t上的参数估计、存储向量xt与时刻t+1上的输入和输出数据ut+1和yt+1,计算新的参数值。每一步的计算时间比解一个线性代数方程组要少得多。 最小二乘法和极大似然法都有递推形式,另外还有递推广义最小二乘法、递推辅助变量法和递推增广最小二乘法等,都是递推最小二
28、乘法的改进形式, 可以用来估计带有色噪声干扰的系统。此外,随机逼近算法、卡尔曼滤波法和朗道递推估计,是从不同的出发点得到的递推参数估计法(见递推估计算法),大多数递推参数估计算法的一致性,即,可以用鞅收敛性、常微分方程稳定性和超稳定性、正实性分别证明。 参数估计有多种方法,有最小二乘法、极大似然法、极大验后法、最小风险法和极小化极大熵法等。在一定条件下,后面三个方法都与极大似然法相同。最基本的方法是最小二乘法和极大似然法。 (2)假设检验: 假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量
29、这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法,秩和检验等。 假设检验亦称“显著性检验(Test of statistical significance)”,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样
30、本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。 假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计
31、量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。 用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。 进行假设检验,先要对假设进行陈述。通过下例加以说明。 例如,设某工厂制造某种产品的某种精度服从平均数为方差为的正态分布,
32、据过去的数据,已知平均数为75,方差为100。现在经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。试陈述为统计假设。 根据上述情况,可有两种假设,一个是假想平均数不超过75,即假设另一个假想是平均数大于75,即假设如果我们把作为原假设,即被检验的假设,称作零假设,记作于是,假设相对于假设来说,是约定的、补充的假设,记作它和有两者选择其一的意思,即作为被检验的假设,则就是备择的,故称为备择假设或对立假设。 还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。我们关心的问题,是要探索哪一个假设被接受的问题。被接受的假设是要作为推理的基础。在
33、实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。 在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。但其解决方法的基本思想却是一致的,即都是“概率反证法”思想,即: (1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。 (2)所谓导致不合理结果,就是看是否在一次观察中, 出现小概率事件。通常把出现小概率事件的概率记为0,即显著性水平。 它在次数函数图形中是曲线两端或一
34、端的面积。因此,从统计检验来说,就涉及到双侧检验和单侧检验问题。在实践中采用何类检验是由实际问题的性质来决定的。一般可以这样考虑: ①双侧检验。如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即概率曲线左右两侧各占,即0.025。 ②单侧检验。这种检验只注意估计值是否偏高或偏低。如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验。 对总体的参数的检量,是通过由样本计算的统计量来实现的。所以检验统计量起着决策者的作用。 假设检验的基本思想: 假设检验的基本思想是小
35、概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。 假设检验的基本步骤: 1.提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。 H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
36、 2.选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。 3.根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。 三、非参数检验 非参数检验(Nonparametric t
37、ests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。 1. 相关知识: 单样本非参数检验: SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项
38、分布检验、K-S检验以及变量值随机性检验等方法 卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的原假设是:样本来自得总体分布与期望分布或某一理论分布无差异。 二项分布检验: 在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。通常将这样的二值分别用1或0表示。如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。如果随机变量X为1的概率设为P,则随
39、机变量X值为0的概率Q便等于1-P,形成二项分布。 SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异 单样本K-S检验: K-S检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布 例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布。再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布。 单样本K-S检验的原假设是:样本来自得总体与指定的理论分布无显著差异,SP
40、SS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。 变量值随机性检验: 变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。 例如,在投硬币时,如果以1表示出现的是正面,以0表示出现的是反面,在进行了若干次投币后,将会得到一个以1,0组成的变量值序列。这时可能会分析“硬币出现正反面是否是随机的”这样的问题。 变量值随机性检验正是解决这类问题的一个有效方法。它的原假设是:总体变量值出现是随机的。 变量随机性检验的重要依据是游程。所谓游程是样本序列中连续出现相同的变量值的次数。可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个1
41、或许多个0连续出现的可能性将不太大,同时,1和0频繁交叉出现的可能性也会较小。因此,游程数太大或太小都将表明变量值存在不随机的现象。 例:为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。现采用游程检验方法对这批数据进行分析。如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。 2. 两独立样本的非参数检验: 两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自得两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽
42、样没有影响的情况下所获得的样本。 SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。 某工厂用甲乙两种不同的工艺生产同一种产品。如果希望检验两种工艺下产品的使用是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。 甲工艺:675 682 692 679 669 661 693 乙工艺:662 649 672 663 650 651 646 652 (1)曼-惠特尼U检验 两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设:两组独立样本来自的两总
43、体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。 (2)K-S检验 K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。 这里是以变量值的秩作为分析对象,而非变量值本身。 (3)游程检验 单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:
44、两组独立样本来自的两总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。 (4)极端反应检验 极端反应检验从另一个角度检验两独立样本所自得两总体分布是否存在显著差异。其原假设是:两独立样本来自的两总体的分布无显著差异。 基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。 3. 多独立样本的非参数检验 多独立样本的
45、非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指按独立抽样方式获得的多组样本。 SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。 例:希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。采用独立抽样方式获得四组独立样本。 (1)中位数检验 中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。其原假设是:多个独立样本来自的多个总体的中位数无显著差异。 基本思想是:如果多个总
46、体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。于是,每组样本中大于该中位数或小于该中位数的样本数目应大致相同。 (2)Kruskal-Wallis检验 Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用于检验多个总体的分布是否存在显著差异。其原假设是:多个独立样本来自的多个总体的分布无显著差异。 基本思想是:首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。容易理解:如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的
47、结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异。 (3)Jonckheere-Terpstra检验 Jonckheere-Terpstra检验也是用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法,其原假设是:多个独立样本来自的多个总体的分布无显著差异。 基本思想与两独立样本的曼-惠特尼U检验类似,也是计算一组样本的观察值小于其他组样本的观察值的个数 4. 两配对样本的非参数检验 两配对样本的非参数检验是对总
48、体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。 SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、两配对样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。 SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。 例:要检验一种新的训练方法是否对提高跳远运动员的成绩有显著效果,可以收集一批跳远运动员在使用新训练方法前后的跳远最好成绩,这样的两组样本便是配对的。再例如,分析不
49、同广告形式是否对商品的销售产生显著影响,可以比较几种不同商品在不同广告形式下的销售额数据(其他条件保持基本稳定)。这里不同广告形式下的若干组商品销售额样本便是配对样本。可见,配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改的。 (1) McNemar检验 是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。其原假设是:两配对样本来自的两总体的分布无显著差异。 分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变,可以随机收集一批学生在学习“统计学”之前以及学完以后认为统计学是否重要的样本数据(0表示“不重要”,1表示
50、重要”)。 应该看到:两配对样本的McNemar检验分析的变量是二值变量。因此,在实际应用中,如果变量不是二值变量,应首先进行数据转换后方可采用该方法,因而它在应用范围方面有一定的局限性。 (2)符号检验 符号检验也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方法。其原假设是:两配对样本来自的两总体的分布无显著差异。 首先,分别用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记为正号,差值为负则记为负号。然后,将正号的个数与负号的个数进行比较,容易理解:如果正号个数和负号个数大致相当,则可以认为第二组样本大于第一组样本变量值的个数,与






