资源描述
心理统计
1. 描述统计:①是把实验中所得到的数据概括的整理,从中得出实验者可利用的信息。
②常用表和图将实验数据形象地表示出来。
③描述统计的指标有三类:集中量数(一组数据具有代表性的指标,如:平均数、中数、众数等),差异量数(一组数据分散程度的指标,如四分差、标准差、方差),数据间的相关(成对的两组数据之间的关系的指标)。
2. 推论统计:①就是从样本的数量特性去推论总体数量。它包括一系列的统计程序,如:推论假设,推论的方法和步骤,检验推论可靠性的各种方法等。
②将研究对象的全部称为总体
③从总体中抽出的参与实验的部分称为样本
在心理实验中,主要有三种变量:自变量、因变量、控制变量
常用的数据分为两类:计数数据、测量数据
计数数据:①是准确数,它是一个一个数出来的。
②计数数据表示在数轴上只占点,如:1,2,3,….数据形式为计数数据的变量称为离散型变量。
测量数据:①是近似数。测量数据是通过测量工具得到的。
②数据形式为测量数据的变量,称为连续性变量。
用表整理实验数据
常用的表格有三种:原始数据表(原始记录表)、次数分布表、实验结果表
3. 组距:①每一组上限和下限的差。
②上限就是小组的最高数值加上半个单位;
②下限就是小组的最低数值减去半个单位(组距习惯上常用2,3,5,10或10的倍数)
直条图
常用的图 直方图 上下限标点 必须从0开始
曲线图(折线图)多边图:横轴用各组中点,纵轴以各组数据个数或百分数标点,形成封闭图形 累积曲线图:横轴以组上限为标点,纵轴以次数和百分数,形成越来越高的曲线
当横坐标代表的数据是计数数据时只能画直条图和直方图。
当横坐标代表的数据是测量数据时,可以画直方图和曲线图。
4.正态分布又称正态曲线或钟形分布。
①它是连续性随机变量的概率分布形态。
②是一个单峰曲线,中间高,两边逐渐下降,在正负一个标准差的地方有拐点,两端永远不与横轴相交,两侧完全对称的钟形曲线
Y=1/√2∏*e-x2/2
5.分峰分布:在作完图形之后,有时会发现作出的曲线出现了高低差不多的两个峰。这时就好生生了双峰现象。产生原因:①分组时组距不当
②数据中混有性质不同的两种数据
当多数数据集中在曲线的一端,而少数数据在曲线的另一端,数据分布的形态就产生了偏斜。当偏斜的一边趋向正数的方向时,叫正偏态。当偏斜的一边趋向负数作出的方向时,称为负偏态。
6. 中点:X’。假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是在某一组的下限和上限中间的那一点数值。中点=组上限+组下限/2
集中量数:①表示数据集中趋势的指标叫做集中量数,
②它是一组数据的代表值,比起个别数据来,更能准确地反映所研究的事物和现象的真实情况,是真值最好的估计值。
③常用的集中量数有三种:平均数、中数、众数。
平均数:①是指算术平均数,符号,集中趋势的重要指标,表示一组数据的平均值。
②当数据比较集中,分布比较均匀,没有极端数值,我们就用平均数来代表这组数据的集中趋势。
③平均数是集中趋势中代表性最大,最稳定的数据指标。平均数公式:
X̅=∑FX’/N
极端数值:在一组数据中存在特别大或特别小数值。
当数据中出现极端数值,就不适宜用平均数来表示集中趋势,而应该改用中数。
加权平均数:已知几组数据各自的平均数,又知道这几组的数据个数不相等时,需要计算总平均数,就一定要用加权平均数的方法计算总平均数。
10-1加权平均数---简单应用
概念:加权平均数符号。已知几组数据各自的平均数,又知道这几组的数据个数不相等时, 需要计算总平均数,就一定要用加权平均数方法计算总平均数。
公式: X̅W:加权平均数
使用加权平均数的条件:已知各组平均数,各组人数不相等
求加权平均数的注意事项:一定要写单位
加权百分数公式:
9. 中数:符号Mdn,①是一组按大小排列的数据中位置居中的那个数,它将数据分为大的一半和小的一半。
②当数据存在有极端数值时,我们就用中数来表示数据的集中趋势。
③中数使用的条件:当一组数据有极端数值时,用中数表示极端数值
计算步骤:排序、找位置(位置=(n+1)/2)、求值。
计算步骤:排序、找位置(位置=(n+1)/2)、求值。
利用下限计算: Mdn=L+(N/2-Fb/fmdn)I L:为中数所在组的下限;Fb:为中数所在组以下各组数据个数之和; fmdn:中数所在组的数据个数
利用上限计算:Mdn=U-(N/2-Fa/fmdn)I u:数所在组的上限;fa:中数所在组以上各组数据个数之和 i:组距
10. 众数:符号Mo。众数就是在数据中出现次数最多的那个数。使用它可以最快地了解数据的集中趋势,但它是一个较粗糙和极不稳定的指标,在正式研究结果中很少采用。需要很快地知道集中趋势时,需要使用众数。
11. 全距:①是一组数据中最大的数值的上限与最小数值的下限的差。
②它是最简单的差异量数。
③全距大,差异大;全距小,差异小,数据较集中。
使用时注意:1、无极端值;2、比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才能使用
12. 离中趋势:①是表示一组数据的值是差不多一般大小,还是大的大、小的小差异悬殊。数据之间的这种差异称为离中趋势,
②表示离中趋势的指标叫差异量数,
③常用的指标有:全距,四分差,平均差和标准差、离中系数等。
13. 四分差(Q):①是数据的离中趋势的指标之一。
②四分差表示按大小顺序排列的一组数据中间50%个数据的分散程度的指标 ③Q=Q3-Q1/2 Q1:25%百分点 Q3;75%百分点
Q2位置(N+1)/2 Q1位置(N+1)/4 Q3位置(N+1)3/4
10-2四分差计算—简单应用
(录音第9课)
定义:四分差:符号Q;表示按大小顺序排列的一组数据中间50%个数据的离散程度的指标。
使用条件:当一组数据中存在极端数值,集中量数就用中数,离中量数就须用四分差。
计算步骤:(1)排序
(2)找位置(Q1、Q2、Q3):Q2=(n+1)/2;Q1=(n+1)/4;Q3=(n+1)3/4;
(3)求Q1、Q2、Q3的值。
(4)用求Q。
判断原理:成绩好坏反应快慢等用集中量数指标;比较分散程度或平均数代表性用离中量数。
依据:Q大,数据分散,平均数代表性小;Q小,数据集中,平均数代表性大;
见:课本4-3(见P41)
例1:两组被试做同一次心理测验,各人得分如下表:
被试
一
二
三
四
五
六
七
八
甲组
4
7
6
8
3
7
16
5
乙组
12
6
10
9
8
10
5
6
(1)分别计算甲乙两组Q1、Q2、Q3
(2)比较两组被试测试成绩。
(3)比较两组被试成绩分散程度,哪一组平均数代表性大。
先做甲组:甲组的顺序:3、4、5、6、7、7、8、16
因为有极端数值16,所以计算中数,离中量数用四分差。
做题时直接标上箭头(不用写找位置的公式)
求值:Q1=4.25;Q2=6.5;Q3=7.75;
利用公式求Q:==1.75
计算乙组:乙组的顺序:5、6、6、8、9、10、10、12
求值:Q1=6.25;Q2=8.5;Q3=10.75;
利用公式求Q:==2.25
解(1):甲组Q1=4.25;Q2=6.5;Q3=7.75;
乙组:Q1=6.25;Q2=8.5;Q3=10.75;
解(2):因为有极端数值,比较两组被试测验成绩,我们选用集中量数指标中数来比较。因为甲的中数为6.5,乙的中数为8.5,因为甲组小于乙组,所以乙组成绩较好。(不知道为什么录音上乙组中数算得是7,有可能是乙组数据我听错一位,不过知道怎么解题就成了)
解(3):因为有极端数值,集中量数用中数,离中量数须用四分差来比较分散程度。Q大,数据分散,平均数代表性小;Q小,数据集中,平均数代表性大。因为Q甲=1.75,Q乙=2.25,所以乙组成绩分散,甲组平均数代表性大。
例2:两组被试解决问题所用时间如下表(单位:分钟):
被试
一
二
三
四
五
六
甲组
4
2
45
1
5
3
乙组
7
1
5
3
9
11
(1)甲乙两组中数和Q。
(2)哪一组解决问题快。
(3)哪一组分散。选用比较指标。
求甲组,首先排序:1、2、3、4、5、45
记得标上箭头
中数(Mdn)=Q2=3.5
Q1=1.75;Q3=15
利用公式求Q:==6.625
求乙组:首先排序:1、3、5、7、9、11
中数(Mdn)=Q2=6
Q1=2.5;Q3=9.5;
利用公式求Q:==3.5
解(1)甲组中数为3.5,Q=6.625;乙组中数为4,Q=3.5
解(2)因为有极端数值,所以选用集中量数指标中数来比较。甲组中数为3.5小于乙组中数6,所用时间较少,所以甲组解决问题快。
14. 百分点:某个百分等级上的具体数值。PP=LP+i(PN/100-Fbpd)/FP
PP百分点;LP该百分点所在组的下限;P百分位;FBP百分点所在组下限以下数据个数之和;FP百分点所在组数据个数
15. 百分等级:又叫百分位,是将数据从小到大排列,每个数据所在的位置(累加到的序号)与全部数据个数的百分比。
RX=100﹝FX(X-LX)+Fbx*i﹞/n*I RX某数值的百分位;FX所求百分位的数值所在组的数据个数;X所求百分位的数值LX某百分点所在组的下限FBX某百分点所在组的下限以下数据个数之和
16. AD:平均差,它是离中量数指标,,这个公式表示每个数与平均数的差的绝对值和的平均值。
17方差:符号S2,又称变异数,它是离中量数常用指标,,它是以数据中每一数值与均值的差的平方和的均值作为离散程度的指标。
标准差:符号是S,是离中量数常用指标,,表示每个数与平均数的差的平方和的均值的正方根。
18. 离中系数(cv):就是表示数据分散程度的相对量。当两组数据的单位不同、平均数相差过大时,应用离中系数比较。CV=S/X̅*100
19. z分数(标准分数):是以标准差为单位所表示的原始分数(x)与平均数的偏离,也可以说是一个以标准差为单位来表示的偏离分数。Z=(X-X̅)/S S标准差
z分数的性质:(z分数的平均数等于0),或S=1(z分数的方差和标准差等于1)
20.T分数就是以平均数为50,标准差为10进行转换后的分数:公式:T=50+10(z)
例:某班100人,语文考试成绩=60分,S=8分。
(1)求55分和75分的标准成绩.
(2)假设服从正态分布,高于76分的人占全部人数的百分之几?
(3)低于52分的人,占全部人数的百分之几?
解(1):利用公式求标准成绩。
==-0.625
==1.875
解(2):==2
查正态分布表z=2较小部分的面积是0.0228,所以高于76分的人占全部人数的2.28%
解(3)==-1
查正态分布表z=|-1|较小部分的面积是0.1587,所以低于52分的人占全部人数的15.87%
Z分数在统计检验中的重要临界值,即两事物差别显著不显著的分界线。
1.65是单侧检验,.05显著水平的临界值;(Z分数为1.65时,大面0.95,小面0.05)
2.33是单侧检验,.01显著水平的临界值;(Z分数为2.33时,大面0.99,小面0.01)
1.96是双侧检验,.05显著水平的临界值;(Z分数1.96时正态曲线下两端各有0.025面积)
2.58是双侧检验,.01显著水平的临界值;(Z分数2.58时正态曲线下两端各有0.005面积)
统计上常.05和.01作为检验的显著性水平的概率。
17. 相关程度:指相关是否密切,可分为无相关;部分相关;完全相关。
18. 相关:变量之间存在某种相互关系,相关按性质分为正相关和负相关,相关按程度上分为完全相关、部分相关和零相关。
是描述两种数量关系的一个指标,如果一个变量随另一个变量的增加(减小)而增加(减小),则两个变量之间存在着相关。
正相关:①两个变量变化方向一致
或②一个变量增加,另一个变量也跟着增加,一个变量减少,另一个变量也跟着减少,所以两个变量向同一方向变化,这两个变量呈正相关。例如数学成绩好,会计工作业绩也好,这两个则呈正相关。
负相关:(两个变量变化方向不一致或向相反方向变化为负相关。)
一个变量增加,另一个变量减少,一个变量减少,另一个变量则增加,所以两个变量向相反方向变化,这两个变量呈负相关。例如旷课天数越多,成绩越差,这两个则呈负相关。
散布图:用来表示两个变量之间相关性质和相关程度的图解叫散布图。
积差相关:符号r,公式,又称皮尔逊相关系数或称皮尔逊r,它是通过两个变量z分数或标准分数的乘积之和的平均数计算出来的来表示两个变量相关性质和相关程度的数字指标。(它是利用两列变量的标准分数计算出来的,表示变量之间相关性质和程度的指标。)
等级相关:符号为,公式(此公式不用记和写),又称斯皮尔曼等级相关,通过下面是8个被试在镜画的试验中,画一遍所需要的时间和错误次数如下表:
被试
一
二
三
四
五
六
七
八
时间(秒)
1
4
4
5
5
5
7
8
错误次数
9
7
7
5
4
6
2
1
(1)两组数据转化为等级。
(2)利用公式求
(3)根据说明时间和错误次数的相关性质和程度。
解(1):按从大到小排等级,求D,求D2
被试
一
二
三
四
五
六
七
八
时间(秒)
1
4
4
5
5
5
7
8
R1
8
6.5
6.5
4
4
4
2
1
错误次数
9
7
7
5
4
6
2
1
R2
1
2.5
2.5
5
6
4
7
8
D
7
4
4
-1
-2
0
-5
-7
D2
49
16
16
1
4
0
25
49
解(2)=
解(3)根据=-0.90说明所需时间和错误次数呈很高的负相关,画一遍所需要的时间越短,错误次数就越多。
两个变量的等级差计算出来的表示两个变量相关性质和相关程度的数字指标。
23. 随机抽选样本:指总体中每个成分都有同等的机会被抽选。
24. 分层抽样:就是使得样本的各种成分与总体一致。在抽样前研究者应对总体的各个成分的数量有所了解。
误差主要有两种:第一种是系统误差,系统误差是由于抽样不当而造成的,用含有系统误差的样本去推论总体,就会产生偏性估计导致推论错误。另一种是随机误差,也叫抽样误差,抽样误差是在实验时随机出现的,是不可控制的因素造成的。随机误差出现的规律是符合概率的原则的,如果样本中只含有随机误差,就可以用来推论总体。为了避免对总体的偏性估计,样本应该随机抽取,随机取样(概念)是指总体中的每一个个体,都有同等的机会被选中。
自由度:符号df,是指在统计推论时,能够独立变化的数据的数目。公式表示为n-1。
样本分布:从总体随机抽取许多n相等的样本,由这些样本各自的统计量分别可以构成各个统计量的次数分布,称为该统计的样本分布,最常用的是平均数的样本分布。大样本:样本容量n≥30的样本,为大样本,呈正态分布;小样本:样本容量n<30的样本,为小样本,呈t分布;
平均数的标准误:符号,平均数样本分布的标准差称为平均数的标准误,表示构成平均数样本分布的所有平均数的离散程度。
公式:和
平均数差异的样本分布:是指分别来自于两个总体的许多对随机样本平均数的差异形成
的样本分布。当样本容量大于30时,该分布呈现为正态分布,当样本容量小于30时,呈现t分布。
平均数差异的标准误:符号,表示构成差异的样本分布的所有差值的离散程度。是由两个总体各自的平均数标准误合成的。
.6826置信区间:
.95置信区间:
.99置信区间:
区间估计最常用的是.95置信区间、.99置信区间。.95、.99称为置信度。
第八章
30. 虚无假设:符号HO,①从无差别开始假设,假设样本和总体的差异仅仅是抽样误差,是符合概率原则的随机误差。
②样本与总体不存在真正的差异,样本与总体的实质等于0,
③因此,虚无假设也叫做零假设或称为无差异假设。
备择假设:符号HA,①备择假设是从有差别开始假设。假设样本和总体的差异不仅仅有抽样误差,还包括样本与总体真正的差异,
②样本与总体的实质差异不等于零,备择假设也叫差异假设。
显著水平(ɑ或P):①是人为选择的推翻虚无假设的概率
②在统计检验中用P来表示,常用的有.05和.01显著水平
③如果.01<P≤.05,该差异就在.05水平上显著,如果p≤.01,该差异就在.01水平上显著。
第一类错误:是指当虚无假设不应被推翻时而被推翻了,即将随机误差当成了真正的差异。
第二类错误:指当应该推翻虚无假设时而没有推翻,即将存在的真实差异当成了随机误差。
第九章
两个总体没有差异:当比较不同总体是否存在差异时,需要分别从不同总体中抽取样本,计算出各自的样本平均数,两个总体的样本平均数之间总会存在差别,这个差别里如果仅包含抽样误差,说明两个总体没有差异,是相同的总体或者是同一总体。
两个总体存在差异:当比较不同总体是否存在差异时,需要分别从不同总体中抽取样本,计算出各自的样本平均数,两个总体的样本平均数之间总会存在差别,这个差别里如果不仅包含抽样误差,还包含来自自变量不同水平的影响,就说明两个总体存在差异,两个样本来自不同总体。
被试间实验设计:每个被试只参加自变量一个水平的实验,两个实验条件各自独立,所得的数据是不相关的,所得的样本称为独立样本。
被试内实验设计:每个被试参加自变量所有水平的实验,每个被试被多次测量,两个实验条件之间不独立,因此所得的数据是相关的。
方差一致性检验:①是判定两个样本是否来自方差一致的总体。
②如果两个样本不是来自方差一致的总体,一个总体的数据比较分散,一个总体的数据相对集中,它们的总体平均数的代表性就不一致,分散的数据平均数代表性就小,集中的数据平均数代表性就大。
是单侧还是用双侧是事先确定的
双侧检验:①当研究的问题仅仅是回答某一随机样本是否属于某一总体,或需要检验的两个总体谁强谁弱没有方向性,就会用到双侧检验。
②双侧检验的大样本查正态分布表,临界值.05水平为1.96;.01水平为2.58,小样本则根据不同的df查t表。
单侧检验:①如果研究的是某一样本平均数比总体平均数大还是小,这类研究的问题存在方向性,需要使用单侧检验。
②单侧检验的特点是带有方向性的,它的.05、.01的临界值比双侧检验的小,大样本查正态分布表临界值为:.05水平为1.65;.01水平2.33。小样本根据df查t表,单侧检验比双侧检验容易达到显著性差异。
35. 显著性检验:通过样本平均数的差别来推论总体平均数是否真正存在差别,并确定存在何种水平。
36. 回归:当两种变量间存在着一定程度的相关时,一种变量有向另一种变量的平均数趋近的现象,这种现象叫回归。
37. 回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式,当两个变量部分相关时,有两个回归方程式。
38. 回归系数(byx):由x变量预测y变量的回归方程式的斜率。
当二变量间相关程度越大,预测就越可靠,误差就越小。
如果把两组平均数分别地求出它们的最优的拟合线,从X预测Y和从Y测验X的最佳值就会分别落在这两条线上,这两条线叫做回归线。
最优拟合线叫回归线,这条直线的斜率叫做回归系数(b),这条直线的议程式叫做回归方程式,其通式为:,是预测值,有一定程度的误差,当X和Y的相关系数越大时,误差也就越小。
当r=+1时,预测的数值是较准备的;当∣r∣<1时,预测出的数值总有一定程度的误差。
10-5
39. 当实验的数据有二组或二组以上,而且都是不连续的变量(如个数、次数)时,要检验各组的差异是否显着就须用X2分布来进行计算。
X2读作卡方,它是实际观察次数与假设次数偏离程度的指标。X2越大,偏离程度越大。
X2检验是通过X2分布来计算随机误差的机遇的,X2分布实际上也是随机抽选很多样本,从每个样本计算出一个X2值,X2分布就是这许多样本的X2值的分布。对于t分布来说,自由度和样本的大小有关;而对于X2分布来说,自由度和观察的类别有关。
在用X2检验时,还要注意到一点,那就是当任何假设的次数小于5时,就不宜用X2检验(F<5,不用X2检验)
自变量也称为因素,在实验中只安排一个自变量的实验叫做单因素实验。
统计中用符号表示实验设计时,常用大写英文字母表示因素,如因素A,因素B等;用S表示被试,AS表示单因素被试间设计;SA表示单因素被试内设计,ABS表示表示多因素被试间设计;SAB表示多因素被试内设计,ASB表示混合设计。
进行两个总体平均数是否有差异的显著性检验,通常用t检验或z检验,小样本用t检验,大样本用z检验,如果实验包含3个或3个以上的总体平均数是否有差异的显著性检验,就用F检验,也叫方差分析,如果比较的是3个不连续的变量要用X2检验(卡方检验)
当两个总体没有差异,而统计推论的结论说有差异,就犯了I类错误;当两个总体存在差异,而统计推论的结论说没有差异,就犯了II类错误。
方差有时也称为变异数,是表示一组数据离散程度的统计量。方差的总体参数用符号σ2表示;方差的样本统计量用符号S2表示。在方差分析中,方差用符号MS表示,叫均方。
总变异用MST表示
组间变异符号MSB,称为组间均方,它由三部分构成:处理效应、被试的个体差异和实验误差。
被试的个体差异和实验误差属于随机误差。
处理效应是由自变量引起的因变量的变化,表现为实验中因素的不同水平所带来的变异,所以处理效应是系统变异。
组内变异MSE,称为组内均方,它是由随机误差引起的因变量的变化,由于在每一个组中都会出现这种变异,因此称为组内变异。组内变异由两种误差构成:被试的个体差异和实验误差。
总变异=组间变异+组内变异(MST=MSB+MSE)
F检验(方差分析)的公式:,
F检验(方差分析):利用组间变异和组内变异的比值来检验平均数差异的统计方法叫F检验。公式。(假如F<1,差异不显著)
在方差分析之后还要对实验中的各个总体再进行两两比较,这种比较叫事后检验。
和方(SS):离均差平方和在方差分析里称为和方。
10-8 单因素方差分析—简单应用
单因素被试间F检验的公式
变异来源
SS
df
MS
F
组间A
SSA
k-1
SSA / dfA
MSA/MSE
组内S(A)
SSE
(n-1)k
SSE / dfE
总计
SST
N-1
判断:如果F≥.01水平(查表的值),P≤.01。则平均数差异在.01水平显著
如果.05≤F<.01(查表的值),.01< P≤.05则平均数差异在.05水平显著
如果F<.05(查表的值),P>.05,则平均数差异不显著
例:健康5人,生病5人,测反应时间如下表:
健康者
1
2
2
3
3
患者
3
3
4
5
5
求:(1)健康者和患者的平均反应时间。
(2)填方差分析表。
(3)查表,回答健康者和患者平均反应时间是否显著。
解:(1)秒
秒
(2)完成下列A2S5(意思是2组,每组5人)方差分析表。
变异来源
SS
df
MS
F
P
A
8.1
1
8.1
9.5
.01< P < .05
S(A)
6.8
8
0.85
第一列8.1:
第二列8:根据公式列表中:(n-1)k=(5-1)×2=8
(3)查表得F.01(1,8)11.26,F.05(1,8)5.32,因为F.05(1,8)5.32 < F9.5 < F.01(1,8)11.26,所以 .01< P < .05 ,说明健康者和患者平均反应时间在.05水平上差异显著。
复5:多因素设计方差分析
公式:dfA=KA-1;dfB=KB-1;dfAB=(KA-1)×(KB-1);df(SA)B=(n-1)KAKB
;;;;
;;;
判断:如果F≥.01水平(查表的值),P≤.01。则平均数差异在.01水平显著
如果.05≤F<.01(查表的值),.01< P≤.05则平均数差异在.05水平显著
如果F<.05(查表的值),P>.05,则平均数差异不显著
双因素方差分析检验的公式
变异来源
SS
df
MS
F
组间 A
SSA
k-1
SSA/dfA
MSA / MSE
组间 B
SSB
k-1
SSB/dfB
MSB / MSE
组间 AB
SSAB
dfA×dfB
SSAB/dfAB
MSAB / MSE
组内S (A B)
SSE
(n-1)kAkB
SSE/dfE
例:
观众
有A1
无A2
评价
高B1
低B2
高B1
低B2
错误
5
10
9
7
4
12
6
7
5
11
8
4
8
15
10
6
4
11
7
8
6
11
7
6
ΣX
32
70
47
38
5.3
11.7
7.8
6.3
S2
2.27
3.07
2.16
1.87
X2
182
832
379
250
N
6
6
6
6
ΣX=187 ΣX2=1643 N=24
求(1)填方差分析图。
(2)画交互作用图(见课本P205)
(3)查表,回答A、B两因素主效应平均数差异是否显著。
(4)A、B两因素交互作用是否显著。
解:(1)二因素被试间设计的方差分析表(A2B2S6)
变异来源
SS
df
MS
F
P
A
12
1
12
5.1
.01<P<.05
B
35
1
35
14.9
<.05
AB
92
1
92
39.1
<.01
误差
47
20
2.35
总计
186
23
(3)查表得F.01(1,20)8.10,F.05(1,20)4.35,因为F.01(1,20)4.35 < F5.1 < F.05(1,20)8.10,所以.01<PA<.05,自我评价高低水平在.05水平上显著;因为F14.9 > F.05(1,20)8.10,所以PB>.01水平,说明在有无观众上表现在.01水平上显著。
(4)查表得F.01(1,20)8.10,F.05(1,20)4.35,因为F39.1 > F.01(1,20)8.10,所以PAB>.01水平,说明自我评价高低和有无观众上表现水平两因素交互作用在.01水平上显著。
多因素设计:是指采用两个或两个以上的自变量,且每个自变量都有多个水平的实验设计。
多因素设计和单因素设计的区别:多因素设计会多几个F检验;多因素设计存在交互作用。
主效应:是指单一因素的不同水平对因变量的作用。检验单一因素各个水平的总体平均数有无显著性差异,称为检验各因素的主效应。
交互作用:双因素实验设计中,当一个自变量的几个水平引起因变量的变化在另一自变量各水平上的变化趋势不一致时,就称这两个自变量存在着交互作用,或者说二因素存在交互作用。
参数分析(参数检验):是从样本的统计量来估计总体的参数的这类统计检验叫做参数分析。
非参数分析(排列顺序法):将原始数据按大小排成顺序的方法叫做非参数分析,也叫做排列顺序的方法。
参数分析说明的是总体平均数之间的一种比较精确的差异,而非参数分析则只能说明总体间在某方面大体上是否相同。
ω2:检验实验效果的一种指标,是自变量(X)和反应变量(Y)间联系的强度。ω2的值可以分为三种:(1)ω2≥0.15,联系较强,已经达到显着水平,是可取的;(2)ω2≈0.06,联系为中等,实验效果中等。(3)ω2≤0.01,联系较弱或很弱,统计检验得到非常显著的结果是不可靠的。
检验实验效果的指标d:检验实验效果的一种指标,d代表两组数据分布重叠程度的相反测量。根据d值大小的不同可分三种情况:(1)d值=0.2时,实验效果较小;(2)d值≈0.5时,实验效果中等;(3)d≥0.8时,实验效果较大。
---------------------------------------------------------------------------------------------------------------------------------
10-9 ω2检验
公式:
判断:(1)ω2≥0.15,联系较强,已经达到显着水平,效果是可取的;(2)ω2≈0.06,联系为中等,实验效果中等。(3)ω2≤0.01,联系较弱或很弱,效果差。
10-10 d检验
公式:;;
判断:(1)d值=0.2时,实验效果较小;(2)d值≈0.5时,实验效果中等;(3)d≥0.8时,实验效果较大。
展开阅读全文