资源描述
心理统计
心理统计
n 描述统计
n 描述统计学主要研究如何整理科学实验或调查得来的大量数据,通过图表的形式描述一组数据的全貌,并计算出一些统计特征
n 推断统计
n 推断统计学是研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。
描述统计 1.统计图表 2.集中量数 3.差异量数 4.相对量数 5.相关量数
1-1、统计图表
n 数据的初步整理:数据排序、统计分组
n 次数分布表:简单次数分布表、分组次数分布表、相对次数分布表、累加次数分布表、双列次数分布表、不等距次数分布表。
n 次数分布图:直方图、次数多边形图、累加次数分布图、条形图、圆形图、线形图、散点图。
1-2、集中量数 1.算术平均数 2.众数 3.中数
算术平均数
n 总体平均数
n 样本平均数
算术平均数的性质
算术平均数主要适用于等距以上数据,但不适用于类别数据和顺序数据。优点是反应灵敏、计算严密、计算简单、简明易解、适合进一步用代数方法演算、较少受抽样变动的影响;缺点是易受极端数据的影响、若出现模糊不清的数据时,无法计算平均数。计算和应用平均数时应遵循的原则:同质性原则、平均数与个体数值相结合的原则、平均数与标准差、方差相结合的原则。
中数
n 中数也叫中位数,是一组数据中按从小到大排序后,处于中间位置上的变量值。它将全部数据分成两部分,每个部分各包含50%的数据。
n 中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势。也适用于等距以上数据。但不适用于类别数据。
将全部数据排序后,如果项数是奇数,则正中央的那一项即为中位数;如果项数是偶数,则正中央的那两项的平均值即为中位数。
中数优点:计算简单,容易理解。缺点:反应不灵敏、受极端值影响、受抽样影响较大、不能做进一步代数运算
众数
众数是一组数据中出现次数最多的变量值。用Mo表示,它是一个位置代表值,主要用于测度定类数据的集中趋势,也适用于定序、定距和定比数据的集中趋势的测度值。优点是不受极端值的影响,缺点是反应不灵敏、不能做进一步代数运算、受样本变动影响。
1-3、差异量数 1.离差与平均差 2.方差与标准差 3.变异系数(差异系数)
离差与平均差
离差:也叫离均差,
平均差:也称平均离差,是各变量值与其均值离差绝对值的平均数,用MD表示。计算公式为:
方差与标准差
方差是各变量值与其均值离差平方和的平均数,是测度等距以上数据离散程度的最主要方法。标准差是方差的平方根
总体方差和标准差
样本方差与标准差
方差、标准差的性质:
(1)若y=x+c , x和y是随机变量,c为常数,
则
(2)若y=cx, c为常数,
则
样本方差与总体方差的区别:
(1)在计算上,总体方差是用数据个数或总频数去除离差平方和,而样本方差则用样本数据个数或总频数减一去除离差平方和;
(2)样本方差是统计量,用S2表示;总体方差是总体参数,用s2表示。
(3)当n很大时,S2与s2相差很小,前者是后者的无偏估计。
变异系数
n 也称差异系数、离散系数,标准差系数,是一组数据的标准差与其相应的均值之比。
n 变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。
n 变异系数可用于同一团体不同测量的变异的比较,也可用于不同团体同一测量的变异的比较。
1-4、 相对量数 1.百分位数 2.百分等级 3.标准分数
百分位数
次数分布中对应于某个特定百分点的原始分数。第m百分位是这样一个值,它使得至少有m%的数据小于或等于这个值,且至少有(100-m)%的数据项大于或等于这个值。
百分等级分数
次数分布中低于某个原始分数的次数百分比,用PR表示。
求百分位分数是先确定某个百分点m,然后去求相应的百分位分数Pm 。而求百分等级分数正好相反,事先知道次数分布中的一个原始分数,再求该分数在分布中所处的相对位置。
标准分数
标准分数也叫基分数、Z分数,它是以标准差为单位,可以给出一个原始分数在一组数据中的相对位置。
Z分数的性质:
1.Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。
2.一组原始分数转换得到的Z分数可以是正值,也可以是负值。
3.一组原始分数中,各个Z分数的标准差为1。
4.若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布。
Z分数的应用:
1.比较分属性质不同的观测值在各自数据分布中相对位置的高低。
2.当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以表明在总体中的位置。
3.表示标准测验分数 z’=az+b
4.异常值(极端值)的取舍
1-5、相关量数 1.积差相关 2.等级相关 3.肯德尔和谐系数
4.点二列相关 5.二列相关 6.j 相关
相关
n 相关:即两类现象在发展变化的方向与大小方面存在一定的联系,不同于因果关系和共变关系。
n 相关类别:正相关、负相关和零相关
n 相关系数,用来表示相关关系强度的指标。去职范围在正负1之间。
n 如何通过散点图直观地判断两个变量的相关
n 计算相关系数时应该注意的问题
n 相关系数受样本容量n的影响,样本相关系数需要检验
n 存在相关关系不一定存在因果关系
n 没有线性相关,不一定没有关系,可能是非线性的。
积差相关
n 适用条件:两变量等距、正态、连续并且具有线性关系(成对数据不宜少于30对)
斯皮尔曼等级相关
n 适用条件
n 适用于只有两列变量,而且是属于等级变量性质的具有线性关系的资料,主要用于解决称名数据和顺序数据的相关问题。
n 等距、等比数据而总体非正态
n 优缺点
n 对总体分布不做要求,适用面广
n 与积差相关相比,精度稍差
n为等级个数,D指二列成对变量的等级差数
肯德尔和谐系数(肯德尔w系数)
适合于k个评价者对n个被评价事物进行等级评价的资料。
§ 计算评价者一致性系数
点二列相关
§ 适用资料:两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量是二分成名变量
§ 多用于评价由是非类测验题目组成的测验的内部一致性等问题。
§ 计算公式
取值在正负1之间,相关越高,绝对值越接近1.00
二列相关 在测验中,常用于对项目区分度指标的确定
§ 适用于两列数据都为正态分布,其中已列为等距或等比的测量数据,另一列变量为人为的二分变量。
n 二列相关与点二列相关的主要区别在于二分变量是否正态
j 相关
n f相关的适用资料是除四分相关之外的四格表资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。
取值小于0.3,表示相关较弱,取值大于0.6,表示相关较强
推断统计 1.推断统计基础 2.参数估计 3.假设检验 4.方差分析
5.回归分析 6.卡方检验 7.非参数检验
2-1、推论统计基础
1.概率基础 2.正态分布 3.二项分布 4.抽样原理与抽样方法 5.抽样分布
1、概率基础
n 试验与事件:随机现象简称为随机事件或事件
n 事件的概率定义:表明随机事件出现可能性大小的客观指标
n 常用排列组合公式
n 概率的性质与运算法则
n 条件概率与独立事件
n 加法公式、乘法公式
n 概率分布类型
概率分布类型:
依随机变量是否具有连续性划分为离散分布和连续分布;依分布函数的来源划分为经验分布与理论分布;以概率分布所描述的数据特征划分为基本随机变量分布与抽样分布。
常用排列组合公式:
概率的性质与运算法则
§ 概率的性质
§ 非负性。对任意事件A, 0£ P(A)£1
§ 规范性。必然事件的概率为1,不可能事件的概率为0。P(W)=1,P(f)=0
§ 可加性。若A,B互斥,则P(AÈB)=P(A)+P(B)
§ 概率运算
§ P(A)+P( Ac)=1
§ 加法公式: P( AÈB)=P(A)+P(B)-P(AÇB)
条件概率与独立事件
条件概率:当某一事件B已知发生时,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率,记为P(A|B)。
乘法公式:
P(AB)=P(B)P(A|B)
P(AB)=P(A)P(B|A)
独立事件
n 两个事件中不论哪个事件发生与否并不影响另一个事件发生的概率,称这两个事件相互独立。
n 两个事件A、B是相互独立的,当且仅当,P(AB)=P(A)P(B)
n 独立事件与相斥事件的区别
2、正态分布
n 一般正态分布的图形特点
n 标准正态分布
n 一般正态分布的标准化转换
n 标准正态分布表及其应用
图形特点
1) f(x)³0,整个密度函数都在x轴的上方;
2)曲线对称,平均数,中数,众数三者相等,x= m处达到最大值
3)曲线的陡缓程度由s决定, s越大,曲线越平缓; s越小,曲线越陡峭。X趋向于无穷时,曲线以x轴为其渐近线。
4)正态曲线下面的面积为1,平均数左右各为0.5;
5)正态分布曲线下,标准差与概率(面积)有一定的关系: m±1 s内,概率为0.6826;
m±1.96s内,概率为0.95; m±2s内,概率为0.9545;
m±2.58s内,概率为0.99 m±3s内,概率为0.9974
标准正态分布
m=0, s=1时,有相应的正态分布N(0,1)称为标准正态分布. 通常用j(x)表示概率密度函数。任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.
正态分布表
即:标准正态分布函数f(x)的数值表;
将一般正态分布化为标准正态分布,通过查表可解决正态分布的概率计算问题。使用正态分布表可作如下计算:
1)依据Z分数求概率; 如Z=1时,p=0.3413
2)知道概率求Z分数;如p=0.2517时,Z=0.68
3)已知概率或Z分数,求概率密度值f(x)
4)知道Z分数,求原始分数,x=.m+Zs
3、二项分布
n 二项分布的定义及满足的条件
n 二项分布的概率计算公式
n 二项分布的总体均值与方差
n 用二项分布解决实际问题
二项分布的定义及满足的条件
1)试验中仅有两种不同性质结果的概率分布,即两个对立事件的概率分布
2)每一次试验只有两个可能的结果,“成功”和“ 失败”;
3)出现“成功”的概率p是相同的,“失败”的概率q也不变;
p+q=1
4)试验是相互独立的。
符合上述条件的n次重复独立的试验为n重贝努里试验或二项试验。
二项分布的概率计算公式
X表示n次重复独立试验中事件A(成功)出现的次数
二项分布的期望值和方差
E(X)=np
D(X)=npq
4、抽样原理与抽样方法
n 总体、个体、样本、样本容量
n 参数与统计量的区别和联系,常见的参数与对应的统计量。
n 几种抽样方法:简单随机抽样、分层抽样、整群抽样、系统抽样
5、抽样分布
n 抽样分布的含义
n 样本均值分布及其中心极限定理
n 几种常见的抽样分布:样本均值分布、样本方差的分布、样本方差比的分布
n 几种常见的理论分布:正态分布、t分布、卡方分布和F分布,并且能熟练查上述四个表。
中心极限定理:
设从均值为m,方差为s2(有限)的任意一个总体中抽取大小为n的样本,当n充分大时(n³30),样本均值X的抽样分布近似服从均值为m,方差为s2/n的正态分布。
样本方差的分布
设X1,X2,…,Xn为来自正态分布N(m,s2)的样本,则从数学上可以推导出正态总体下样本方差S2的分布为:
2-2、参数估计
1.点估计、区间估计与标准误 2.总体平均值的估计 3.标准差与方差的区间估计
1、点估计、区间估计与标准误
n 点估计、区间估计的定义,二者的优缺点及联系
n 一个好的点估计应满足的条件:一致性、无偏性、有效性和充分性
n 置信度、置信区间、显著性水平
n 标准误:广义-统计量的标准差;狭义-样本均值分布的标准差
n 2、总体平均值m的估计
n 方差已知
n 总体正态,无论样本n的大小
n 总体非正态,大样本n>30
n 方差未知
n 总体正态
n 总体非正态,大样本n>30
3、标准差与方差的区间估计
n 要求X服从正态分布
总体方差的估计
总体标准差的估计
2-3、假设检验 1.假设检验的原理 2.样本与总体平均数差异的检验 3.两样本平均数差异的检验 4.方差齐性检验 5.相关系数的显著性检验
1、假设检验的原理
n 区间估计与假设检验的关系
n 假设检验中的小概率原理
n 零假设与备择假设
n 两类错误
n 单侧检验和双侧检验,区分它们并注意二者临界值的不同
n 假设检验的一般步骤
假设检验的步骤:
1. 建立原假设和备择假设;
2. 确定适当的检验统计量;
3. 指定检验中的显著性水平;
4. 利用显著性水平根据检验统计量的值建立拒绝原假设的规则;
5. 搜集样本数据,计算检验统计量的值;
6. 作出统计决策
将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设。
2、样本与总体平均数差异的检验
n 零假设和备择假设:H0: m =m0, H1: m¹m0
n 方差已知,总体正态或非正态大样本,
§ 方差未知
§ 总体正态
§ 总体非正态
3、两样本平均数差异的检验
n 零假设与备择假设H0: m 1=m2, H1: m1¹m2
n 方差已知
n 独立样本
n 总体正态或非正态大样本
相关样本
n 总体正态或非正态大样本
n 方差未知
n 总体正态
n 独立样本
n 方差相等
n 方差不等
n 相关样本
n 总体非正态,大样本
n 独立样本
n 相关样本
4、方差齐性检验
n 一个未知总体方差与一个已知总体方差的检验
两个未知总体方差的检验
5、相关系数的显著性检验
• H0:r=0
• H0:r= r0
• H0:r1= r2
2-4 方差分析 1.方差分析的原理与基本过程 2.完全随机设计的方差分析
3.随机区组设计的方差分析 4.两因素方差分析 5.事后检验
1、方差分析的原理与基本过程
1.因素、因素水平、因变量、平方和、自由度、均方 2.零假设、备择假设
3.变异的分解 4.方差分析的步骤 5.方差分析应满足的条件
方差分析应满足的条件
(1) 总体正态分布 总体、每个子总体服从正态分布;
(2) 变异的可加性 总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。
(3) 各处理内的方差一致(方差齐性)
总体、各子总体的方差相等。各实验处理内的方差彼此应无显著差异。这是方差分析中最重要的假定。若不能满足,原则上不能进行方差分析。
方差分析的步骤
1.建立假设 2.求平方和 3.确定自由度 4.求均方 5.进行F检验 6.列出方差分析表
2、单因素完全随机设计的方差分析
n SSt=SSb+SSW
3、随机化区组设计的方差分析的步骤:
(1)建立假设
H10:所有k个出来的总体平均数是相同的,即不存在处理效应。
H20:a个区组的总体平均数是相同的,即不存在区组效应。
(2)求平方和
(3) 自由度
(4) 均方
(5) 进行F检验
(6) 列出方差分析表
随机区组设计(单因素)的方差分析表
变异来源
平方和
自由度
均方
F
临界值Fa
处理(组间)
SSb
k-1
MSb= SSb /(k-1)
Fb= MSb / MSe
区组
SSr
a-1
MSr= SSr /(a-1)
Fr= MSr / MSe
误差
SSe
(k-1)(a-1)
MSe= SSe /(k-1)(a-1)
总变异
SSt
N-1
4、两因素方差分析
几个基本概念(1)因素和水平(2)主效应与交互作用
(3)总平方和的分解 (4)简单效应
在两因素的完全随机设计中
5、事后检验
2-5 回归分析
n 一元线性回归分析
n 一元线性模型
n 模型的基本假设:线性、正态性、独立性、误差等分散性
n 估计回归方程的截距b0和斜率b1
n 一元线性回归方程的检验
n F检验
n 决定系数
n 一元线性回归方程的应用
n 预测:均值的预测、单个值的预测
n 控制
2-6 卡方检验
n 1、拟合度检验(一个类别变量)
2、独立性检验(两类别变量)
• 零假设:两变量独立,备择假设:相关
• 计算期望次数
• 计算卡方值
• 自由度df=(R-1)(C-1)
2-7 非参数检验
n 非参数方法的优缺点
n 独立样本均值差异的非参数检验
n 秩和检验法
n 中数检验法
n 相关样本均值差异的非参数检验
n 符号检验法
n 符号等级检验法
17
展开阅读全文