资源描述
考研专业课大纲解析
心理统计学
心理统计大纲解析
一、描述统计
心理统计中常见的基本概念
1.变量及其种类
(1)变量
变量又称随机变量,即不断变化的,可取不同值的量。如实验中出现的自变量、因变量与额外变量
(2)变量与数据的区别
心理统计学中,一旦对变量进行了观测,或者进行了取值,这个数值也就是这个变量的一个观测值,即数据,一个变量可以有无数多的数据值。
(3)变量和数据的分类
1.根据变量性质的划分
①名称变量:如性别、颜色等,也称类目变量,若属性只有两种结果,亦称二分名称变量。其所属数据是计数数据,即各类属的数量。
②顺序变量:按事物的某一属性的大小或多少按顺序排列起来的数据,相邻两个等级的间隔是不等距的,只有等级上的差别,无单位又无绝对0点。
③等距变量:这类数据只有相等的单位,而无绝对0点,如测验分数、温度等。
④比率变量:又称等比变量,是一种既有相等单位,又有绝对零点的变量,如距离、时间、人的身高、体重等。
后三种变量的数据都是用一定的测量工具或测量标准测量时所获得的数据,统称度量数据。
2.根据变量的连续性划分
①连续变量:即可无限划分的变量,如长度可划分为千米、米、厘米、微米等
②离散变量:指测量单位间不能再细分的数据,常取整数,如名称变量
3.根据变量间的关系划分:即自变量、因变量与额外变量的划分
2.统计术语初步
总体是指具有某些共同的,可观测特征的一类事物的全体
个体是构成总体的基本单位或单元,又称元素或个案
样本即从总体中抽出的一部分个体,一般30以上的样本称大样本,30一下的称小样本
参数是总体的特征量数,一般只是理论假设时存在,实际无法测量,如μ(总体平均数)、σ(总体标准差)、ρ(总体相关系数)等
统计量则是直接从样本计算出的量数,代表的是样本的特征,如M(样本平均数)、S(样本标准差)、r(样本相关系数)等
(一)统计图表
统计表和统计图都是对数据进行初步整理,以简化的形式加以表现的两种最简单的方式。在制定统计图表之前,一般首先要对数据进行以下两种初步整理:
(1)数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列,其具体方法一般有如下三种:
①顺序分布法:将数据按大小排列,后用频数f表示相同数据的出现次数
②等级分布法:先按顺序排列数据,后以事物本身的性质标上相应的等级R,若有重复等级时,应在划分等级时根据其实际的排序位置求平均等级
③次数分布法
(2)统计分组:根据被研究对象的特征,将所得到数据划分到各个组别中去
1.统计图
统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈列形式
组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注
图形的种类:
直条图(条形图)和圆形图(饼图)都是用于绘制离散型数据的统计图
次数多边形图(线性图)与直方图是用于绘制连续型数据的统计图
散点图则是用于表示对事物相互关系的统计图
此外还有茎叶图、测量中用来表示结果的剖面图等
2.统计表
统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式
组成:隔开线、表号、名称、标目、数字、表注
分类:简单表、分组表、复合表
次数分布表的编制过程与方法:
(1)求全距(Range,R)
(2)定组数和组距
经验法是根据经验将数据分为10~20组,其中10~15组为最佳,组距一般选择2、3、4、5、10等
当数据来自于一个正态分布的总体时,可以用计算法:
; 或;
其中i为组距,k为组数
(3)定组限
组限是指每一组的起止点
表达界限:即根据第二步人为确定的上下限
精确界限:上限or下限分别+/- 0.5(或0.05、0.005)所得的界限
(4)登记与汇总
即写出各组频数f与总数∑f
(二)集中量数
集中量数即表示集中趋势的一种参数或统计量,反映的是频数分布中大量数据向某一点集中的情况。
1.算术平均数
(1)定义
算数平均数:即所有观察值的总和与总频数之商,简称为平均数或均数。
(2)特点
①在一组数据中每个变量与平均数之差的总和等于零:
②在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C:
③在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C:
(3)意义
算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。
2.中数
(1)定义:
中数:按顺序排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比它大,一半数据比它小,以Md或Mdn表示。
(2)算法:
①数列总个数为奇数时,第 (N+1)/2 个数就是中数
②数列总个数为偶数时,可取位于中间的两个数的平均数作为中数
③分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限使用插值法
注:有相等数数列的中数计算不容易,要自己好好摸索,我通常是采取如下方法:总个数为奇时取第(N+1)/2个数的组中值;总个数为偶时取第N/2个数的精确上限与第 (N+1)/2 个数的精确下限的均值
3.众数
众数:在次数分布中出现次数最多的那个数的数值,以Mo表示。众数可能不只一个。
均数、中数、众数的关系与应用比较:
(1)关系
当数据分布呈正态时:M = Mdn = Mo
呈偏态分布时,众数位于峰值最高点上,中数位于均值与众数之间,且有Mo = 3Mdn - 2M
即正偏态分布时Mo < Mdn < M;负偏态分布时M < Mdn < Mo
(2)比较与应用
一个优良集中量应具备以下六个条件:1.感应灵敏;2.严密确定;3.意义简明;4.容易计算;5.适合代数法则处理以便进一步运算;6.受抽样变动的影响较小。
三种集中量数的比较:
平均数
中 数
众 数
优点
1.符合优良集中量的全部要求
2.便于加权处理
3.统计推断结果更可靠稳定
1.符合优良集中量的2346条要求
2.少受极端值影响
1.符合优良集中量的第3条要求
应用
1.加权平均数
2.离差、相关计算,进行统计推断等
3.用于等距、等比数据
1.数列中有极端数值时
2.测量单位的性质不确定时
3.上下端距离不确定时
4.采用百分体制时
5.用于顺序量表
1.粗略估计时
2.出现多峰分布时
不足
1.易受极端值影响
2.组距不确定时无法计算
1.易受抽样偏差影响
2.不适合代数运算
补充:其他集中量数
(1)几何平均数
或
主要用于:1. 一组数据中有少数数据偏大或偏小,多用于心理物理学的等距与等比量表中;
2. 一组数据彼此间变异较大,且几乎是按一定比例关系变化时。
(2)调和平均数
多用于描述速度方面的集中趋势
(三)差异量数
1.离差与平均差
离差:分布中的某点到均值得距离,其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离。
一数列中所有数的离差之和始终为零,因此不同数据间差异无法用离差来比较。
平均差:次数分布中所有原始数据与平均数绝对离差的平均值。
缺点:进行了绝对值处理,无法进行下一步代数运算
2.方差与标准差
由于离差正负值互相抵消无法代表离中趋势,我们引入和方的概念
和方:每一个离差值平方求和
(1)总体的方差和标准差
方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数
作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方。
标准差:方差的平方根
作为样本统计量用符号s表示,作为总体参数用符号σ表示。
(2)样本的方差和标准差
样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计:
方差、标准差的合成:其中
(3)性质
①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差
②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数
(4)意义
方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数
3.变异系数
当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是变异系数。
①两个或两个以上样本所使用的观测工具不同,所测的特质相同
②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大
变异系数:一种最常用的相对差异量,为标准差对平均数的百分比
使用变异系数时应注意:①所用数据应都是等比数据;②只能用于描述,不可进行统计推论。
各种差异量数间的比较:
方差与标准差
全 距
平均差
优 点
1.感应灵敏
2.严密确定
3.适合代数法则处理
4.受抽样变动影响小
1.意义简明
2.计算简单
1.意义简明
2.计算简单
3.严密确定
缺 点
1.原理难理解,计算复杂
2.受极端值影响较大
1.极易受极端值影响
2.无法反映全部数据的差异情况
1.易受极端值影响
2.不适合代数运算
应 用
1.反映数据离散程度
2.进行推论统计和检验
3.用于判断数据可否舍弃
4.计算CV、Z和标准误
使用价值很小
少用
(四)相对量数
1.百分位数
百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比所对应的分数,实质上就是在某个百分位置上的数值。
第P百分位数就是指,在某值为P的数据以下,包括分布中全部数据的P%。
2.百分等级
百分等级:常模团体中低于该分数的人所占总体的百分比:
其中R为某一原始分数在按大小排列的数列中的名次
百分等级的应用:1.建立百分等级常模;2.衡量考绩的优劣;3.比较群体间成绩的优劣。
3.标准分数
(1)定义
标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数,表示原始分数在平均数以上或以下几个标准差的位置。
(2)性质
①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量
②一组原始分数转换得到的Z分数可正可负,其分布形状与为转换前的原始分布相同
③原始数据的Z分数分布标准差均为1
④若原始分数呈正态分布,则转换得到的均值为0,标准差为1的标准正态分布
(3)应用
①比较不同测量单位时变量值的相对位置
②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置
③异常值的取舍(通常在一个正态分布中,若一个数据的取值落在±3σ之外,则在整理数据时可将此数据作为异常值舍弃)
学习时需要记忆几个经典Z分数及其对应的百分比值:1S=34.14%;2S=47.72%;3S=49.875%;1.64S=45%;1.96S=47.5%;2.33S=49%;2.58S=49.5%
(4)导出分数
导出分数便是为克服Z分数的某些不足而对其进行线性变换所得的分数,其转换形式为Z’=aZ+b,转换后分布均值为b,标准差为a。
几种常见的导出分数:
正态化标准分数:T=10Z+50
注:分数分布的转换有两种,一种是正态化转换,即根据原始分数计算出百分等级,再查正态分布表得到每个数据的P值,由此将整个分布转换为正态分布,这是一种非线性转换;另一种即是由Z分数经公式直接转换为T分数,这就是线性转换了,若不经正态化,其分数分布仍与原始分数的分布形态一致。一组非正态数据若要转换为正态化标准分数,则同时需要以上两步转换过程。
韦氏成人智力量表:IQ=15Z+100 比奈—西蒙量表:Z’=16Z+100
(五)相关量数
由于实验法适用范围的限制,有的时候我们只能对变量间进行相关研究,也就是看两者是否有互相跟随的变化关系。相关研究所得到的是一种描述统计,我们仅仅能用其描述两个变量互相跟随的程度大小,至于他们之间是否有因果关系或者是共变关系则不可妄下定论。
相关系数:两列变量间相关程度的数字表现形式
作为样本的统计量用r表示,作为总体参数一般用ρ表示。
正相关:两列变量变动方向相同
负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动
零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化
测定系数:相关系数的平方,用以说明两列变量的变异中一方能由另一方解释的程度。如两组数据间相关为0.8,那么我们可以说当以A来预测B的变化趋势时,64%是正确的。
使用相关系数时应注意:①相关系数受样本量n影响,n最好不小于30;②相关系数不是等距数据;③计算相关要求成对数据;④相关可能是线性也可能是非线性。
1.积差相关
积差相关是直线相关中最基本的方法,由英国统计学家提出,因此也叫Pearson相关,用rxy表示,
其实质是:
(1)使用前提
①数据要成对出现,即若干个体中每个个体都有两种不同的观测值,且每对数据与其它对相互独立
②两列变量各自总体的分布都是正态的,至少接近正态
③两个相关的变量是连续变量,也即两列数据都是测量数据
④两列变量之间的关系应是直线性的
(2)公式
2.等级相关
等级相关是根据等级资料来研究变量间相互关系的方法,按因变量个数的多少分为用于分析两列
量的斯皮尔曼相关和用于分析多列变量的肯德尔等级相关
(1)适用范围
①当研究考察的变量为称名数据或顺序数据时
②虽是等距或等比数据,但总体分布不是正态,或者两者间关系不是线性时
(2)公式:将原始数据转化为顺序型数据,后用Pearson相关公式或以下公式计算
其中D为同一个体的X和Y各自排序后的等级差,N为成对等级变量的对子数
3.肯德尔等级相关
(1)肯德尔W系数
也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件事物进行
等级评定,或同一个人先后K次评定N个事物。其原理是以评价者评价的一致性除以最大变异可能性。
Ri:评价对象获得的K个等级之和 N:等级评定的对象的数目 K:等级评定者的数目。
(2)肯德尔U系数
与肯德尔W系数所处理的问题相同,但评价者采用对偶比较法,即将N件事物两两配对,即配成
N(N+1) / 2对,分别对每对中两事物进行比较,优者记1,劣者记0,最后整理所有评价者的结果。
rij为对偶比较记录表中i > j格中的择优分数。
注:U系数的取值范围在0~1之间,为1时,意味着评分者的意见完全一致;当U为(奇
数)或(偶数)时,意味着评分者意见完全相反,而U取值的正负并不表示一致的方向。
4.点二列相关与二列相关
(1)点二列相关
适用于一列数据为正态等距变量,另一列为离散型二分变量的情况,可用于计算二分计分题目的区分度。
是与二分称名变量的一个值对应的连续变量的平均数
是与二分称名变量的另一个值对应的连续变量的平均数
p与q是二分称名变量两个值各自所占的比率, st是连续变量的标准差
(2)二列相关
适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。
y为标准正态曲线中p值对应的高度,查正态分布表能得到
5.Φ相关
适用于两个变量都是二分变量的情况,不论是真正的二分变量还是人为的分为两类。
其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据(详见卡方检验一章)
补充:
r的取值范围为-1≤r≤1,一般认为0~±0.40为低度相关;±0.40~±0.70为中度相关;±0.70~±1.00为高度相关
对事物关系的解释和说明并非纯粹依据所计算出的相关系数来进行,因此在解释相关关系时应谨慎对待:
首先,要从逻辑上判断事物之间是否真正存在关系;其次,要注意随着样本容量的增大,达到相关显著的相关系数数值会变得越来越小;此外,还应注意要在一定的时空范围内解释相关系数。
(若样本量足够大,无论什么样的两组数据间都必定会出现相关显著,故应用时应考虑清楚)
二、推断统计
(一)推断统计的数学基础
1.概率
(1)事件与概率
事件是一种数学语言,通俗地说就是事情或现象。大致分为确定事件、模糊事件和随机事件三类。
随机事件虽然在每次试验中可能发生也可能不发生,但是当试验次数很大时又会表现出统计的规律性。一种随机事件的发生次数与总试验次数的比值就成为频率,而概率则是随机事件在试验中发生可能性的程度或可能性的大小,以P表示,概率的定义有统计定义和古典定义之分。
概率的统计定义是指通过实际试验所得频率来计算的概率,由于它是由实际经验得到的,又称经验概率;而根据问题本身所具有的理论特点直接计算的概率,则是概率的古典定义,又称先验概率。
小概率事件是指在一次试验中发生的可能性极小,但在大量重复试验下终究会发生的事件,一般认为概率小于或等于0.05的随机事件为小概率事件。(此概念是区间估计与假设检验的基础)
(2)概率分布及其类型
经验分布是根据观察或试验所获得的数据而编制的次数分布或相对频率分布,它往往是一个总体的样本,故又称样本分布;理论分布或指数学模型,或指按某种数学模型计算出的总体的资料分布,故又称总体分布。
2.正态分布
(1)正态分布与标准正态分布
正态分布就是中间量数次数分布多,两端分布少,呈对称型的概率分布。其中,平均数μ和标准差σ决定着曲线的位置和形状:σ越大,曲线越是“低阔”;σ越小,曲线越是“高窄”。
标准正态分布则是σ为1,μ为0的正态分布。
(2)特点
①正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值。
②大部分的原始分数都集中分布在均值附近,极端值相对而言比较少。
③曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交。
④正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定。
(3)用法
①依据Z分数求概率,即已知标准分数求面积。
②从概率求Z分数,即从面积求标准分数值。
③已知概率或Z值,求概率密度,即正态曲线的高。
3.二项分布
二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布(是一个离散型分布)
性质:①当p=q=n时,不论n的大小如何,二项分布曲线都是对称的;
②p≠q,且n相当小时,图形显偏态;
③当n相当大(n≥30)时,二项分布曲线会逐渐接近正态分布(计算上可以简化为p<q且np≥5或p>q且nq≥5时,二项分布接近正态分布)。
二项分布的均值为
方差公式为 标准差的公式为
4.t分布
一、抽样分布理论及其定理
注意:此标题下各概念都极其重要,是以后学习统计推论的理论基础
(1)总体分布、样本分布与抽样分布
总体分布:总体内个体数值的频率分布
样本分布:总体中一部分个体数值的频数分布
抽样分布:总体中可抽取的所有可能的特定容量分布的统计量所形成的分布(就是说如果我们从总体里面进行很多次抽样,每次抽样都能得到一个分布,那么所有的每一个这样的分布的均值凑在一块也会构成一个高低错落有致的分布,这就是抽样分布。其他统计量如方差、相关系数等亦是如此)
(2)几个重要概念
① 随机样本:即从总体中经随机抽取所得的样本
② 抽样误差:以样本均值为例,则是样本均值与总体均值间的差异。其取值范围为:
最大允许抽样误差是评价抽样结果精确度的一个指标,用d表示,通常为:。
③ 标准误:由于抽样研究中存在抽样误差,需要估计其大小,而所用的量便是抽样分布的标准差,称为标准误,可用或表示。标准误越小,说明样本对总体的代表性越好。
同样以样本均值为例,便等于与间的标准距离。
④ 自由度(Degree of freedom):用df或n’表示,是一组数据中可以独立自由变动的数目。
(这个概念我们放到实验中来理解可能更清晰些,例如有一个实验要我们分配4名被试,那么我们在分配前3名被试时,他们的位置都可以是自由的,比如第一位被试可以放在1234任何一个位置上,但最后一名被试则是没得选择,只能放在最后那个位置,因此他是“不自由”的,于是自由度便等于n-1了。自由度的计算中,n是原有的样本容量,而减去的则是受限制的数目,此处乍看好像是最后一名被试受到限制了,但实际上是全体被试受到了可分配数目的限制,也就是说自由度总是受到一些参数或统计量的限制,涉及的参数或统计量越多,往往可以自由变动的数目,也就越少)
(3)中心极限定律
∵(我不知道这公式怎么来的,有兴趣的同学可以询问高人或查阅其他统计资料)
由此可得以下定律:
大数定律:样本容量n越大,标准误越小;总体方差越大,标准误就越大
中心极限定律:对于任何均值为,标准差为的总体,样本容量为n的样本均值分布,会随着n趋近无穷大时趋近均值为,标准差为的正态分布。
(2)常用抽样分布
常用的抽样分布包括正态及渐进正态分布(样本平均数分布)、t分布、卡方分布、F分布等
<一> t分布
t分布(学生氏分布)是由小样本统计量形成的概率分布,其分布形态与方差无关而与自由度有关,很类似正态分布,我们可以将正态分布看作t分布当自由度为正无穷时的特例。
统计定义:若一样本X为标准正态分布,另一样本Y为自由度为n的卡方分布,则随机变量服从自由度为n-1的t分布。
总体分布为正态,方差未知时,样本平均数的分布为t分布:
其中
特点:①对称,均值为0;
②形状随自由度改变,是一簇曲线;
③理论上n趋于无用时,t分布以标准正态曲线为极限;n逐渐减少时,分布离散程度变大,
其峰顶逐渐下降,尾部抬高
④t分布t值均有对应的p值。
应用:①总体正态,总体方差未知,且n<30时,样本均值分布呈t分布;
②总体呈非正态,总体方差未知,n>30时,样本均值分布呈t分布或渐进正态分布;
③总体方差未知时,两样本均值之差的分布、样本相关系数的分布、回归系数的分布在一定条件下也服从t分布。
<二> χ2分布
χ2分布的构造是从一个服从正态分布的总体中每次抽去n个随机变量,计算其平方和之后标准化的一个分布。
统计定义:几个相互独立的,均服从正态分布的随机变量的平方和的分布。
特点:①正偏态,自由度趋近无穷大时,χ2分布为正态分布;
②具有可加性(是一个服从的χ2分布);
③χ2值都是正值
④>2时,χ2分布平均数,方差;
⑤χ2分布是连续性分布,但有些离散性分布也服从χ2分布。
应用:计数数据的假设检验,样本方差与总体方差的一致性检验等。
5.F分布
如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2,则:
统计定义:设有两个总体X、Y,分布符合自由度分别为n1和n2的χ2分布,且X与Y相互独立,则随机变量服从第一自由度为n1,第二自由度为n2的F分布
将χ2公式代入以上定义式,分析可知F比率其实为样本方差各除以其总体方差的比率,而如果我们所计算的F两样本取自相同总体,即,则上式可化简为:
特点:①正偏态,随与的增大而趋向正态分布;
② F总为正值;
③当分子自由度为1时,F值与分母自由度相同t值(双侧)的平方相等,即
④
应用:总体方差齐性检验、多组之间均值差异检验等
6.样本平均数分布
样本平均数分布是一种抽样分布,服从正态或渐进正态分布
根据中心极限定律,样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:
①; ②; ③
应用于以下情形:
1.总体呈正态,总体方差已知,则样本均值分布呈正态分布;
2.总体呈非正态,总体方差已知,样本容量n足够大(n≥30),样本均值分布为渐进正态分布。
样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:
7.抽样原理与抽样方法
(1)抽样原理
抽取样本的基本原则是随机性原则,即在进行抽样时,总体中每个个体被抽选的概率应完全相等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。
(2)抽样方法
<一> 概率抽样方法
①简单随机取样法:对整个总体进行完全随机抽样,通常有抽签法与随机数字法两种
缺点:1.总体很大时无法使用;2.常忽略总体已有信息,降低了样本代表性。
②系统随机取样法(等距抽样):把总体中所有个体按一定顺序编号,后依固定间隔抽样
缺点:1.若总体有周期性变化,则效果不好;2.也容易忽略已有信息。
③分层随机取样法:根据需要将总体分层,再从各层中分别随机抽样,在每层中抽样数目可以是不同的,应适当考虑总体比例抽取,分层原则是层与层间变异越大越好。
分层抽样最佳抽取人数计算: 或
其中ni为所求该层应抽数目;n为样本容量;Ni为i层的总人数;N为总体人数;σi为i层标准差;σ为总体标准差。
④多段随机取样法(整群抽样):先在第一层总体中抽取样本群体,再在抽得的各群体中进行随机抽样,适用于大规模调查。
<二> 非概率抽样方法
方便抽样:随便抽,想怎么抽怎么抽;
判断抽样:通过某些条件过滤后再抽。
(二)参数估计
1.点估计、区间估计与标准误
参数估计就是根据样本统计量去估计相应总体的参数。
(1)点估计
点估计是直接以样本统计量作为总体参数的估计值,良好点估计量有一定前提条件:
1.无偏:即样本容量固定,统计量的分布的均值和被估计的参数相等;
2.一致:指样本容量无限增多时,估计量趋于被估计参数(即所谓的数学期望);
3.有效:当总体参数的无偏估计量不只一个时,抽样分布方差小者较为有效;
4.充分:指一个容量为n的样本统计量不充分地反映了总体的信息。
(2)区间估计
由于我们永远无法排除抽样误差的存在,因此点估计不能提供正确估计的概率,因此就需要区间估计。
区间估计是根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离来表示未知参数可能落入的范围。总体参数可能所在的这个范围便是置信区间,上下端点为置信界限。置信区间表明过了区间估计的准确性。估计总体参数落在某一区间时,可能犯错误的概率为显著性水平,用α表示,1-α为置信度或置信水平。置信度表明了区间估计的可靠性。
区间估计的原理是样本分布理论。进行区间估计的计算及解释估计的正确概率时,依据的是该样本统计量的分布规律及其样本分布的标准误。分布提供概率解释,而标准误的大小决定了区间估计的长度。标准误越小,置信区间的长度就越短,估计就越准确,总体参数就越应该落入样本统计量所界定的区间中,而不落在其中的概率即为显著性水平α。
置信度与置信区间长度有一代偿关系,即置信度越高,置信区间就越宽,反之,我们的估计要求越是精确,置信区间越窄,置信度就越小,正确估计的把握就越小。
(3)估计的标准误
标准误:即样本平均数分布的标准差,其平方,即样本均值分布的方差,则称为变异误
总体方差未知时用估算的总体方差计算标准误。
参数估计的基本步骤:①分析条件,判断方法;
②求标准误;
③求置信区间;
④结果解释。
2.总体平均数的估计
总体平均数的估计方法大致有三种,对比如下:
正态法(Z)
t分布法
近似正态法(Z’)
条件
已知
未知
总体正态,n不论大小;或总体非正态,n≥30
总体不论正态与否,n≥30
标准误
求得置信
区间
* 注: 未知,n<30时,必需用t分布法
3.标准差与方差的区间估计
(1)总体方差的估计
由于样本方差与总体方差之比的分布呈χ2分布,因此有:
(df=n-1)
(2)总体标准差的估计
根据抽样分布理论,n≥30时,样本标准差分布近似正态分布,且,则有:
在对标准差的总体进行估计时,可先对其方差进行估计(用χ2),求得方差置信区间后,再开平方。
(三)假设检验
1.假设检验的原理
(1)差异及差异显著性检验
当两个事物之间出现差异时,有可能是抽样误差,也有可能是实质性的差异,如果经过统计检验发现差异超过了统计学所规定的某一误差限度时,则表示差异已经不属于抽样误差了,统计上将这样的情况称为差异显著,反之即是差异不显著。
由于在进行差异检验时需要先对事物是否存在差异做出假设,再作统计检验,因此这一过程便称为假设检验。
(2)假设检验的统计学原理
<一> 假设与假设检验
统计学中的假设一般专指统计学属于对总体参数所作的假定性说明。在进行任何一项研究时,都需要根据已有的经验和理论先对研究结果 作出一种预想的希望证实的假设。这种假设叫科学假设,记作H1,又叫备择假设。由于证实远比证伪困难,在统计学中,不对H1的真实性直接检验,需要建立与其对立的假设,成为虚无假设,记作H0。假设检验的问题就是要判断虚无假设是否正确,因此虚无假设就是统计推论的出发点。
注意:备择假设总是要假设对比两者间是有差异的,例如单总体检验样本均值与总体均值是否有差异时,我们的备择假设就是,对应备择假设,虚无假设总是假设两者并无差异,即表示为。
<二> 显著性水平
显著性水平指的是拒绝虚无假设的小概率值,用α表示。也就是说,如果一件事情发生的概率小于我们设定的这么一个显著性水平,我们就将其归为“小概率事件”,也就是认为它是一件“几乎不可能发生”的事件。
<三> 小概率原理
假设检验的基本思想是概率性质的反证法,基于统计学中广泛采用的小概率原理,该原理认为“小概率事件在一次实验中几乎是不可能发生的”,由此假设检验首先假定虚无假设为真,在虚无假设为真的前提下,若导致了违反常理或不合理的现象出现,则表明“虚无假设为真”的假定错误,必须拒绝虚无假设。而若没有,那就认为“虚无假设为真”是正确的,即要接受虚无假设。
(3)差异显著性的检验方法
<一> 双尾检验
双尾检验的实际意义是值推断差异是否存在,而不断言差异的方向。其显著性水平标记为:α=0.05/2或α=0.01/2
<二> 单尾检验
单尾检验是研究者根据已有的资料事先能够预料到谁优谁劣,检验只是为了进一步确证而选择的方法。(即是说研究者已经不只能够判断出“有差异”,而且可以判断出“A比B好/优/大/快”的情况下所采用的方法)
其中当预料到一个总体参数大于另一个总体参数时,采用右侧检验;而当预料到是小于时,则采用左侧检验。
单尾检验与双尾检验的区别在于:
①问题的提法不同。双侧检验的提法是:μ与已知常数μ0是否有显著差异?单侧检验的提法是:μ是否显著地高于/低于已知常数μ0?
②建立假设的形式不同。双侧检验的零假设和备择假设为:H0:;H1:;单侧检验的零假设与备择假设为:H0:;H1:或H0:;H1:。
③否定域不同。如Z检验中双侧检验的否定域为Zα/2;而单侧检验为Zα。
使用时一定要根据研究目的所规定的方向性来确定使用何种检验,若该用单侧检验的问题使用了双侧检验,其结果不仅可能使结论由“显著”变为“不显著”,还会增大β错误。反之用单侧检验代替了双侧检验,虽然缩小了β错误,但却使得无方向性的问题人为地变成单方向问题,有悖于研究目的。
差异是否显著,是由观测值和临界值(如Z值、t值等)相比获得的。观测值大于临界值,则结果在相应的显著性水平上是显著的。
(4)统计决策的两类错误
接受H0
拒绝H0
H0为真
正确决策
I型(弃真、α)错误
H0为假
II型(取伪、β)错误
正确决策
之前已经介绍过,α其实就是用来定义小概率事件的一个概率值,在这里也就成了拒绝H0的概率,同时也就是会犯拒真错误的概率。
如图,显著性水平α与犯II型错误的概率β间又存在密切关系:
① 减小了犯I型错误的风险,必定会增大犯II型错误的风险,反之亦然;
② α+β不一定等于1,在其他条件不变的情况下,α与β不可能同时减小或增大;
③ 可以通过增大样本容量和增大处理效应来同时减小两类错误。
对于I型错误来说,可以通过控制显著性水平来减小犯错误的概率
II型错误与I型错误不同,影响β值大小的因素主要有三:一、在参数检验中,β依赖于参数的实际值与假设值之间的距离,两者相差越大,β越小;二、α越小,β就越大;三、当α与n固定时,根据研究问题的性质选择适当的检验类型可以减少β。(详见统计效果量一章)
(5)假设检验基本步骤
① 根据问题要求,提出虚无假设和备择假设
② 确定显著性水平,确定单尾还是双尾,确定自由度,查表求临界值
③ 计算样本的实际观测值
④ 比较样本实际分数与临界分数
⑤ 对H0作出结论
⑥ 报告结果
(6)假设检验与参数估计的联系与区别
假设检验是当样本统计量超过一定标准时,就说统计显著,是检验两事物差异是否显著的一种方法;而参数估计是要找到总体值所可能落入的可靠范围,是利用样本统计量对总体参数所作的估计。而作为两者的代表性指标——显著性水平和置信水平也是从不同角度回答了相同的问题。
2.样本与总体平均数差异的检验
由于样本均值分布服从正态分布、t分布或者渐进正态分布,因此检验与差异时,根据不同情况便有三种可选择的方法
检验步骤:① 确定单双尾
② 明确总体方差是否已知
③ 分析总体分布是否正态
④ 根据下表选择适当的检验方法
检验方法
总体情况
标准误
检验值
Z检验
正 态
已知
t检验
未知
Z’检验
非正态
且n≥30
已知
未知
3.两样本平均数差异的检验
(1)检验逻辑与公式
两个样本间的关系可以有如下两种:
独立样本:即两个互不相关的样本,往往来自不同总体,即是不同组别间相同性质的比较,如某校初三(1)班的语文成绩与初三(2)班的语文成绩。
相关样本:即两个样本间是存在某些联系的,往往来自同一个总体,即是同一个组内产生的两种不同类别的数据,例如初三(1)班学生的语文成绩与数学成绩。
检验逻辑:用样本的均值估计总体均值,用相减后的值来作为两均值之差的分布的均值,由于这一分布在不同情况下符合正态分布、t分布或渐进正态分布,因此计算时也应根据不同情况慎重选择。
是两样本平均数检验的通用公式,所不同的仅在于标准误的计算。
实际上标准误的计算公式也是相同的,即:,不同的只是两独立样本情况下,样本间数据相关r=0,于是公式出现了差异。
下面分两种样本详述计算公式。
(2)独立样本间平均数差异的检验
① 两总体方差已知,用Z检验:
② 两总体方差未知,且方差齐性,用独立样本t检验:
使用条件:1.观察间彼此独立;2.两总体均为正态;3.两总体方差齐性(经齐性检验同质)。
公式:;
()
③ 当n1和n2都是大样本(大于等于30)时,不管方差是否齐性,都可用近似Z’检验:
(3)相关样本间平均数差异的检验
① 两总体方差已知,用Z检验:
展开阅读全文