资源描述
第一章 心理与教育统计学基础知识
1、数据类型
称名数据
计数数据 离散型数据
顺序数据
等距数据
测量数据 连续型数据
比率数据
2、变量、随机变量、观测值
变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。
3、总体、个体和样本
需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数
统计指标
统计量
参数
平均数
μ
标准差
S
σ
相关系数
r
ρ
回归系数
b
β
5、统计误差
误差是测得值与真值之间的差值。
测得值=真值+误差
统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差
第二章 统计图表
一、数据的整理
在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、 次数分布表
(一)简单次(频)数分布表
(二)相对次数分布表
将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N)或百分比( )来表示次数,就可以制成相对次数分布表
(三)累加次数分布表
(四)双列次数分布表
双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图
使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
简单次(频)数分布图——直方图、次数多边形图
累加次数分布图——累加直方图、累加曲线
(一)简单次数分布图--直方图
(二)简单次数分布图-次数多边图
次数分布多边形图( )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。
绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。
(三)累加次数分布图—累加直方图
(四)累加次数分布图——累加曲线
四、其他统计图表
条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。
圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。
线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。
散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。
第三章 集中量数
集中量数用来表现数据资料的典型水平或集中趋势( )。
常用的集中量包括算术平均数、加权平均数、中位数和众数等等。
一、算术平均数
算术平均数( )一般简称为平均数()或均数、均值()。
一般用M,或者用 表示。
算术平均数是最常用的集中量
(一)算术平均数的计算公式
(二)算术平均数的意义
算术平均数是应用最普遍的一种集中量。它是“真值”( )的最佳估计值。
真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。
(三)算术平均数的优缺点
优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算
缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。
(四)计算和应用算术平均数的原则
同质性原则:算术平均数只能用于表示同类数据的集中趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。
二、中位数
中位数()又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用或表示
(一)中位数的计算方法
1、原始数据计算法
一组数据中无重复数值的情况
首先将一组数据按顺序排列
;
2、次数分布表计算法
公式中为中位数所在组的精确下限
为中位数所在组下限以下的累积频数
n为数据总和
为中位数所在组的频数
i为组距
(二)中位数的特点及应用
中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:
1、一组数据中有极端数据时;
2、一组数据中有个别数据不确切、不清楚时;
3、资料属于等级性质时。
三.众数
众数()用表示,有两种定义:
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点;
粗略众数是一组数据中出现次数最多的那个数。
众数也是一种集中量,也可用来表示一组数据的集中趋势。
众数的计算方法(观察法寻找粗略众数 )
未分组数据中出现次数最多的数即为众数。
次数分布表中,频数最多那一组数据的组中值,即为众数。
四、算术平均数、中位数、众数三者的关系
在正态分布中:
在正偏态分布中:
在负偏态分布中:
五、其它集中量数
(一)加权平均数
加权平均数是不同比重数据(或平均数)的平均数,一般用 表示。其计算公式有两种:
(二)几何平均数
几何平均数( )是n个数值连乘积的n次方根,用 或 表示。计算公式为:
当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。
几何平均数的变式
两边取对数,得
注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。
几何平均数的应用:
1.直接应用基本公式计算几何平均数
有少数极端数据,数据呈偏态分布;心理物理学中的等距与等比量表实验中.(例[3-8]P72)
2.应用几何平均数的变式计算
按一定比例变化的一列数据,一般用来求平均变化率如平均增长率.
例[3-9][3-10][3-11]P73
(三)调和平均数
调和平均数( ),用符号表示.也叫倒数平均数.公式为:
调和平均数的应用
学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他集中量
在有关研究学习速度的实验设计中,反应指标一般常取两种形式;
1、工作量固定,记录各被试完成相同工作所用的时间.例[3-13][3-14]P76
2、学习时间一定,记录一定时间内各被试完成的工作量,例[3-15]
第四章 差异量数
¨ 描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。
¨ 一组数据的离散程度,常常通过数据的离中趋势特点进行分析。
一、全距、四分位距和百分位距
(一)全距 R ()
全距是一组数据中的最大值()与该组数据中最小值()之差,又称极差。
R=-
(二)百分位差(百分位距)
百分位差是指两个百分位数()之差。
常用的百分位距有两种:
用几个百分位距能较好地反映一组数据的差异程度。
对于任何一组观察值,只要任意指定一个位置,就可以求出这个位置的数应该是多少;百分位数
相反,如果给出一个数,也可以求出它应该在哪个位置百分等级
百分位数--频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。
百分等级分数--频数分布中低于特定原始分数的频数百分比。
(三)四分位距
四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为
(四)平均差
平均差( 或者 )是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用或表示。
原始数据计算公式
(五)方差和标准差
方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。
标准差( )是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差用 表示。
标准差和方差是描述数据离散程度的最常用的差异量。
1、样本方差及标准差定义公式
2、总体方差及标准差的定义公式
是总体σ的无偏估计
3、原始数据的方差与标准差计算
4、总标准差的合成
方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。
需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。
计算公式
公式中: 为总方差, 为总标准差
为各小组标准差
为各小组数据个数
5、方差和标准差的性质
方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。
标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:
如果 则
如果 则
6、方差和标准差的意义
方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。
标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。
应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。
7、标准差的应用/——差异系数
差异系数( )是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以表示,其计算公式为 :
差异系数的作用: 比较不同单位资料的差异程度
比较单位相同而平均数相差较大的两组资料的差异程度
可判断特殊差异情况
8、标准差的应用——标准分数
又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。
标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。
(1)标准分数的计算公式及其性质
①没有实际单位;
②可正可负,可为零;
③一组原始数据中,各个Z分数的标准差为1;
④正态分布的原始数据,转换得到的Z分数是标准的正态分布(0,1)。
(2)Z分数的作用
Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。
把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。
(3)标准分数的优点
l 可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。
l 可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。
l 明确性:标准分数较原始分数的意义更为明确。
l 合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地 反映事实。
第五章 相关分析
一、相关概述
(一)相关的概念
两个变量之间不精确、不稳定的变化关系,称为相关关系。
两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。
两个变量之间的变化方向有:
¨ 正相关:两个变量的变化方向相同。
¨ 负相关:两个变量的变化方向相反。
¨ 零相关:两个变量的变化方向无一定规律。
从关系密切程度来看,两个变量的变化程度可大致分为
¨ 完全相关:两个变量的变化程度完全一致。
¨ 强相关:两个变量变化的一致性比较强。
¨ 中等相关:两个变量变化的一致程度中等。
¨ 弱相关:两个变量变化的一致性比较差。
¨ 完全不相关:两个变量变化程度没有一致性。
(二)相关系数
用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数,一般样本的相关系数用r表示,总体的相关系数用ρ表示。
¨ 相关系数的取值: -1≤ r ≤+1
¨ 0≤∣r∣≤1
¨ 相关系数的符号:“+”表示正相关,“-”表示负相关。
相关系数的性质
相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、乘、除运算。
二、积差相关
(一)积差相关及其适用条件
积差相关是英国统计学家皮尔逊()于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关( )。
积差相关适用于:
1、两个变量都是连续数据;两变量总体都为正态分布;两变量之间为线性关系。
2、成对数据,样本容量要大。
积差相关条件的判断方法:
连续变量:根据得到数据的方式判断,测量数据。
正态分布:一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。
线性关系:根据相关散布图可判断两个变量之间是否线性关系。
(二)相关系数的等距转换及其合并
相关系数不是等距数据,更不是比率数据,它只能比较相对大小,不能进行加减乘除运算。但我们常会遇到需要将取自同一总体的几个样本的相关系数合成、求平均的相关系数这一问题。这时,可以先将相关系数r转换成具有等距单位的值。
三、斯皮尔曼等级相关
等级相关( )是指以等级次序排列或以等级次序表示的变量之间的相关。
主要包括斯皮尔曼()二列等级相关和肯德尔和谐系数( )多列等级相关。
(一)斯皮尔曼等级相关的概念及适用条件
斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量,并不要求两个变量总体呈正态分布,也不要求样本的容量必须大于30。
当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。
四、肯德尔和谐系数
¨ 肯德尔等级相关方法有许多种,肯德尔和谐系数是其中一种。
¨ 肯德尔和谐系数常以rW表示,适用于多列等级变量的资料。
¨ 肯德尔和谐系数可以反映多个等级变量变化的一致性。
肯德尔U系数与W系数的适用资料相同。
五、质与量的相关
(一)点二列相关
适用条件
一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关,称为点二列相关( )。
有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。
多用于评价是非类测验题目组成的测验内部一致性。
(二)二列相关
两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关( )。
将连续变量人为划分为二分变量时,应注意尽量使分界点接近平均数。
教育或心理测验中问答题的区分度指标。
六、品质相关
两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。
品质相关处理的一般是计数数据而不是连续数据,变量划分为不同的品质类别,主要用于双向表或称为列联表(R×C表)。
品质相关的方法有多种,最常用的是四分相关、Φ相关和列联表相关。
第六章 概率分布
一、概率的定义
(一)基本概念
概率():表明随机事件可能性大小的客观指标。
概率的两种定义:后验概率和先验概率。
后验概率(或统计概率)
随机事件的频率:
当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A的概率。
先验概率(古典概率)
古典概率模型要求满足两个条件:
⑴ 试验的所有可能结果是有限的;
⑵ 每一种可能结果出现的可能性相等。
(二)概率的公理系统
1.任何随机事件A的概率都是在0与1之间的正数,即
0 ≤ P(A)≤1
2.不可能事件的概率等于零,即 P(A)= 0
3.必然事件的概率等于1,即 P(A)= 1
(三)概率分布类型
概率分布( )是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。
依不同的标准,对概率分布可作不同的分类。
1、离散型分布与连续型分布
依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。
2、经验分布与理论分布
依分布函数的来源,可将概率分布分为经验分布与理论分布。
¨ 经验分布( )是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。
¨ 理论分布( )是按某种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布( )。
¨ 基本随机变量分布是随机变量各种不同取值情况的概率分布,抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
二、概率分布——正态分布
(一)正态分布特征
正态分布( )也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。
1.正态分布曲线函数
正态分布曲线函数又称概率密度函数,其一般公式为:
公式所描述的正态曲线,由σ和μ两个参数决定。
2、正态分布的性质
¨ 正态分布是以 为中心的对称分配。
¨ 正态分布有 2 个参数: m (平均数)以及 s (标准差) ,其决定了分配的位置及形状。
¨ 正态分布曲线下面的面积总和等于1。
¨ 正态分布 在 时有一转折点。
¨ 正态分布曲线的两尾无限延伸。
¨ 正态分布是一族曲线,标准正态分布是一条曲线。
3、标准正态分布曲线
将标准分数代入正态曲线函数,并且,令σ=1,则公式变换为标准正态分布函数:
标准正态分布曲线的特点
⑴.曲线在Z=0处达到最高点
⑵.曲线以Z=0处为中心,双侧对称
⑶.曲线从最高点向左右缓慢下降,向两侧无限延伸,但永不与基线相交。
⑷.标准正态分布曲线的平均数为0,标准差为1。从Z=-3至Z=+3之间几乎分布着全部数据。
⑸.曲线的拐点为正负一个标准差处。
4、正态分布表的使用
已知Z值求概率
⑴.求Z=0至某一Z值之间的概率:直接查表
⑵.求两个Z值之间的概率
¨ 两Z值符号相同:1-Z2=2-1
¨ 两Z值符号相反:1-Z2=2+1
⑶.求某一Z值以上的概率
¨ Z>0时,-∞=0.5-
¨ Z<0时,-∞=0.5+
⑷.求某一Z值以下的概率
¨ Z>0时,P-∞-Z=0.5+
¨ Z<0时,P-∞-Z=0.5-
已知面积(概率)求Z值
⑴.求Z=0以上或以下某一面积对应的Z值:直接查表
⑵.求与正态曲线上端或下端某一面积P相对应的Z值:先用0.5-,再查表
⑶.求与正态曲线下中央部位某一面积相对应的Z值:先计算P/2,再查表
已知概率P或Z值,求概率密度Y
⑴.直接查正态分布表就能得到相应的概率密度Y值。
⑵.如果由概率P求Y值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分,才能通过查表求得正确的概率密度。
三、概率分布——二项分布
(一)二项试验与二项分布
二项分布( )是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。
1.二项试验
满足以下条件的试验称为二项试验:
¨ 一次试验只有两种可能的结果,即成功和失败;
¨ 共有n次试验,并且n是预先给定的任一正整数;
¨ 各次试验相互独立,即各次试验之间互不影响;
¨ 各次试验中成功的概率相等,失败的概率也相等。
2.二项分布函数
¨ 二项分布是一种离散型随机变量的概率分布。
¨ 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X=0,1…)的概率分布,叫做二项分布函数。
二项展开式的通式(即二项分布函数):
3、二项分布的平均数和标准差
¨ 如果二项分布满足p>q且 ≥5(或者p<q且 ≥5时,二项分布接近于正态分布。可用下面的方法计算二项分布的平均数和标准差。
¨ 二项分布的平均数为:
¨ 二项分布的标准差为:
4、二项分布的应用
二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。
四、概率分布——样本分布
(一)、抽样分布
区分三种不同性质的分布:
¨ 总体分布:总体内个体数值的频数分布
¨ 样本分布:样本内个体数值的频数分布
¨ 抽样分布:某一种统计量的概率分布
1. 抽样分布的概念
抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
抽样分布是一个理论的概率分布,是统计推断的依据。
2.平均数抽样分布的几个定理
⑴.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。
⑵.容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。
⑶.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
⑷.虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。
(二)标准误
某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
平均数标准误的计算
1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
平均数的标准误为:
2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
平均数标准误的估计值为:
(三)平均数离差统计量的分布
1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
平均数离差的的抽样分布呈正态分布
正态总体,样本平均数的抽样分布
2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
平均数离差的的抽样分布呈t分布
t分布的特点
⑴.形状与正态分布曲线相似
⑵.t分布曲线随自由度不同而有一簇曲线
⑶.自由度的计算:自由度是指能够独立变化的数据个数。
⑷.查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。
3.总体σ未知,大样本时的近似处理
样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:
第七章 参数估计
一、点估计、区间估计与标准误
(一)总体参数估计的基本原理
¨ 根据样本统计量对相应总体参数所作的估计叫作总体参数估计。
¨ 总体参数估计分为点估计和区间估计。
¨ 由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。
(二)点估计
1、良好的点估计量应具备的条件
¨ 无偏性
如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。
¨ 有效性
当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。
¨ 一致性
当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。
¨ 充分性
一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。
2、点估计量的缺点
有偏差
没有提供正确估计的概率,即不能提供估计值与参数真值的接近程度和可靠程度
(三)区间估计
区间估计可以解决这个问题。区间估计得出的不是一个单一数值,而是一个数值区间。它既可以告诉我们参数的真值在什么范围内,又能告诉我们参数的真值落在这个范围的概率有多大。
区间估计的基础——抽样分布
¨ 根据抽样分布的特点及原理,不同总体条件下,可能会有不同的抽样分布,则可得到不同条件下总体参数的区间估计的计算方法。
¨ 区间估计涉及和置信区间和显著性水平。
1、区间估计
以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。
¨ ⑴要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;
¨ ⑵要求出该种统计量的标准误;
¨ ⑶要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。
置信区间
¨ 置信度,即置信概率,是作出某种推断时正确的可能性(概率)。
¨ 置信区间,也称置信间距( )是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。
显著性水平
¨ 对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平( )就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。
P=1-α
2、平均数区间估计的基本原理
通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n>30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。
根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。
三、总体平均数的估计
(一)总体平均数的区间估计
1.总体平均数区间估计的基本步骤
①.根据样本的数据,计算样本的平均数和标准差;
②.计算平均数抽样分布的标准误;
③.确定置信概率或显著性水平;
④.根据样本平均数的抽样分布确定查何种统计表;
⑤.计算置信区间;
⑥.解释总体平均数的置信区间。
2.平均数区间估计的计算
①总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本
样本平均数的分布呈正态,平均数的置信区间为:
②总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本
样本平均数的分布为t分布,平均数的置信区间为:
③总体正态,σ未知,大样本
平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:
④ 总体非正态,小样本
不能进行参数估计,即不能根据样本分布对总体平均数进行估计。
第八章 假设检验
一、假设检验的原理
(一)、假设检验的基本原理
利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。
1、假设
假设检验一般有两互相对立的假设。
¨ H0:零假设,或称原假设、虚无假设( )、解消假设;是要检验的对象之间没有差异的假设。
¨ H1:备择假设( ),或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。
进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。
2、小概率事件
样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。
当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。
3、显著性水平
¨ 统计学中把拒绝零假设的概率称为显著性水平,用α表示。
¨ 显著性水平也是进行统计推断时,可能犯错误的概率。
¨ 常用的显著性水平有两个:α=0.05 和 α=0.01。
4.假设检验中的两类错误及其控制
对于总体参数的假设检验,有可能犯两种类型的错误,即α错误和β错误。
假设检验中的两类错误
H0为真
H0为假
拒绝H0
α错误
正确
接受H0
正确
β错误
两类错误
实际情况
H0正确
H0错误
研究结论
拒绝H0
Ⅰ型错误
正确
接受H0
正确
Ⅱ型错误
结论
(1)两类错误既有联系又有区别
a错误只在否定H0时发生
b错误只在接受H0时发生
a错误增加 b 错误减小
b错误增加 a 错误减小
(2)n , s2 可使两类错误的概率都减小.
¨ 为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对α错误进行控制,如α=0.05或α=0.01。
¨ 对β错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使β误差得到控制。
在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,α被分散在概率分布曲线的两端,因此称为双侧检验。
双侧检验的假设形式为:H0:μ=μ0, H1:μ≠μ0
凡是检验大于或小于某一特定条件的假设检验,α是在概率分布曲线的一端,因此称为单侧检验。
单侧检验的假设形式为:
H0:μ≥μ0,H1:μ<μ0
或者 H0:μ≤μ0,H1:μ>μ0
5.假设检验的基本步骤
一个完整的假设检验过程,一般经过四个主要步骤:
⑴.提出假设
⑵.选择检验统计量并计算统计量的值
⑶.确定显著性水平
⑷.做出统计结论
二、平均数的显著性检验
(一)总体平均数的显著性检验
总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显著,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存在显著差异的总体。即,该样本与当前的总体不一致。
1.总体平均数显著性检验的原理
检验的思路是:假定研究样本是从平均数为μ的总体随机抽取的,而目标总体的平均数为μ0,检验μ与μ0之间是否存在差异。如果差异显著,可以认为研究样本的总体不是平均数为μ0的总体,也就是说,研究样本不是来自平均数为μ0的总体。
2.总体平均数显著性检验的步骤
一个完整的假设检验过程,一般经过四个主要步骤:
⑴.提出假设
⑵.选择检验统计量并计算统计量的值
⑶.确定显著性水平
⑷.做出统计结论
⑴.提出假设
¨ 双侧检验的假设形式为:
H0:μ=μ0, H1:μ≠μ0
¨ 单侧检验的假设形式为:
H0:μ≥μ0,H1:μ<μ0 (左侧检验)
或者 H0:μ≤μ0,H1:μ>μ0 (右侧检验)
⑵.选择检验统计量并计算结果
直接应用原始数据检验假设是有困难的,必须借助于根据样本构造出来的统计量,而且针对不同的条件,需要选择不同的检验统计量。
⑶.确定显著性水平
在假设检验中有可能会犯错误。如果零假设是正确的,却把它当成错误的加以拒绝,就会犯α错误。 α表示做出统计结论时犯错误的概率,称为显著性水平。
显著性水平一般为0.05和0.01。
⑷.做出统计结论
根据已确定的显著性水平,查统计量的分布表,找到该显著性水平时统计量的临界值,并以计算得到的统计量值与查表得到的临界值比较,根据统计决断规则做出拒绝或接受零假设的决定。
3.平均数显著性检验的几种情形
⑴.总体为正态,总体标准差σ已知
平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:
例1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?
解:H0:μ=μ0, H1:μ≠μ0
学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已知,样本统计量的抽样分布服从正态,以Z为检验统计量
显著性水平为α=0.05,双侧检验
查表得Zα=1.96,而计算得到的1.09
<Zα,则概率P>0.05
差异不显著,应在0.05显著性水平接受零假设
结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。
双侧Z检验统计决断规则
∣Z∣与临界值比较
P值
显著性
检验结果
∣Z∣<1.96
P>0.05
不显著
保留H0,拒绝H1
1.96≤∣Z∣<2.58
0.05≥P>0.01
显著*
在0.05显著性水平拒绝H0,接受H1
∣Z∣≥2.58
P≤0.01
极其显著**
在0.01显著性水平拒绝H0,接受H1
单侧Z检验统计决断规则
∣Z∣与临界值比较
P值
显著性
检验结果
∣Z∣<1.65
P>0.05
不显著
保留H0,拒绝H1
1.65≤∣Z∣<2.33
0.05≥P>0.01
显著*
在0.05显著性水平拒绝H0,接受H1
∣Z∣≥2.33
P≤0.01
极其显著**
在0.01显著性水平拒绝H0,接受H1
⑵.总体为正态,总体标准差σ未知,样本容量小于30
平均数的抽样分布服从t分布,以t为检验统计量,计算公式为:
例3:某区初三英语统一测验平均分数为65,该区某校20份试卷的平均分数为69.8,标准差为9.234。问该校初三年级英语平均分数与全区是否一样?
⑶.总体标准差σ未知,样本容量大于30
平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z代替t近似处理,计算公式为:
⑷.总体非正态,小样本
不能对总体平均数进行显著性检验。
三、平均数差异的显著性检验
平均数差异显著性检验的统计量及计算公式
(一)两总体正态,两总体方差已知
总体方差已知条件下,平均数之差的抽样分布服从正态分布,以Z作为检验统计量,计算公式为:
展开阅读全文