收藏 分销(赏)

心理学考研心理统计.doc

上传人:仙人****88 文档编号:7378770 上传时间:2025-01-01 格式:DOC 页数:17 大小:394KB
下载 相关 举报
心理学考研心理统计.doc_第1页
第1页 / 共17页
心理学考研心理统计.doc_第2页
第2页 / 共17页
点击查看更多>>
资源描述
心理统计 心理统计 n 描述统计 n 描述统计学主要研究如何整理科学实验或调查得来的大量数据,通过图表的形式描述一组数据的全貌,并计算出一些统计特征 n 推断统计 n 推断统计学是研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。 描述统计 1.统计图表 2.集中量数 3.差异量数 4.相对量数 5.相关量数 1-1、统计图表 n 数据的初步整理:数据排序、统计分组 n 次数分布表:简单次数分布表、分组次数分布表、相对次数分布表、累加次数分布表、双列次数分布表、不等距次数分布表。 n 次数分布图:直方图、次数多边形图、累加次数分布图、条形图、圆形图、线形图、散点图。 1-2、集中量数 1.算术平均数 2.众数 3.中数 算术平均数 n 总体平均数 n 样本平均数 算术平均数的性质 算术平均数主要适用于等距以上数据,但不适用于类别数据和顺序数据。优点是反应灵敏、计算严密、计算简单、简明易解、适合进一步用代数方法演算、较少受抽样变动的影响;缺点是易受极端数据的影响、若出现模糊不清的数据时,无法计算平均数。计算和应用平均数时应遵循的原则:同质性原则、平均数与个体数值相结合的原则、平均数与标准差、方差相结合的原则。 中数 n 中数也叫中位数,是一组数据中按从小到大排序后,处于中间位置上的变量值。它将全部数据分成两部分,每个部分各包含50%的数据。 n 中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势。也适用于等距以上数据。但不适用于类别数据。 将全部数据排序后,如果项数是奇数,则正中央的那一项即为中位数;如果项数是偶数,则正中央的那两项的平均值即为中位数。 中数优点:计算简单,容易理解。缺点:反应不灵敏、受极端值影响、受抽样影响较大、不能做进一步代数运算 众数 众数是一组数据中出现次数最多的变量值。用Mo表示,它是一个位置代表值,主要用于测度定类数据的集中趋势,也适用于定序、定距和定比数据的集中趋势的测度值。优点是不受极端值的影响,缺点是反应不灵敏、不能做进一步代数运算、受样本变动影响。 1-3、差异量数 1.离差与平均差 2.方差与标准差 3.变异系数(差异系数) 离差与平均差 离差:也叫离均差, 平均差:也称平均离差,是各变量值与其均值离差绝对值的平均数,用MD表示。计算公式为: 方差与标准差 方差是各变量值与其均值离差平方和的平均数,是测度等距以上数据离散程度的最主要方法。标准差是方差的平方根 总体方差和标准差 样本方差与标准差 方差、标准差的性质: (1)若y=x+c , x和y是随机变量,c为常数, 则 (2)若y=cx, c为常数, 则 样本方差与总体方差的区别: (1)在计算上,总体方差是用数据个数或总频数去除离差平方和,而样本方差则用样本数据个数或总频数减一去除离差平方和; (2)样本方差是统计量,用S2表示;总体方差是总体参数,用s2表示。 (3)当n很大时,S2与s2相差很小,前者是后者的无偏估计。 变异系数 n 也称差异系数、离散系数,标准差系数,是一组数据的标准差与其相应的均值之比。 n 变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。 n 变异系数可用于同一团体不同测量的变异的比较,也可用于不同团体同一测量的变异的比较。 1-4、 相对量数 1.百分位数 2.百分等级 3.标准分数 百分位数 次数分布中对应于某个特定百分点的原始分数。第m百分位是这样一个值,它使得至少有m%的数据小于或等于这个值,且至少有(100-m)%的数据项大于或等于这个值。 百分等级分数 次数分布中低于某个原始分数的次数百分比,用PR表示。 求百分位分数是先确定某个百分点m,然后去求相应的百分位分数Pm 。而求百分等级分数正好相反,事先知道次数分布中的一个原始分数,再求该分数在分布中所处的相对位置。 标准分数 标准分数也叫基分数、Z分数,它是以标准差为单位,可以给出一个原始分数在一组数据中的相对位置。 Z分数的性质: 1.Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。 2.一组原始分数转换得到的Z分数可以是正值,也可以是负值。 3.一组原始分数中,各个Z分数的标准差为1。 4.若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布。 Z分数的应用: 1.比较分属性质不同的观测值在各自数据分布中相对位置的高低。 2.当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以表明在总体中的位置。 3.表示标准测验分数 z’=az+b 4.异常值(极端值)的取舍 1-5、相关量数 1.积差相关 2.等级相关 3.肯德尔和谐系数 4.点二列相关 5.二列相关 6.j 相关 相关 n 相关:即两类现象在发展变化的方向与大小方面存在一定的联系,不同于因果关系和共变关系。 n 相关类别:正相关、负相关和零相关 n 相关系数,用来表示相关关系强度的指标。去职范围在正负1之间。 n 如何通过散点图直观地判断两个变量的相关 n 计算相关系数时应该注意的问题 n 相关系数受样本容量n的影响,样本相关系数需要检验 n 存在相关关系不一定存在因果关系 n 没有线性相关,不一定没有关系,可能是非线性的。 积差相关 n 适用条件:两变量等距、正态、连续并且具有线性关系(成对数据不宜少于30对) 斯皮尔曼等级相关 n 适用条件 n 适用于只有两列变量,而且是属于等级变量性质的具有线性关系的资料,主要用于解决称名数据和顺序数据的相关问题。 n 等距、等比数据而总体非正态 n 优缺点 n 对总体分布不做要求,适用面广 n 与积差相关相比,精度稍差 n为等级个数,D指二列成对变量的等级差数 肯德尔和谐系数(肯德尔w系数) 适合于k个评价者对n个被评价事物进行等级评价的资料。 § 计算评价者一致性系数 点二列相关 § 适用资料:两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量是二分成名变量 § 多用于评价由是非类测验题目组成的测验的内部一致性等问题。 § 计算公式 取值在正负1之间,相关越高,绝对值越接近1.00 二列相关 在测验中,常用于对项目区分度指标的确定 § 适用于两列数据都为正态分布,其中已列为等距或等比的测量数据,另一列变量为人为的二分变量。 n 二列相关与点二列相关的主要区别在于二分变量是否正态 j 相关 n f相关的适用资料是除四分相关之外的四格表资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。 取值小于0.3,表示相关较弱,取值大于0.6,表示相关较强 推断统计 1.推断统计基础 2.参数估计 3.假设检验 4.方差分析 5.回归分析 6.卡方检验 7.非参数检验 2-1、推论统计基础 1.概率基础 2.正态分布 3.二项分布 4.抽样原理与抽样方法 5.抽样分布 1、概率基础 n 试验与事件:随机现象简称为随机事件或事件 n 事件的概率定义:表明随机事件出现可能性大小的客观指标 n 常用排列组合公式 n 概率的性质与运算法则 n 条件概率与独立事件 n 加法公式、乘法公式 n 概率分布类型 概率分布类型: 依随机变量是否具有连续性划分为离散分布和连续分布;依分布函数的来源划分为经验分布与理论分布;以概率分布所描述的数据特征划分为基本随机变量分布与抽样分布。 常用排列组合公式: 概率的性质与运算法则 § 概率的性质 § 非负性。对任意事件A, 0£ P(A)£1 § 规范性。必然事件的概率为1,不可能事件的概率为0。P(W)=1,P(f)=0 § 可加性。若A,B互斥,则P(AÈB)=P(A)+P(B) § 概率运算 § P(A)+P( Ac)=1 § 加法公式: P( AÈB)=P(A)+P(B)-P(AÇB) 条件概率与独立事件 条件概率:当某一事件B已知发生时,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率,记为P(A|B)。 乘法公式: P(AB)=P(B)P(A|B) P(AB)=P(A)P(B|A) 独立事件 n 两个事件中不论哪个事件发生与否并不影响另一个事件发生的概率,称这两个事件相互独立。 n 两个事件A、B是相互独立的,当且仅当,P(AB)=P(A)P(B) n 独立事件与相斥事件的区别 2、正态分布 n 一般正态分布的图形特点 n 标准正态分布 n 一般正态分布的标准化转换 n 标准正态分布表及其应用 图形特点 1) f(x)³0,整个密度函数都在x轴的上方; 2)曲线对称,平均数,中数,众数三者相等,x= m处达到最大值 3)曲线的陡缓程度由s决定, s越大,曲线越平缓; s越小,曲线越陡峭。X趋向于无穷时,曲线以x轴为其渐近线。 4)正态曲线下面的面积为1,平均数左右各为0.5; 5)正态分布曲线下,标准差与概率(面积)有一定的关系: m±1 s内,概率为0.6826; m±1.96s内,概率为0.95; m±2s内,概率为0.9545; m±2.58s内,概率为0.99 m±3s内,概率为0.9974 标准正态分布 m=0, s=1时,有相应的正态分布N(0,1)称为标准正态分布. 通常用j(x)表示概率密度函数。任何一个一般的正态分布都可以通过线性变换转化为标准正态分布. 正态分布表 即:标准正态分布函数f(x)的数值表; 将一般正态分布化为标准正态分布,通过查表可解决正态分布的概率计算问题。使用正态分布表可作如下计算: 1)依据Z分数求概率; 如Z=1时,p=0.3413 2)知道概率求Z分数;如p=0.2517时,Z=0.68 3)已知概率或Z分数,求概率密度值f(x) 4)知道Z分数,求原始分数,x=.m+Zs 3、二项分布 n 二项分布的定义及满足的条件 n 二项分布的概率计算公式 n 二项分布的总体均值与方差 n 用二项分布解决实际问题 二项分布的定义及满足的条件 1)试验中仅有两种不同性质结果的概率分布,即两个对立事件的概率分布 2)每一次试验只有两个可能的结果,“成功”和“ 失败”; 3)出现“成功”的概率p是相同的,“失败”的概率q也不变; p+q=1 4)试验是相互独立的。 符合上述条件的n次重复独立的试验为n重贝努里试验或二项试验。 二项分布的概率计算公式 X表示n次重复独立试验中事件A(成功)出现的次数 二项分布的期望值和方差 E(X)=np D(X)=npq 4、抽样原理与抽样方法 n 总体、个体、样本、样本容量 n 参数与统计量的区别和联系,常见的参数与对应的统计量。 n 几种抽样方法:简单随机抽样、分层抽样、整群抽样、系统抽样 5、抽样分布 n 抽样分布的含义 n 样本均值分布及其中心极限定理 n 几种常见的抽样分布:样本均值分布、样本方差的分布、样本方差比的分布 n 几种常见的理论分布:正态分布、t分布、卡方分布和F分布,并且能熟练查上述四个表。 中心极限定理: 设从均值为m,方差为s2(有限)的任意一个总体中抽取大小为n的样本,当n充分大时(n³30),样本均值X的抽样分布近似服从均值为m,方差为s2/n的正态分布。 样本方差的分布 设X1,X2,…,Xn为来自正态分布N(m,s2)的样本,则从数学上可以推导出正态总体下样本方差S2的分布为: 2-2、参数估计 1.点估计、区间估计与标准误 2.总体平均值的估计 3.标准差与方差的区间估计 1、点估计、区间估计与标准误 n 点估计、区间估计的定义,二者的优缺点及联系 n 一个好的点估计应满足的条件:一致性、无偏性、有效性和充分性 n 置信度、置信区间、显著性水平 n 标准误:广义-统计量的标准差;狭义-样本均值分布的标准差 n 2、总体平均值m的估计 n 方差已知 n 总体正态,无论样本n的大小 n 总体非正态,大样本n>30 n 方差未知 n 总体正态 n 总体非正态,大样本n>30 3、标准差与方差的区间估计 n 要求X服从正态分布 总体方差的估计 总体标准差的估计 2-3、假设检验 1.假设检验的原理 2.样本与总体平均数差异的检验 3.两样本平均数差异的检验 4.方差齐性检验 5.相关系数的显著性检验 1、假设检验的原理 n 区间估计与假设检验的关系 n 假设检验中的小概率原理 n 零假设与备择假设 n 两类错误 n 单侧检验和双侧检验,区分它们并注意二者临界值的不同 n 假设检验的一般步骤 假设检验的步骤: 1. 建立原假设和备择假设; 2. 确定适当的检验统计量; 3. 指定检验中的显著性水平; 4. 利用显著性水平根据检验统计量的值建立拒绝原假设的规则; 5. 搜集样本数据,计算检验统计量的值; 6. 作出统计决策 将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设。 2、样本与总体平均数差异的检验 n 零假设和备择假设:H0: m =m0, H1: m¹m0 n 方差已知,总体正态或非正态大样本, § 方差未知 § 总体正态 § 总体非正态 3、两样本平均数差异的检验 n 零假设与备择假设H0: m 1=m2, H1: m1¹m2 n 方差已知 n 独立样本 n 总体正态或非正态大样本 相关样本 n 总体正态或非正态大样本 n 方差未知 n 总体正态 n 独立样本 n 方差相等 n 方差不等 n 相关样本 n 总体非正态,大样本 n 独立样本 n 相关样本 4、方差齐性检验 n 一个未知总体方差与一个已知总体方差的检验 两个未知总体方差的检验 5、相关系数的显著性检验 • H0:r=0 • H0:r= r0 • H0:r1= r2 2-4 方差分析 1.方差分析的原理与基本过程 2.完全随机设计的方差分析 3.随机区组设计的方差分析 4.两因素方差分析 5.事后检验 1、方差分析的原理与基本过程 1.因素、因素水平、因变量、平方和、自由度、均方 2.零假设、备择假设 3.变异的分解 4.方差分析的步骤 5.方差分析应满足的条件 方差分析应满足的条件 (1) 总体正态分布 总体、每个子总体服从正态分布; (2) 变异的可加性 总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。 (3) 各处理内的方差一致(方差齐性) 总体、各子总体的方差相等。各实验处理内的方差彼此应无显著差异。这是方差分析中最重要的假定。若不能满足,原则上不能进行方差分析。 方差分析的步骤 1.建立假设 2.求平方和 3.确定自由度 4.求均方 5.进行F检验 6.列出方差分析表 2、单因素完全随机设计的方差分析 n SSt=SSb+SSW 3、随机化区组设计的方差分析的步骤: (1)建立假设 H10:所有k个出来的总体平均数是相同的,即不存在处理效应。 H20:a个区组的总体平均数是相同的,即不存在区组效应。 (2)求平方和 (3) 自由度 (4) 均方 (5) 进行F检验 (6) 列出方差分析表 随机区组设计(单因素)的方差分析表 变异来源 平方和 自由度 均方 F 临界值Fa 处理(组间) SSb k-1 MSb= SSb /(k-1) Fb= MSb / MSe 区组 SSr a-1 MSr= SSr /(a-1) Fr= MSr / MSe 误差 SSe (k-1)(a-1) MSe= SSe /(k-1)(a-1) 总变异 SSt N-1 4、两因素方差分析 几个基本概念(1)因素和水平(2)主效应与交互作用 (3)总平方和的分解 (4)简单效应 在两因素的完全随机设计中 5、事后检验 2-5 回归分析 n 一元线性回归分析 n 一元线性模型 n 模型的基本假设:线性、正态性、独立性、误差等分散性 n 估计回归方程的截距b0和斜率b1 n 一元线性回归方程的检验 n F检验 n 决定系数 n 一元线性回归方程的应用 n 预测:均值的预测、单个值的预测 n 控制 2-6 卡方检验 n 1、拟合度检验(一个类别变量) 2、独立性检验(两类别变量) • 零假设:两变量独立,备择假设:相关 • 计算期望次数 • 计算卡方值 • 自由度df=(R-1)(C-1) 2-7 非参数检验 n 非参数方法的优缺点 n 独立样本均值差异的非参数检验 n 秩和检验法 n 中数检验法 n 相关样本均值差异的非参数检验 n 符号检验法 n 符号等级检验法 17
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 小学其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服