1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,SPSS 13 for Windows,医学统计方法与应用,(基础统计),2,目 录,SPSS 13,界面介绍,数据库建立和结果输出,数据整理,数据变换,报表,统计描述,T,检验,3,方差分析,相关分析,线性回归分析,常用统计图,4,SPSS 13,界面介绍,(,S,tatistical,P,roducts and,S,ervices,S,olutions,),窗口类型介绍,主界面菜单介绍,对话框介绍,SPSS,系统设置,目录,5,窗口类型介绍,数据编辑窗口,变量编辑窗口,6,结果输出窗口,脚本编辑窗口
2、,命令语句编辑窗口,7,数据观察,/,编辑窗口,变量名,个体序号,数据格,编辑栏,数据格位置,8,变量定义选项:,变量名,类型,数据位,小数位,标签,数值标签,缺失值,数据量度,变量定义编辑窗口,栏宽,对齐方式,9,主界面菜单介绍,文件,菜单,编辑,菜单,视图,菜单,10,数据库处理,菜单,变量变换,菜单,11,统计分析,菜单,描述性统计,子菜单,统计分析,菜单,数据概况统计,子菜单,12,统计分析,菜单,均数比较,子菜单,统计分析,菜单,一般线性模型,子菜单,13,统计分析,菜单,相关分析,子菜单,统计分析,菜单,回归分析,子菜单,14,统计分析,菜单,对数线性分析,生存分析,非参数检验,分
3、类分析,15,作图,菜单,条形图,线图,面积图,圆图,散点图,直方图,图形特性描述,高,_,低图,误差条图,箱图,16,工具,菜单,变量信息,定义变量,使用变量,17,对话框介绍,变量类型,设置对话框,变量标签,设置对话框,18,SPSS,系统设置,Edit/Options,可以对数据、表格、草稿、标题、数据编辑器、结果阅,读器、草稿阅读器视图界面进行定义或修改。,19,数据库建立和结果输出,相关统计学概念(,1,),SPSS,数据统计分析步骤,数据库的建立,数据编辑,数据保存、转换和读取,结果输出,数据和结果打印,目录,20,相关统计学概念(,1,),总体,(,population,):总体
4、是根据研究目的确定的同质观察,单位的全体,或者说是同质的所有观察单位某种观察,值(变量值)的集合。,样本,(,sample,):样本是总体中随机抽取部分观察单位,其,实测值的集合。随机抽样就是按随机化原则(即总体,中每一个观察单位都有同等机会被选入到样本中来)获,取样本,以避免误差和偏倚对研究结果有所影响。样本,包含的观察单位称样本含量或样本大小(,sample size,),,也称样本例数。,资料和变量,(,data and variable,):研究者对每个观察单位的,某项特征进行测量和观察,这种特征称为变量。对变,量测得的值称变量值(,value of variable,)或观察值(,o
5、bserved value,)亦称为资料。观察个体间的差异,称,为变异(,variation,)。,21,定量资料,(,quantitative data,):数值变量(,numerical variable,),其变量的值是定量的,表现为数值的大小,一般有度量,衡。,分类资料,(,categorical data,):分类变量(,categorical variable,),其观察值是定性的,表现为互不相容的类别或属性。,无序分类:阳性或阴性,治愈或未治愈,有序分类:治愈、显效、好转、无效,概率,(,probability,):概率是描述随机事件发生的可能性大小的,数值,常用,P,表示。随机
6、事件概率的大小在,0,与,1,之间,既,0,P,1,。,P,值越接近于,1,,表示某事件发生的可能性越大;,P,值越接近于,0,,表示某事件发生的可能性越小。,P=1,表示,事件必然发生,,P=0,表示事件不可能发生。,P,0.05,称为小,概率事件,表示在一次实验或观察中该事件发生的可能性,很小,可以认为很可能不发生。,22,SPSS,数据统计分析步骤,输入供,SPSS,分析的数据,选择统计分析过程,为统计分析选择变量,运行过程并对统计结果做出判断,23,数据库的建立,问题举例:,一个医生观察了一组住院病人,完成了其中,24,名患者的,资料收集,指标包括:,观察编号,、,住院号,(,inno
7、,)、,年龄,(,age,)、,性别,(,sex,)、,身高,(,x1,,,cm,)、,体重,(,x2,,,kg,),、血压(,收缩压,x3,,,舒张压,x4,,,mmHg,)、,空腹血糖,(,x5,,,mmol/L,)和,胰岛素样生长因子,-1,水平,(,igf-1,,,ng/ml,),并,根据临床情况将患者的,病情,分为,5,级(,x0,,,1,为正常,,2,为一,级,,3,为二级,,4,为三级,,5,为四级),建立其原始数据表。,数据分析:,住院日期为日期变量,病情分级为,有序变量,(Ordinal),性别为,字符变量,(in nominal),其它各指标为,连续变量,(Scale),注
8、意到,igf-1,指标中有,个体数据丢失或实验误差,24,编号,inno indate age sex x0 x1 x2 x3 x4 x5 ifg-1,155 17442 10/21/1996 23.0,男,3,166.0 52.5 108 78 8.90 186.63,177 17281 10/16/1996 25.2,女,5,160.0 60.0 90 50 5.99 230.32,118 17264 10/15/1996 26.4,女,4,164.0 58.5 100 80 7.59 117.45,171 20999 02/25/1997 28.0,男,2,172.0 61.2 110
9、70 14.07 105.74,70 24797 06/27/1997 32.0,女,2,152.0 42.0 118 76 5.89 135.89,49 17204 10/14/1996 33.9,女,2,157.0 58.0 146 86 12.41,8.33,64 19503 01/23/1997 35.0,男,3,167.0 68.0 124 76 7.94 162.40,166 28460 10/20/1997 38.0,女,1,153.5 50.5 114 62 8.81 416.74,17 41332 10/26/1998 43.2,男,3,174.0 80.0 144 94 1
10、2.60 141.73,158 28117 10/09/1997 45.0,女,2,155.0 67.0 180 110 5.76 297.58,146 19218 12/17/1996 48.1,男,2,178.0 69.0 110 72 7.44 234.85,240 43437 12/21/1998 49.3,男,3,173.0 69.0 110 70 9.80 467.81,42 22075 03/31/1997 52.8,男,2,163.0 62.0 125 80 14.87 150.62,72 22239 04/07/1997 54.2,男,2,167.5 72.0 140 90
11、7.80 172.55,195 31257 01/08/1998 57.3,女,2,143.5 41.5 152 88 13.53,0.00,20 40910 10/13/1998 58.8,男,2,168.0 61.5 110 70 15.80 120.42,22 41965 11/11/1998 62.8,男,2,160.0 60.0 140 90 8.83 160.37,36 24681 06/24/1997 65.6,男,3,162.0 52.0 166 70 17.79 180.41,16 41231 10/22/1998 67.4,女,2,153.0 62.0 140 86 11.
12、94 175.18,62 44951 02/05/1999 68.9,女,1,145.0 42.0 108 50 11.72 160.33,172 45549 03/03/1999 71.1,女,4,151.0 61.5 150 90 15.80 145.97,14 36978 06/25/1998 72.3,女,2,148.0 50.0 96 66 16.88 181.51,38 24868 06/30/1997 73.0,女,2,149.0 51.5 116 74 13.16 129.26,24 43579 12/25/1998 74.6,男,4,170.0 60.0 160 86 9.3
13、7 350.09,原始数据表,25,数据编辑(,1,),剪切,复制,粘贴,清除,网格字体,File/New,/Data,26,数据编辑(,2,),Data/Insert Case,插入个体,27,数据编辑(,3,),Data/Insert Variable,插入变量,28,数据编辑,_,变量设置(,1,),Width,、,Decimals,、,Column,选项,通过微调按钮调整数值,29,数据编辑,_,变量设置(,2,),变量类型,数值(默认),逗号,点,科学记数,日期时间,货币,自定义数据类型,字符,30,数据编辑,_,变量设置(,3,),数值标签,Value Labels,数值,数值标签
14、,31,数据编辑,_,变量设置(,4,),丢失值,Missing Values,没有丢失值,离散丢失值,混合丢失值,连续值,离散值,32,数据编辑,_,变量设置(,5,),数据量度,Measure,有序变量,名字变量,连续变量,33,数据保存、转换和读取,数据文件默认保存为*,.sav,File/Save,File/Save As,可以将数据文件转换为其它格式如:*,.xls *.dat *.dbf,File/Save As,数据文件读取:,File/Open,/Data,直接读取,*,.sav,文件或直接读取,*,.xls,文件等数据文件,34,结果输出(,1,),激活结果阅读器,SPSS
15、Viewer,File/New/Output,分析结果窗,分析结果,目录窗,35,结果输出(,2,),选择分析过程,如:,Means,Analyze,/Compare Means/Means,36,修改选项内容,:,原文字为,Mean,更换为,平均值,37,结果输出(,3,),统计分析,_,图表设置,Graphs,/Bar,38,图表结果输出:可以通过,Copy,复制到其它应用程序,或,Export,输出为图形文件,*,.jpg,默认输出文件:,*,.spo,39,数据和结果打印,可以根据需要打印全部或部分数据,40,数据整理,个体排序,行列转置,合并文件,选择个体,加权个体,目录,41,个体
16、排序,Data/Sort Cases,选择排序变量,升序,降序,复置,42,按住院号,inno,排序结果,_,升序,43,行列转置(,Transpose,),变量值转换为变量名,变量,(,Variable,),转换为个体,(,Case,),丢失的变量,复置,Data/Transpose,44,行列转换,丢失了,name,、,sex,变量,以,id,变量值作为,新数据表变量,45,合并文件,(Merge File)-1,Data/Merge files,/Add Cases,46,合并文件,_,仅合并相同变量,47,Data/Merge files,/Add Variables,合并文件,(Me
17、rge File)-2,48,合并文件,_,增加变量以主表为主合并所有个体,49,Data/Merge files,/Add Variables,合并文件,(Merge File)-3,50,合并文件,_,增加变量以主表为准合并相同个体,51,选择个体(,Select Cases,),筛选某些符合特定条件的个体,Data/Select Cases,全部个体,若满足条件,随机个体样本,基于时间,或,个体范围,应用变量过滤,52,条件表达式生成器,函数选择框,输入条件表达式,符号按钮框,53,若条件满足,过滤未满足条件的个体,54,Filter_$=0,非选择个体,Filter_$=1,选择个体,
18、55,删除未满足条件的个体,若条件满足,56,仅保留符合,条件的个体,不符合条件,的个体被删,除,不可恢,复;因此必,须将其另存,为新的数据,文件。,Sex=,“,女,”,and(x5=8 and x51,女,-2,67,记数,Transform/Count,68,170,男性,69,报 表,实时分析处理立体表,综合表,行输出综合报告,列输出综合报告,目录,70,实时多维分析立体表,计算综合变量统计量,显示分组变量的统计量,但不能显示变量值,综合表,显示分组变量各分类下综合变量的统计量及变量值,行输出综合报表,以行的形式输出统计量,列变量为综合变量,列输出综合报表,以列的形式输出统计量,71,
19、sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10 dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 group,2 58 160.0 100.0 150.0 94.0 150.0 90.0 146.0 90.0 150.0 92.0 1,2 51 146.0 90.0 130.0 80.0 118.0 70.0 110.0 70.0 110.0 70.0 1,2 47 150.0 90.0 145.0 75.0 135.0 75.0 130.0 60.0 130.0 60.0 1,1 70 160.0 100.0 146.0 90.0 140.0
20、 90.0 140.0 90.0 140.0 90.0 1,1 72 150.0 96.0 140.0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1,1 60 170.0 100.0 148.0 76.0 140.0 74.0 136.0 72.0 136.0 72.0 1,2 52 148.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 120.0 80.0 1,2 55 155.0 80.0 140.0 85.0 130.0 80.0 130.0 85.0 130.0 80.0 1,1 77 160.0 100.0 140.
21、0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1,1 55 150.0 94.0 145.0 80.0 140.0 80.0 135.0 75.0 135.0 75.0 1,2 77 165.0 90.0 160.0 82.0 155.0 80.0 151.0 72.0 140.0 70.0 1,2 66 150.0 100.0 130.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 1,2 62 150.0 90.0 140.0 86.0 140.0 96.0 140.0 82.0 140.0 82.0 1,2 63 160.
22、0 95.0 150.0 85.0 155.0 75.0 140.0 70.0 136.0 70.0 1,2 67 165.0 90.0 145.0 80.0 140.0 80.0 135.0 75.0 135.0 75.0 1,治疗前后两组病人血压原始数据表,(治疗组):,说明:,sex,=,性别(,1,为女,,2,为男),,age,=,年龄,,sbp_b,=,治疗前收缩压,,dbp_b,治疗前舒张压,,sbp_0,=,治疗后,0,分钟收缩压,,dbp_0,治疗后,0,分钟舒张压,,,,group,=,分组,72,sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10
23、dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 group,2 65 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0 2,2 69 180.0 80.0 180.0 80.0 184.0 80.0 184.0 80.0 184.0 80.0 2,2 63 150.0 92.0 146.0 90.0 146.0 90.0 146.0 90.0 150.0 90.0 2,2 65 160.0 100.0 160.0 100.0 162.0 100.0 160.0 98.0 160.0 98.0 2,1 77 170
24、.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 2,2 51 150.0 90.0 142.0 80.0 142.0 80.0 146.0 80.0 146.0 80.0 2,2 69 170.0 110.0 166.0 108.0 170.0 110.0 170.0 110.0 170.0 110.0 2,1 60 160.0 100.0 150.0 100.0 158.0 100.0 158.0 100.0 160.0 100.0 2,1 64 170.0 100.0 168.0 98.0 168.0 98.0 170.0 100.0
25、 170.0 100.0 2,2 58 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 2,1 60 180.0 96.0 180.0 96.0 182.0 96.0 182.0 96.0 182.0 96.0 2,2 53 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 2,2 67 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 2,1 66 150.0 90.0 150.0 90.0 154.0
26、 92.0 154.0 92.0 154.0 92.0 2,1 70 160.0 100.0 158.0 96.0 160.0 100.0 160.0 100.0 160.0 100.0 2,2 62 155.0 94.0 152.0 94.0 155.0 92.0 155.0 94.0 155.0 94.0 2,1 67 164.0 98.0 160.0 95.0 160.0 95.0 164.0 98.0 164.0 98.0 2,续前表,(对照组),73,实时分析处理立体表,(Online Analytic Processing Cubs),Analyze/Reports/OLAP Cu
27、bs,综合统计变量,分组变量,拟统计内容,统计学内容,74,求均值和标准偏差(立体报表),75,求均值和标准偏差(立体表不同层统计结果),治疗组(,1,),对照组(,2,),男性组(整体),女性组(整体),76,取消层合并为平面报表,双击,OLAP Cubs,表,Pivot/Move Layer to Rows,Pivot/Move Layer to Rows,或,Pivot/Reset Pivot Defaults,还原表,77,综合表,Analyze/Reports/Case Summaries,78,样本综合表(无分组),79,样本分组综合表,80,样本综合表(分类统计),不显示个体,可
28、进行分类,统计,81,鼠标双击综合,表上的对象可,进行文字修改,Edit/SPSS Pivot,Table Object/Edit,82,行输出综合报告,Report Summaries in Rows,行输出综合报告过程是以行的形式输出统计量,每个所选,的变量都在报告中产生一列。,Analyze/Report/Report Summaries in Rows,分组排序方式,83,综合统计,选项,页面设置,标题,预览,格式化,显示个体数据,变量,数据列变量选择,分组变量选择,84,分组综合统计内容,Summary,数据列格式化定义,Format,85,分组格式定义,Format,分组选项,Op
29、tions,分类间空行,每一分类从新一页开始,综合分析前的空行,页码从,1,开始,86,报表综合统计内容,Summary,报表标题设置,Titles,页眉,页脚,变量,87,行综合输出表结果,注意:行综合输出,适合于多项统计分析结果的输出,88,列输出综合报告,Report Summaries in Column,列输出综合报告过程是以列的形式输出统计量,每个所选,的变量都在报告中产生一列。,Analyze/Report/Report Summaries in Column,插入统计合计值,89,列综合输出表结果,注意:列综合输出仅适合于单项统计分析结果的输出,90,统计描述,频数表分析(,F
30、requencies,过程),描述性统计分析(,Descriptives,过程),平均数分析(,Means,过程),探索性分析(,Explore,过程),统计分析包括,统计描述,和,统计推断,。,统计描述是用统计图表、统计指标来描述资料的分布,规律及其数据特征。,目录,91,频数,(,frequency,):各组段内的数据个数,频数分布类型,有正态,左偏态和右偏态,算术均数,(,mean,):总体均数,,样本均数,X,几何均数,(,geometric mean,):原始数据分布不对称,但,经对数转换后呈对称分布的数据。几何均数,G,中位数,(,median,):指将一组数值从小到大排序后居于,
31、中间位置的那个数值。中位数,M,极差,(,range,):全距,R,,描述数据的分布范围,极差大说,明数据分布较分散,四分位数间距,(,inter-quartile range,):,Q,U,与,Q,L,的差距,相关统计学概念(,2,),92,百分位数(,percentile,):,Px,,如,P,25,,,P,50,等,四分为数:,Q,L,(下四分位数,,25%,),,Q,U,(上四分,位数,,75%,),方差,(,variance,):样本方差,S,2,,总体方差,2,标准差,(,standard deviation,):标准差,S,替代方差描述数据,分布的离散程度,变异系数,(,coef
32、ficient of variation,):,CV,,标准差与算术,均数之比,它描述数据分布的相对离散程度。,标准误,(,standard error,,,SE,)与,均数的标准误,(,standard,error of mean,,,SEM,):均数的标准误与标准差成正,比,与样本例数,n,的平方根成反比,93,频数表分析(,Frequencies,过程),Frequencies,分析过程可产生频数分布图、条形图、饼图、,直方图、计算任意百分位数、分布参数估计值、集中趋势与,离散趋势等各项统计学指标。,Analyze/Descriptive Statistics/Frequencies,统
33、计,图表,格式化,显示频数表,94,某市,1982,年,110,名,7,岁男童的身高资料:,序号,数据,cm,95,统计,图表,直方图,饼图,条形图,正态曲线,96,频数表,身高的各项统计学指标,集中趋势指标,离散趋势指标,偏度系数,峰度系数,分布参数估计值,四分位数,97,某城市,7,岁男童身高直方图,正态曲线,98,描述性统计分析(,Descriptives,过程),Descriptive,分析过程可计算数值变量的描述性统计量:,均数、总和、标准差、方差、全距、最小值、最大值、标准,误、峰度系数、偏度系数及标准化(,Z,值、,Z,分数)。,Analyze/Descriptive Stati
34、stics/Descriptives,99,Data/Select Cases,/If condition is satisfied sex=,男,Data/Select Cases,/All Cases,100,平均数分析(,Means,过程),Means,过程可分组计算指定变量的描述性计算如:均数、,总和、标准差、方差、观察例数等;可进行,单因素随机设计,方差分析,(,One-way analysis of variance,)和,线性检验,(,Test,for linearity,)。,第一层:,以,病情,分级,进,行分组,自变量列表,因变量列表,Analyze,/Compare Mea
35、ns/Means,101,第二层:,以,性别,进,行分组,均值,个体数量,标准差,中位数,102,第一层:病情分级,第二层:性别,中位数,103,续前表,总病例统计值,104,抗体滴度,X 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512,人 数,f 1 5 6 2 7 10 4 5,40,名麻疹易感儿的血凝抑制抗体滴度,平均抗体滴度统计表(,平均滴度为,1:64,),105,第一步:,建立分组变量,第二步:,加权频数变量,106,几何均数,第三步:,选择统计变量,和分组变量,第四步:,选择统计项目,107,探索性分析(,Explore,过程),Explor,过
36、程对数据进行探索性分析,包括,数据描述,、,筛,选,、,奇异值辨认,和,假设验证,,提供整体或分组数据的概要性统,计指标或图表,以了解数据的分布规律和特征以及亚组间的特,征性差异。提供,反应数据集中趋势的四种最大似然估计量,、,数,据中前,5,位最大值和最小值,、,正态分布检验,及,正态分布,Q-Q,图,、,转换前和多种转换后的,方差齐性检验,及,分布,-,水平散点图,。,108,女性:,66,名,281.14 162.82 339.26 206.04 214.19 294.24 120.37 332.60 191.95 144.76 207.67 255.37 419.86 621.73 9
37、84.81 841.97 330.86 229.97 273.67 147.20 179.07 215.55 203.72 258.34 100.40 53.71 684.86 422.84 655.12 354.67 462.16 186.35 206.41 112.71 81.71 185.54 218.39 106.90 141.48 119.18 160.22 82.86 180.46 486.38 228.43 263.99 398.26 74.31 359.48 434.70 579.99 102.51 280.48 171.75,86.32 298.43 412.01 453.1
38、5 478.43 78.28 374.38 371.23 147.26 130.89 301.08 234.21,男性:,83,名,169.49 125.82 190.62 262.67 279.77 181.48 286.85 262.20 308.34 101.09 215.60 822.86 566.27 207.51 163.33 193.32 121.89 182.52 147.31 269.30 243.46 225.86 106.90 123.27 134.27 118.60 227.46 148.01 167.59 166.06 275.34 119.80 327.97 100
39、.61 253.28 290.93 335.76 147.37 190.99 196.50 164.99 131.27 164.45 183.77 99.75 189.96 138.29 215.07 547.76 412.64 470.84 400.32 103.72 111.13 145.15 142.14 87.22 111.95 184.54 102.61 93.30 237.02 165.51,80.73 143.27 130.38 417.64 401.25 249.38 120.31 160.49 256.92 202.69 347.91 345.86 727.59 95.73
40、404.00 393.26 427.08 432.65 321.65 160.11,某医生测定了,149,名正常人的空腹血清胰岛素样因子,-1,水平:,109,Analyze/Descriptive Statistics/Explore,统计指标,统计图,110,描述性统计指标,反映集中性趋势的,4,种似然估算量,奇异值,百分位值及,Tukeys,折点,均值可信限范围,所有分析均忽略缺失值个体,分析中检验变量,含缺失值个体被忽略,缺失值作为分组之一,111,每个因变量,分别做箱图,多个因变量,在一个箱图,中显示,茎,-,叶图,直方图,正态分布,Q-Q,图,方差齐性检验及分布,-,水平散点图,方
41、差齐性的力度估计,数据转换,数据转换方式,112,描述性统计指标,113,反映集中性趋势的,4,种似然估算量,百分位值及,Tukeys,折点,114,奇异值,115,正态检验,方差正态检验,116,直方图,-1,117,直方图,-2,118,正态,Q-Q,图,-1,期望正态分布直线,119,正态,Q-Q,图,-2,期望正态分布直线,120,去势正态分布,Q-Q,图,-1,期望正态分布直线,121,去势正态分布,Q-Q,图,-2,期望正态分布直线,122,均数箱图,奇异值,P,50,均值,P,25,-P,75,123,分布自然对数,-,水平自然对数散点图,数据转换力度不接近,0,,表示要使两组方
42、差齐性,需做数据转换,124,数据转换,经数据转换后的方差正态齐性检验,选择自然,对数转换,基于均数的显,著性为,0.135,0.05,,表示接,受两组均数方,差的假设,125,126,先进行,IGF-1F,数据转换(自然对数),127,数据转换(,Ln,)后的描述性统计指标,128,数据转换(,Ln,)后的百分位值及,Tukeys,折点,数据转换(,Ln,)后的,4,种似然估算值,129,数据转换(,Ln,)后的奇异值,130,数据转换(,Ln,)后的正态检验,数据转换(,Ln,)后的方差正态齐性检验,两组间,方差齐性,P0.05,131,数据转换(,Ln,)后的直方图,正态分布,132,数
43、据转换(,Ln,)后的正态分布,Q-Q,图,接近期望正态分布直线,133,数据转换(,Ln,)后的去势正态分布,Q-Q,图,接近期望正态分布直线,134,T,检验,单样本,T,检验,独立样本,T,检验,配对样本,T,检验,目录,135,相关统计学概念(,3,),假设检验(,hypothesis test,)也称显著性检验(,significance test,),1,、,建立检验假设,(,hypothesis under test,),:,无效假设,,=,0,(样本均数,=,总体均数),H,0,2,、,建立备择假设,(,alternative,hypothesis,),:H,1,,若,H,0,
44、被否决,,则,H,1,成立。,3,、,设定检验水准,(,size of test,)或称显著性水准(,significance,level,),:,=0.05,(方差齐性检验,=0.10,,正态性检验,=0.20,),4,、,确定,P,值,作出推断,:推断结论包括统计结论和专业结论,,统计结论说明有统计学意义(,statistical significance,)或,无统计学意义(,no statistical significance,),若,P,,则拒,绝,H,0,,接受,H,1,,有统计学意义(统计结论);则可认为,不同或不等(专业结论)。,假设检验的方法:,t,检验,(,t-test,
45、或称,Students t-test,)和,u,检验,(,136,u-test,或称,Z-test,)。,t,检验应用条件:当样本量较小时(如,n50,),理论上要求样,本取自正态总体,两小样本均数比较时要求两样本总体方差,相等。,u,检验的应用条件:样本含量,n,较大,或,n,虽小但总体标准差已,知。,单样本,t,检验,(,one sample/group t-test,):即样本均数代表的,未知总体均数,和已知总体均数,0,(一般为理论值、标准值,或经过大量观察所得的稳定值)的比较。,配对,t,检验,(,paired t-test for dependent samples,),:两种情况
46、,(,1,)两个同质受试对象分别接受两种不同的处理;(,2,)同,一受试对象分别接受两种不同的处理。配对,t,检验设两种处,理的效应相同,即,1,=,2,,则,1,-,2,=0,(即已知总体,0,)。,两样本,t,检验,(,tow-sample t-test for independent samples,):,完全随机设计两样本均数的比较。当关心两总体均数,1,,,2,是否相等时,理论上应考虑是否两总体方差相同,即,齐性方,差,(,homogeneity,),若相等直接接受,t,检验。,137,单样本,T,检验(,One-sample T Test,),SPSS,的,One-sample T
47、 Test,过程用于执行单样本,T,检验,它,是进行单变量均数与一常数或假设值的比较,要求单变量为定量,变量(数值型变量)。,Analyze,/Compare Means/One-sample T Test,检验变量,检验值,138,T,检验:样本均数与总体均数的比较,问题,:正常人的脉搏平均,72,次,/,分,现测得,10,例某病患者的脉搏(次,/,分):,54,,,67,,,68,,,78,,,70,,,66,,,67,,,70,,,65,,,69,,试问此病患者与正常人有无显著性差别?,结论,:因,t=-2.453,,,df=9,,,P=0.0370.05,,有统计学意义;故此,病患者与
48、正常人脉搏有显著性差异。,139,问题,:某市,1982,年,110,名,7,岁男童的身高(,cm,)如下表,试估,计该市,7,岁男童身高的,95%,可信区间。,不设检验值,140,T,检验:总体均数的可信区间估计,结论,:因,t=-264.848,,,df=109,,双侧概率,P0.05,,可认为,两总体方差相等。取,t=2.524,,,df=22,,,P=0.0190.05,,可认为,该地克山病患者与健康人的血磷值之间有统计意义。,两独立样本均数比较,144,两独立样本几何均数比较,问题,:选甲型流感病毒抑制抗体滴度(倒数),0.05,,可认为,两总体方差相等。取,t=-2.934,,,d
49、f=22,,,P=0.0080.05,,可认为,两种方法的免疫效果差别之间有统计意义。,146,配对样本,T,检验,SPSS,的,Paired-Samples T Test,过程用于执行配对样本,均数的比较。,Analyze,/Compare Means/Paired-Samples T Test,问题,:某单位研究饮食中缺乏维生素,E,与肝中维生素,A,含量的关,系,将同种属的大白鼠按性别相同,年龄、体重相近配成对子,,共,8,对并将每对种的两头动物随机分到正常饲料组和维生素,E,缺乏,组,经一定时期将大白鼠杀死,测得其肝中维生素,A,的含量,结,果如下。问不同饲料的大白鼠肝中维生素,A,含
50、量有无差别?,大白鼠对号(,1,):,1 2 3 4 5 6 7 8,正常饲料组(,x1,):,3550 2000 3000 3940 3800 3750 3450 3050,维生素,E,缺乏组(,x2,):,2450 2400 1800 3200 3250 2700 2500 1750,147,配对样本均数比较,配对变量,148,结论,:相关系数,=0.584,,,P,(,sig.,),=0.129,,认为两配对变量无相,关关系。,t=4.207,,,df=7,,,P=0.0040.05,,拒绝,H,0,,接受,H,1,,可以,认为各组方差齐同,156,方差分析表,结论,:,组间,F,值,=
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100