1、SPSS在医学统计学中的应用孙平辉1目 录X X2 2 检验检验5 5秩和检验秩和检验6 6方差分析描述性研究描述性研究2 23 3t 检验基本操作4 41 1相关和回归相关和回归7 7综合应用综合应用8 82vv统计分析软件是数据分析的主要工具统计分析软件是数据分析的主要工具统计设计完成后,完整的数据分析过程包括统计设计完成后,完整的数据分析过程包括 数据的收集数据的收集 数据的整理数据的整理 数据的分析数据的分析vv统统计计学学为为数数据据分分析析过过程程提提供供一一套套完完整整的的科科学学的的方方法法论论,统计软件为数据分析提供了实现手段。统计软件为数据分析提供了实现手段。统计软件的应用
2、3vv弄清分析的目的,以统计理论为主线学习软件工具弄清分析的目的,以统计理论为主线学习软件工具vv正确收集待处理和分析的数据正确收集待处理和分析的数据vv弄弄清清统统计计概概念念和和统统计计含含义义,知知道道统统计计方方法法的的适适用用范范围,无需记忆公式围,无需记忆公式vv读读懂懂计计算算机机分分析析的的数数据据结结果果,发发现现规规律律,得得出出分分析析结论结论学习统计软件的方法4vvSPSSSPSS(Statistical Package for Social Science)(Statistical Package for Social Science)意即社会意即社会科学统计软件包,
3、是当今世界公认的最流行、最强大的三大科学统计软件包,是当今世界公认的最流行、最强大的三大统计分析软件统计分析软件(SPSS(SPSS、SASSAS和和BMDP)BMDP)之一。之一。SPSSSPSS的特点的特点:使用简单,易于学习。除了未输入计算机的原始数据需要人使用简单,易于学习。除了未输入计算机的原始数据需要人工输入外,用户只需要用鼠标操作菜单、按扭、对话框等就工输入外,用户只需要用鼠标操作菜单、按扭、对话框等就可以完成统计工作。可以完成统计工作。统计功能强大,使用方便。统计功能强大,使用方便。SPSSSPSS既包括最简单的描述统计分既包括最简单的描述统计分析,又具备多因素统计分析等很多专
4、业的统计方法。用户只析,又具备多因素统计分析等很多专业的统计方法。用户只要掌握统计分析方法的基本思路,即可得到满意的分析结果。要掌握统计分析方法的基本思路,即可得到满意的分析结果。灵活方便,开放性好。灵活方便,开放性好。SPSSSPSS具有很好的和其它软件交换数据具有很好的和其它软件交换数据和结果的能力。和结果的能力。SPSSSPSS可以读入可以读入 ExcelExcel、DatabaseDatabase等多种数等多种数据文件。据文件。便捷的数据输入便捷的数据输入 绘图能力强。绘图能力强。SPSS软件的应用5基本操作6SPSSSPSS软件是由软件是由数据管理数据管理和和统计分析统计分析两大模块
5、构成两大模块构成数据管理数据管理变量定义变量定义数据编辑数据编辑统计分析统计分析基本统计基本统计分析分析均值比较均值比较与检验与检验方差方差分析分析相关相关分析分析回归回归分析分析非参数非参数检验检验编辑统计编辑统计图形图形7基本操作启动启动SPSSSPSS后,首先进入后,首先进入SPSSSPSS主画面,也就是数据编辑窗口了主画面,也就是数据编辑窗口了在窗口的下方点击变量设置书签在窗口的下方点击变量设置书签“Variable ViewVariable View”,进入变量,进入变量设置窗口设置窗口81 1、变量的定义、变量的定义:变量名变量名:在在12.012.0之前不多于之前不多于8 8个字
6、符,从个字符,从12.012.0开始变量名称可以最多写开始变量名称可以最多写6464个字个字符长度。首字符不能是数字符长度。首字符不能是数字,其后可字母或数字。系统不区分变量名中的大小其后可字母或数字。系统不区分变量名中的大小写字符。写字符。变量类型:变量类型:SPSSSPSS变量有三种基本类型:数值型、字符型、日期型。变量有三种基本类型:数值型、字符型、日期型。变量宽度和小数点位数:变量宽度和小数点位数:对数值型变量定义宽度和小数点位数。字符型只定义对数值型变量定义宽度和小数点位数。字符型只定义宽度。日期型一般使用默认宽度,一旦日期格式确定了,宽度就确定了。宽度。日期型一般使用默认宽度,一旦
7、日期格式确定了,宽度就确定了。变量标签:变量标签:是对变量名附加的进一步说明。是对变量名附加的进一步说明。910点击点击AlignAlign出现一小下拉菜单,选择出现一小下拉菜单,选择“CenterCenter”,至此,至此,4 4个变量均定个变量均定义和设置完毕。电击窗口下方的义和设置完毕。电击窗口下方的“Data ViewData View”书签切换到书签切换到SPSSSPSS数据数据编辑窗口。在数据区填入各数据后,均为居中显示。编辑窗口。在数据区填入各数据后,均为居中显示。112 2、变量间的运算、变量间的运算为探讨高血压病患者的左心功能情况为探讨高血压病患者的左心功能情况,用颈动脉搏动
8、法测量用颈动脉搏动法测量1010例原发性高血例原发性高血压患者的收缩时间间期压患者的收缩时间间期(STI),(STI),检测结果如下表检测结果如下表。Q-S2LVETPEPPEP/LVET404298460316440306390286410298406290398290402288440308本例要让本例要让SPSSSPSS完成完成2 2个变量数个变量数据的运算据的运算,然后产生新的变量然后产生新的变量并自动录入数据表中并自动录入数据表中:PEP=Q-S2PEP=Q-S2LVETLVETPEP/LEVTPEP/LEVT比值比值=PEP/LEVT=PEP/LEVTQ-S2Q-S2为电为电-机械
9、总时间,机械总时间,LVETLVET为左室为左室排血时间,排血时间,PEPPEP为左室排血前时间,单为左室排血前时间,单位都是位都是msms。12设置和定义变量设置和定义变量输入数据输入数据Q-S2LVET404298460316440306390286410298406290398290402288440308数据录入数据录入 13根据关系式根据关系式PEP=Q-S2PEP=Q-S2LVETLVET换算换算PEP,PEP,并创建该新变量并创建该新变量1415返回数据编辑窗口16Q-S2LVETPEPPEP/LVET4042981060.35574603161440.4557440306134
10、0.43793902861040.36364102981120.37584062901160.40003982901080.37244022881140.39584403081320.4286运算后数据173 3、ExcelExcel问题的读取问题的读取启动启动SPSSSPSS程度进入主画面,点击程度进入主画面,点击 “OpenOpen”图标,弹出图标,弹出“Open FileOpen File”对对话框话框184 4、列联表资料的数据录入、列联表资料的数据录入病理病理类类型型SurvivinSurvivin表达表达阳性(例)阳性(例)阴性(例)阴性(例)正常子正常子宫宫内膜内膜 7 7333
11、3不典型增生子不典型增生子宫宫内膜内膜11 11 1616子子宫宫内膜癌内膜癌52522020首先分析所列数据的结构、内容和数据之间的关系。首先分析所列数据的结构、内容和数据之间的关系。病理病理类类型型SurvivinSurvivin表达表达例数例数正常子正常子宫宫内膜内膜阳性阳性 7 7不典型增生子不典型增生子宫宫内膜内膜阳性阳性1111子子宫宫内膜癌内膜癌阳性阳性5252正常子正常子宫宫内膜内膜阴性阴性3333不典型增生子不典型增生子宫宫内膜内膜阴性阴性1616子子宫宫内膜癌内膜癌阴性阴性202019首先分析所列数据的结构、内容和数据之间的关系。首先分析所列数据的结构、内容和数据之间的关系
12、。TypeTypeSurvivinSurvivinfreqfreq1 11 1 7 72 21 111113 31 152521 12 233332 22 216163 32 2202020在在”Data ViewData View”书签进入数据编辑窗口书签进入数据编辑窗口,输入数据如下输入数据如下.21描述性研究22描述性研究例例1 1:收集:收集3232例某种癌症患者体重(例某种癌症患者体重(kgkg)的资料见下表:)的资料见下表:7081575828484867496367574947446057546472665251654051704546516057启动启动SPSSSPSS,进行变
13、量的设置,进行变量的设置1 1、均值、标准差、标准误、全距、方差和峰度的计算、均值、标准差、标准误、全距、方差和峰度的计算23首先分析所列数据的结构、内容和数据之间的关系。首先分析所列数据的结构、内容和数据之间的关系。weight7081575828:46516057数据录入数据录入 24数据分析数据分析数据分析数据分析25结果:262 2、中位数、众数和四分位数、中位数、众数和四分位数数据见例数据见例1 1:程序操作程序操作结果:27定量资料的正态性检验定量资料的正态性检验例例2 2:为探讨胸部放疗和化疗对人体心功能的影响,对接受胸部放、:为探讨胸部放疗和化疗对人体心功能的影响,对接受胸部放
14、、化疗的肿瘤患者进行运动耐量试验。试对下列数据进行正态性检验以化疗的肿瘤患者进行运动耐量试验。试对下列数据进行正态性检验以了解其是否呈正态分布。了解其是否呈正态分布。肺癌放化肺癌放化疗组疗组(n=11)肺癌化肺癌化疗组疗组(n=9)对对照照组组(n=10)8.05.45.45.68.59.010.54.311.38.59.06.59.08.55.55.86.77.711.09.07.09.612.69.56.35.67.27.710.813.928group1group2group38.08.511.39.06.77.06.37.710.85.49.08.58.57.79.65.610.513
15、.94.411.09.05.54.312.67.29.06.55.69.55.8数据录入2930频数资料的正态性检验频数资料的正态性检验例例3 3:调查某地区不同年龄组女性被动吸烟的情况,收集资料见下表。:调查某地区不同年龄组女性被动吸烟的情况,收集资料见下表。试对该资料做正态性检验。试对该资料做正态性检验。年年龄组龄组303141516170调查调查人数人数231298332427302110本例数据为频数表资料。年龄是按每本例数据为频数表资料。年龄是按每1010岁划分组。为达到岁划分组。为达到SPSSSPSS程序程序的要求,将统计表作下述转换,即:年龄分组取该组年龄段的中间值的要求,将统计
16、表作下述转换,即:年龄分组取该组年龄段的中间值年年龄组龄组253545556575调查调查人数人数231298332427302110agefreq252313529845332554276530275110数据录入3132结果:33t 检验34例例4 4:随机选取心率在:随机选取心率在60100/min60100/min的的4848例陈旧性下壁心肌梗死患者,例陈旧性下壁心肌梗死患者,对其体表心电图进行对其体表心电图进行PRPR间期测定。测量结果如下表。已知次心率段的间期测定。测量结果如下表。已知次心率段的PRPR间期正常值为(间期正常值为(1601601818)msms,试用统计学方法分析该
17、组陈旧性下,试用统计学方法分析该组陈旧性下壁心肌梗死患者体表心电图壁心肌梗死患者体表心电图PRPR间期是否较正常人为长。间期是否较正常人为长。单样本单样本t t检验检验19619818615920819020418618221218018020118620920918517819216020917517920235PR196198186159208:209175179202数据分析数据录入36结果:37两独立样本两独立样本t t检验检验例例5 5:对:对1212名宫颈癌患者(病人组)和名宫颈癌患者(病人组)和1515名年龄等其他情况相似的健康名年龄等其他情况相似的健康女性(对照组)进行血清癌胚
18、抗原女性(对照组)进行血清癌胚抗原CEACEA(单位(单位ng/mlng/ml)测定,所测得的)测定,所测得的数据资料见下表。试用统计学方法检验宫颈癌患者血清数据资料见下表。试用统计学方法检验宫颈癌患者血清CEACEA是否较健康是否较健康人为高?人为高?病人病人组组(n=12)对对照照组组(n=15)14.2415.4911.099.913.382.407.205.975.473.984.674.7911.5114.0213.832.304.432.408.629.6616.210.339.285.8610.814.301.1338CEAgroup14.24115.49111.0919.911
19、3.9814.6714.79111.5118.6218.66116.20110.3313.3822.4027.2025.9725.47214.02213.8322.3024.4322.4029.2825.86210.8124.3021.132数据录入39数据分析40结果:41配对样本配对样本t t检验检验例例6 6:对:对1212例医学生进行临床技能操作考核,由例医学生进行临床技能操作考核,由2 2名资深教师分别进行名资深教师分别进行成绩评定,变量设置结构及数据录入格式如下。试问成绩评定,变量设置结构及数据录入格式如下。试问2 2名教师所评定的名教师所评定的成绩有无显著性差异成绩有无显著性差异
20、教教 师师学生成绩学生成绩教师教师A评定成绩评定成绩858488818585868787858883教师教师B评定成绩评定成绩82898784818685889083938342groupBgroupA83 83 83 83 93 93 88 88 83 83 85 85 90 90 87 87 88 88 87 87 85 85 86 86 86 86 85 85 81 81 85 85 84 84 81 81 87 87 88 88 89 89 84 84 82 82 85 85 数据录入43结果:44方差分析45单因素方差分析单因素方差分析例例7 7:某护校将某个班的:某护校将某个班的3
21、030名同学随机分成名同学随机分成3 3个组,分别进行同一内容个组,分别进行同一内容但不同方法的专业项目培训,结束后考核成绩数据录入格式如下,试求但不同方法的专业项目培训,结束后考核成绩数据录入格式如下,试求3 3种培训方法在该专业考核成绩上有无显著差异?种培训方法在该专业考核成绩上有无显著差异?组别组别专业考核成绩专业考核成绩方法方法A组组90899386909091929290方法方法B组组78918793919088959493方法方法C组组74908593908987959492462024/5/8 周三47grougroup pgradgrade e190189193:1921902
22、78291287:294293374390385:394392数据录入4849结果:5051随机区组设计资料的多因素方差分析随机区组设计资料的多因素方差分析例例8:8:为研究冠心病运动耐受情况,随机选取为研究冠心病运动耐受情况,随机选取3030名临床已经确诊为冠心病名临床已经确诊为冠心病陈旧性心肌梗死患者做分级运动试验,同时选取年龄相仿的陈旧性心肌梗死患者做分级运动试验,同时选取年龄相仿的3030例无冠例无冠心病者做对照。为了解性别因素对运动耐受的影响,心病者做对照。为了解性别因素对运动耐受的影响,2 2组观察对象再按组观察对象再按性别分成性别分成2 2个亚组。个组运动耐量的统计结果录入格式如
23、下。试分析个亚组。个组运动耐量的统计结果录入格式如下。试分析2 2组运动耐量有无统计学差异?组运动耐量有无统计学差异?组别组别性别性别运动耐量运动耐量观察组观察组男男1.06.25.44.86.25.04.55.74.14.93.56.04.32.17.2女女5.54.57.12.85.05.46.06.66.35.07.04.12.94.26.3对照组对照组男男5.29.98.56.513.59.48.410.411.78.311.19.59.412.111.5女女5.58.87.86.411.48.57.89.210.27.79.78.68.510.410.052数据录入grougroup
24、 psexMETs111.0115.2:112.1117.2125.5124.5:124.2126.3215.2219.9:2112.12111.5225.5228.8:2210.42210.05354结果:5556X2 检验57四格表资料的四格表资料的X X2 2检验检验例例9:9:为研究高脂饮食与冠心病的关系为研究高脂饮食与冠心病的关系,对一组实验大白鼠进行对一组实验大白鼠进行2 2种不同饮食种不同饮食的研究的研究,结果见下表结果见下表.问高脂饮食组冠心病患病率是否较普通饮食组为高问高脂饮食组冠心病患病率是否较普通饮食组为高?患病患病未患病未患病高脂高脂饮饮食食组组6753普通普通饮饮食食
25、组组2873disease12group167532287358groupdiseasefreq1167212812352273数据录入5960结果:61R RC C表资料的表资料的X X2 2检验检验例例10:10:对对207207例肺癌患者进行病理类型和发生脑转移关系的分析例肺癌患者进行病理类型和发生脑转移关系的分析,统计结果统计结果见下表见下表,问不同病理类型的肺癌转移发生率是否有差异问不同病理类型的肺癌转移发生率是否有差异?研究的对象为研究的对象为3 3个不同病理类型的肺癌患者个不同病理类型的肺癌患者,每类患者按是否发生脑转移分每类患者按是否发生脑转移分为为2 2组组,因此本例资料属于
26、因此本例资料属于3 32 2的的R RC C表资料表资料,有有2 2个定性变量个定性变量.肺癌病理肺癌病理类类型型脑转移脑转移有有无无腺癌腺癌2143鳞癌鳞癌1962小细胞癌小细胞癌293362groupdiseasefreq112112191329214322622333数据录入本例频数分配表和本例频数分配表和X X2 2检验的方法与例检验的方法与例9 9相同相同63结果:64X X2 2检验的检验的R RC C表分割表分割:首先进行腺癌与鳞癌两组间的两两比较首先进行腺癌与鳞癌两组间的两两比较,小细胞癌暂不参与。小细胞癌暂不参与。重新操作统计程序,得到结果65结果:其他组间两两比较方法与上述
27、方法一样。66秩和检验67定量资料两独立样本的秩和检验定量资料两独立样本的秩和检验例例11:11:将肺癌并发其他脏器转移的患者按是否转移灶治疗分为两组,一组在将肺癌并发其他脏器转移的患者按是否转移灶治疗分为两组,一组在常规治疗的基础上给予癌转移灶治疗(观察组),一组仅给予常规治疗常规治疗的基础上给予癌转移灶治疗(观察组),一组仅给予常规治疗(对照组),观察其生存时间(周)如下表。试问两组的生存时间差别有(对照组),观察其生存时间(周)如下表。试问两组的生存时间差别有无显著意义?无显著意义?癌癌转转移灶治移灶治疗疗(观观察察组组)(常(常规规治治疗疗)对对照照组组1212232311112525
28、404038387 75 54 4131320202 231313333191936366060171713139 95 5141419193 3343428281515424223233838151511112 221219 96 668grougroup ptimtime e1 112121 123231 111111 12525:1 142421 123231 138382 27 72 25 52 24 42 21313:2 221212 29 92 26 6数据录入6970结果:71成组设计等级成组设计等级/频数表资料的秩和检验频数表资料的秩和检验例例12:12:采用随机选例的原则,将
29、经冠脉造影检查的受检者分为采用随机选例的原则,将经冠脉造影检查的受检者分为2 2组,给予分组,给予分级心电图运动试验,得出以下统计资料。试比较级心电图运动试验,得出以下统计资料。试比较2 2组受检者心电图运动试组受检者心电图运动试验结果有无显著性差异?验结果有无显著性差异?分分组组治治疗结疗结果果显显效效有效有效无效无效A方案方案组组68138B方案方案组组9117272选择“DataWeight Cases”,进行频数说明的操作groupeffectfreq1168219121322111382372数据录入7374结果:75完全随机设计多组差别的秩和检验完全随机设计多组差别的秩和检验例例1
30、3:13:为研究精氨酸对小鼠截肢后淋巴细胞转化功能的影响,将为研究精氨酸对小鼠截肢后淋巴细胞转化功能的影响,将2121只昆明只昆明种小鼠等分成种小鼠等分成3 3组:组:AA组为对照组,组为对照组,B B组为截肢组,组为截肢组,C C组为截肢加精氨酸治组为截肢加精氨酸治疗组。试验观测脾淋巴细胞对疗组。试验观测脾淋巴细胞对HPAHPA刺激的增值反映,测量指标是刺激的增值反映,测量指标是3 3HH吸收量,吸收量,试问试问3 3组的组的3H3H吸收量有无显著性差异?吸收量有无显著性差异?测量指标测量指标A组组(对对照照组组)B组组(截肢截肢组组)C组组(截肢加精氨酸治截肢加精氨酸治疗组疗组)3H吸收量
31、吸收量301225328138945846822073841920251867958022688851359027756490127872884900366001717076groupgroupHPAHPA1 1301230121 1945894581 1841984191 1958095801 1135913590 01 1127812787 71 1660066002 2253225322 2468246822 2202520252 2226822682 2277527752 2288428842 2171717173 3813881383 3207320733 3186718673 38
32、858853 3649064903 3900390033 30 0数据录入7778结果:79相关和回归80直线相关分析直线相关分析例例14:14:对对2020例心脏病患者用完全同步法进行了左室压力曲线和心阻抗法左例心脏病患者用完全同步法进行了左室压力曲线和心阻抗法左室排血时间(室排血时间(LVETLVET)测定,所测的资料见下表。试分析两种方法的相关程)测定,所测的资料见下表。试分析两种方法的相关程度。度。阻抗法阻抗法导导管法管法阻抗法阻抗法导导管法管法阻抗法阻抗法导导管法管法阻抗法阻抗法导导管法管法31330630530030631029729428728929529528928828828
33、831331630931129329629529231131332131930029831131031831528328430130130130381m1m2313306287289313316311313318315305300295295309311321319283284306310289288293296300298301301297294288288295292311310301303数据录入8283结果:84多元线性回归多元线性回归例例15:15:对对1010例例15171517岁中学生进行了身高、体重、胸围、胸围呼吸差以及岁中学生进行了身高、体重、胸围、胸围呼吸差以及肺活量测定,
34、得出数据录入肺活量测定,得出数据录入SPSSSPSS程序如下。试做多元相关分析并求得回归程序如下。试做多元相关分析并求得回归方程。方程。10例例1517岁中学生岁中学生身高身高153164169166173163171165161163体重体重56595561586060575350胸围胸围65768178857583777375胸围呼吸差胸围呼吸差2.12.73.12.93.32.73.22.82.62.7肺活量肺活量2.092.743.062.883.282.723.172.852.602.6985y yx1x1x2x2x3x3x4x42.09 2.09 153 153 56 56 65
35、65 2.1 2.1 2.74 2.74 164 164 59 59 76 76 2.7 2.7 3.06 3.06 169 169 55 55 81 81 3.1 3.1 2.88 2.88 166 166 61 61 78 78 2.9 2.9 3.28 3.28 173 173 58 58 85 85 3.3 3.3 2.72 2.72 163 163 60 60 75 75 2.7 2.7 3.17 3.17 171 171 60 60 83 83 3.2 3.2 2.85 2.85 165 165 57 57 77 77 2.8 2.8 2.60 2.60 161 161 53 53 73 73 2.6 2.6 2.69 2.69 163 163 50 50 75 75 2.7 2.7 数据录入8687结果:888990综合应用912024/5/8 周三92