资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
研究生SPSS软件应用考试试题
1. 某医师收集到35份某肿瘤病历资料如下, 请在SPSS数据窗口, 定义变量, 标记变量名与变量值, 建立数据文件( 举例输入3-5例情况即可) 。
某病病历登记表( 节选) 编号: 00001
患者姓名: 张 * * 性 别: 男 女 出生日期: 1956 年 1 月 3 日
家庭住址: 迎泽 区 双塔西 街 公交公司居民楼二 社区
现从事的职业:
(1)工人 (2)农民 (3)党政机关干部 (4)离退休人员 (5)下岗职工 (6)学生
(7)商业 (8)外企 (9)私营业主 (10)科.教.文.体.卫工作者 (11)家务 (12) 其它
选择该院看病考虑的因素主要有: ( 多选)
( 1) 离家/单位近方便 ( 2) 医疗水平较高 ( 3) 是专科医院 ( 4) 病房环境好 ( 5) 服务态度好 ( 6) 大医院 ( 7) 设备/设施较先进 ( 8) 收费合理
( 9) 院内有熟人 ( 10) 其它
付费方式: (1) 基本医保 (2) 补充医保 (公务/企业/事业) ( 3) 商业保险 ( 4) 自费
肿瘤大小( cm) : 2.3 浸润程度: 轻 中 重 淋巴转移: 有 未发现
血红蛋白含量(g/L): 112 ……
答:
2. 将12只杂种犬随机分为两组, 一组海水灌注右肺( A1组) , 另一组海水灌注全肺( A2组) , 每组6只。每只动物分别于海水灌注前以及灌注后5min、 30min、 60min、 120min检测氧分压PaO2( kPa) , 试进行分析。
表1 海水灌注前后两组杂种犬的PaO2( kPa) 测定结果
A因素
动物
编号
海水灌注前后(B因素)
灌前
灌后5min
灌后30min
灌后60min
灌后120min
灌注右肺A1
1
90.0
69.0
62.0
61.0
66.0
2
90.0
68.0
62.0
50.0
66.0
3
90.0
70.0
68.0
55.0
62.0
4
89.0
80.0
50.0
60.0
50.0
5
90.0
72.0
60.0
61.0
66.0
6
89.0
69.0
62.0
50.0
61.0
灌注全肺A2
7
90.0
50.0
49.0
38.1
60.0
8
90.0
50.0
37.0
38.0
39.0
9
89.0
53.1
49.0
38.1
39.1
10
90.0
50.0
41.0
42.0
38.0
11
90.0
51.0
40.0
36.0
38.0
12
90.0
50.0
38.0
30.0
36.0
答: 本题的数据资料类型属于重复测量设计资料。重复测量资料是指对同一受试对象的某项观测指标进行多次测量所得到的数据。本题是包括一个处理因素A有2个水平, 一个重复测量因子B有5个水平。
分析步骤如下:
首先进行球形检验,
H0: 该重复测量数据满足”球对称”
H1: 该重复测量数据不满足”球对称”
=0.05
”球对称”检验结果见下表, 其中χ2=19.750, 自由度ν=9, P=0.022, 按=0.05水准, 拒绝H0, 接受H1, 有统计学意义。可认为各重复测量时间点杂种犬的氧分压有相关性, 不满足球性条件。当重复测量数据不满足”球对称”假设时, 应采用Greenhouse-Geisser的校正结果。
海水灌注前后两组杂种犬的PaO2( kPa) 测定结果( )
A因素
N
海水灌注前后(B因素)
灌前
灌后5min
灌后30min
灌后60min
灌后120min
灌注右肺A1
6
89.670.52
71.334.46
60.675.89
56.175.27
61.836.21
灌注全肺A2
6
89.830.41
50.681.25
42.335.35
37.033.96
41.689.04
① H0: 两种灌注方法的总体氧分压测定值相等
H1: 两种灌注方法的总体氧分压测定值不相等
=0.05
统计检验结果见下表, F=122.490, 自由度ν=1, P<0.001, 按=0.05水准, 拒绝H0, 接受H1, 有统计学意义。可认为两种灌注方法间的氧分压测定值差别有统计学意义。
② H0: 不同灌注时间的总体氧分压测定值相等
H1:不同灌注时间的总体氧分压测定值不全相等
=0.05
Greenhouse-Geisser统计分析方法的检验结果见下表, F=152.935, 自由度ν=1.907, P<0.001, 按=0.05水准, 拒绝H0, 接受H1, 有统计学意义。可认为不同灌注时间的的氧分压测定值不全相等。
③ H0:灌注方法与灌注时间的交互作用存在
H1:灌注方法与灌注时间的交互作用不存在
=0.05
Greenhouse-Geisser统计分析方法的检验结果见下表, F=9.981, 自由度ν=1.907, P=0.001, 按=0.05水准, 拒绝H0, 接受H1, 有统计学意义。可认为灌注方法与时间的交互作用有统计学意义。
3. 某课题组随访了50例急性淋巴细胞白血病患者治疗1年后的生存资料如下, X1为入院时白细胞数( ×109/L) , X2为淋巴结浸润度( X2=0为0级, X2=1为1和2级) , X3为缓解出院后是否进行巩固治疗( X3=1为有巩固治疗, X3=0为无巩固治疗) , Y为观察结果( Y=1为一年内死亡, Y=0为生存一年以上) 。试述你要采用何种统计方法分析, 为什么? 调整引入水准=0.05和=0.10, 剔除水准取=0.10, 采用向前与向后筛选结果是否有变化? ③试根据SPSS输出结果探讨影响观察结果( 一年内死亡) 的主要因素有哪些? ④实例分析结果中主要关心的统计分析指标有哪些? 如何具体解释协变量相对作用的大小及其专业意义? ⑤现有一急性淋巴细胞白血病病人, 如入院时白细胞数( ×109/L) 为 144, 淋巴结浸润度为2级, 出院后采用巩固治療, 按照logistic回归方程预估该病人在一年内死亡的可能性多大? ⑥根据软件输出列出论文结果表述时所需的主要统计图表。
表2 50例急性淋巴细胞白血病患者的生存资料
序
号
白细胞数
淋巴结浸润度
巩固治疗
结果
序
号
白细胞数
淋巴结浸润度
巩固治疗
结果
1
2.5
1
1
1
26
4.7
0
0
1
2
244.8
1
0
1
27
6.0
0
0
1
3
173.0
1
0
1
28
128.0
1
1
1
4
3.5
0
0
1
29
3.5
0
1
1
5
119.0
1
0
1
30
35.0
1
0
1
6
39.7
1
0
1
31
12.2
0
0
0
7
10.0
0
0
1
32
2.0
0
0
0
8
62.4
1
.00
1
33
10.8
0
1
0
9
502.2
1
0
1
34
8.5
0
1
0
10
2.4
0
0
1
35
21.6
1
1
0
11
4.0
0
0
1
36
2.0
0
1
0
12
34.7
1
0
1
37
2.0
0
1
0
13
14.4
1
1
1
38
2.0
0
1
0
14
28.4
1
0
1
39
3.4
0
1
0
15
2.0
0
0
1
40
4.3
0
1
0
16
190.0
1
1
1
41
5.1
0
1
0
17
40.0
1
0
1
42
14.8
0
1
0
18
30.6
1
0
1
43
2.4
0
0
0
19
6.6
0
0
1
44
4.0
0
1
0
20
5.8
0
1
1
45
1.7
0
1
0
21
21.40
1
0
1
46
5.1
0
1
0
22
6.10
0
0
1
47
1.1
0
1
0
23
270.0
1
0
1
48
12.0
0
1
0
24
2.7
0
1
1
49
12.8
0
1
0
25
250.0
1
0
1
50
1.4
0
1
0
答: 1、 以上资料类型应采用logistic回归, 因为该资料中的应变量Y为二分类资料, 故采用logistic回归进行资料的分析。
2、 结果分析如下:
下表为引入=0.10,剔除=0.10,采用Forword: conditional分析处理的统计结果。根据结果建立logistic回归方程为:
下表为引入=0.05,剔除=0.10,采用Forword: conditional分析处理的统计结果。根据结果建立logistic回归方程为:
从上述结果能够看出引入=0.05和=0.10, 剔除=0.10时向前分析的建 立logistic回归方程无差别。
下表为引入=0.10,剔除=0.10,采用Backword: conditional分析处理的统计结果。根据结果建立logistic回归方程为:
下表为引入=0.05,剔除=0.10,采用Forword: conditional分析处理的统计结果。根据结果建立logistic回归方程为:
从上述结果能够看出引入=0.05和=0.10, 剔除=0.10时向后分析的建 立logistic回归方程无差别。
而且上述四表中显示的最终筛选变量结果相同, 说明向前和向后两种分析结果也无差别。
从而能够得出logistic回归的方程为:
3、 影响结果的主要因素有: 淋巴结浸润度( X2) 、 缓解出院后是否进行巩固治疗( X3) 。
4、 实例分析结果中主要关心的统计分析指标有值及OR值的可信区间。根据logistic回归分析的回归系数β的含义为LnOR的改变量, 就能够得出流行病学研究中经常见到的比数比OR值。
结果解释:
变量X1( 入院时白细胞数) 的系数为0.015, 根据Wald检验结果显示无统计学意义;
变量X2( 淋巴结浸润度) 的系数为2.648, 根据Wald检验结果显示有统计学意义, 应用有意义的回归模型, X2的回归系数为3.328, =27.887, OR值的95%可信区间为( 2.621~296.678) , 可信区间不包括1, 且下限值>1, 说明淋巴结浸润度为危险因素, 即淋巴结浸润度为1和2级的患者一年内死亡的可能性是没有淋巴结浸润度患者的27.887倍;
变量X3( 缓解出院后是否进行巩固治疗) 的系数为-2.881, Wald检验结果显示有统计学意义, 应用有意义的回归模型, X3的回归系数为-2.905, =0.055, OR值的95%可信区间为( 0.010~0.312) , 可信区间不包括1, 且上限值<1, 说明缓解出院后是否进行巩固治疗为保护因素, 即缓解出院后进行巩固治疗的患者一年内死亡的可能性是缓解出院后没进行巩固治疗患者的5.5%。
5、 该病人在一年内死亡的可能性为: 83.087%。
6、 主要统计表为:
50例急性淋巴细胞白血病患者的生存资料Logistic逐步回归分析结果
选入变量
回归系数
b
标准误
Sb
Waldχ2
P值
OR值的95%可信区间
上限 下限
X2
3.328
1.206
7.611
0.006
27.887
2.621 296.678
X3
-2.905
0.887
10.713
0.001
0.055
0.010 0.312
常数项
1.168
0.661
3.126
0.077
3.217
4. 请你结合专业实际, 谈一谈学习本门课程的收获和下一步对博士课题的设想。
首先, 感谢统计教研室的刘老师和仇老师对我们的悉心教导。SPSS 软件功能强大, 操作简单, 是当前国际上最权威的统计分析软件之一。我在硕士研究生课程学习阶段并未选修多元统计学, 因此只是对基本统计方法有一些初步的了解, 但经过本次学习我对多元统计学有了一个较整体的了解, 对SPSS软件的界面及操作更加熟悉, 对各种统计方法也都有了进一步的认识。这次学习使我的统计方法使用能力得到了很大的提高。
良好统计学思路的把握对于科研工作起着重要指导作用。我是生物化学与分子生物学专业的研究生, 当前我的博士课题尚未确定, 应该是关于复合干细胞的生物治疗方面, 会涉及到制造细胞模型、 动物模型, 治疗途径、 剂量, 疗效检测手段、 监测标准等诸多方面, 整个课题设计需要大量的统计学知识支持, 我相信经过本次学习对多元统计学知识的补充, 为我今后的科研工作打开了思路, 会使科研设计更加周密, 使科研结果的解释更为合理。
展开阅读全文