资源描述
1. 随机取组 有无重复试验的两种 本题是无重复
DATA PGM15G;
DO A=1 TO 4; /*A为窝别*/
DO B=1 TO 3; /*B为雌激素剂量*/
INPUT X @@; /*X为子宫重量*/
OUTPUT;
END;
END;
CARDS;
106 116 145
42 68 115
70 111 133
42 63 87
;
RUN;
ods html; /*将结果输出成网页格式,SAS9.0以后版本可用*/
PROC GLM DATA=PGM15G;
CLASS A B;
MODEL X=A B / SS3;
MEANS A B; /*给出因素A、B各水平下的均值和标准差*/
MEANS B / SNK; /*对因素B(即剂量)各水平下的均值进行两两比较*/
RUN;
ODS HTML CLOSE;
2. 2*3析因设计 两因素 完全随机 统计方法 2*3析因设计 tiff =f的开方
DATA aaa;
DO zs=125,200;
DO repeat=1 TO 2; /*每种试验条件下有2次独立重复试验*/
do js=0.015,0.030,0.045;
INPUT cl @@;
OUTPUT;
END;
END;
END;
CARDS;
2.70 2.45 2.60
2.78 2.49 2.72
2.83 2.85 2.86
2.86 2.80 2.87
;
run;
PROC GLM;
CLASS zs js;
MODEL cl=zs js zs*js / SS3;
MEANS zs*js;
LSMEANS zs*js / TDIFF PDIFF; /*对 zs和js各水平组合而成的试验条件进行均数进行两两比较*/
RUN;
ODS HTML CLOSE;
练习一:2*2横断面研究列链表 方法:卡方 矫正卡方 FISHER
DATA PGM19A;
DO A=1 TO 2;
DO B=1 TO 2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
2 26
8 21
;
run;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ;
RUN;
样本大小 = 57
练习二:对裂列连表 结果变量 换和不换 三部曲 1横断面研究 P《0.05 R
DATA PGM19B;
DO A=1 TO 2;
DO B=1 TO 2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
40 3414
1 19252
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ cmh;
RUN;
ods html close;
样本大小 = 57
练习三:病例对照2*2 病例组中 有何没有那个基因 是正常的3.8倍, 则有可能导致痴呆 要做前瞻性研究 用对裂
DATA PGM20;
DO A=1 TO 2;
DO B=1 TO 2;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
240 60
360 340
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ cmh;
RUN;
ods html close;
总样本大小 = 1000
练习四:配对设计 隐含金标准2*2 MC卡方 检验 34和0在总体上(B+C《40 用矫正卡方) 是否相等 则可得甲培养基优于乙培养基 一般都用矫正 因卡方为近似计算
DATA PGM19F;
INPUT b c;
chi=(ABS(b-c)-1)**2/(b+c);
p=1-PROBCHI(chi,1);求概率 1减掉从左侧积分到卡方的值
chi=ROUND(chi, 0.001);
IF p>0.0001 THEN p=ROUND(p,0.0001);
FILE PRINT;
PUT(打印在输出床口) #2 @10 'Chisq' @30 'P value'(#表示行)
#4 @10 chi @30 p;
CARDS;
34 0
;
run;
ods html close;
练习五:双向有序R*C列连表 用KPA
data aaa;
do a=1 to 3;
do b=1 to 3;
input f @@;
output;
end;
end;
cards;
58 2 3
1 42 7
8 9 17
;
run;
ods html;
*简单kappa检验;
proc freq data=aaa;
weight f;(频数)
tables a*b;
test kappa;
run;
*加权kappa检验;
proc freq;
weight f;
tables a*b;
test wtkap;
run;
ods html close;
SAS 系统
FREQ 过程
频数
百分比
行百分比
列百分比
a * b 表
a
b
合计
1
2
3
1
58
39.46
92.06
86.57
2
1.36
3.17
3.77
3
2.04
4.76
11.11
63
42.86
2
1
0.68
2.00
1.49
42
28.57
84.00
79.25
7
4.76
14.00
25.93
50
34.01
3
8
5.44
23.53
11.94
9
6.12
26.47
16.98
17
11.56
50.00
62.96
34
23.13
合计
67
45.58
53
36.05
27
18.37
147
100.00
a * b 表的统计量
对称性检验
统计量 (S)
2.8561
自由度
3
Pr > S
0.4144
对称性检验指 总体上主对角线的上三角数相加是否与下三角三个数相加 对称性检验与KPA 检验是否一致 是否一个可以代替另一个检验 Pe理论观察一致率 独立假设性基础上计算的 相互独立
简单 Kappa 系数
Kappa
0.6809
渐近标准误差
0.0500
95% 置信下限
0.5830
95% 置信上限
0.7788
H0 检验: Kappa = 0
总体的H0 下的渐近标准误差
0.0597
Z
11.4112
单侧 Pr> Z
<.0001
双侧 Pr>|Z|
<.0001
总体的KPA是否为0 KPA大于0两种方法的一致性有统计学意义 小于0 不一致性有统计学意义
加权的 Kappa 系数
加权的 Kappa
0.6614
渐近标准误差
0.0560
95% 置信下限
0.5516
95% 置信上限
0.7711
置信区间不包括0 拒绝H0 按此计算结果可以用一种取代另一种方法 但要看专业要求达到多少才可以 观测一致率达到多少才可以代替
样本大小 = 147
FREQ 过程
频数
百分比
行百分比
列百分比
a * b 表
a
b
合计
1
2
3
1
58
39.46
92.06
86.57
2
1.36
3.17
3.77
3
2.04
4.76
11.11
63
42.86
2
1
0.68
2.00
1.49
42
28.57
84.00
79.25
7
4.76
14.00
25.93
50
34.01
3
8
5.44
23.53
11.94
9
6.12
26.47
16.98
17
11.56
50.00
62.96
34
23.13
合计
67
45.58
53
36.05
27
18.37
147
100.00
a * b 表的统计量
对称性检验
统计量 (S)
2.8561
自由度
3
Pr > S
0.4144
简单 Kappa 系数
Kappa
0.6809
渐近标准误差
0.0500
95% 置信下限
0.5830
95% 置信上限
0.7788
加权的 Kappa 系数
加权的 Kappa
0.6614
渐近标准误差
0.0560
95% 置信下限
0.5516
95% 置信上限
0.7711
H0 检验: 加权的 Kappa = 0
H0 下的渐近标准误差
0.0646
Z
10.2406
单侧 Pr> Z
<.0001
双侧 Pr>|Z|
<.0001
对加权的KPA检验 与简单的(利用对角线上的数据分析)加权还要利用对角线以外的数据分析
样本大小 = 147
练习六:双向无序R*C 列连表 用卡方理论频数小于5没有超过五分之一,一般用卡方 实在不行用FISHER检验 超过用KPA 两种血型都是按小中大排列 相互不影响 独立的 接受H0 不一致 行与列变量相互不影响
DATA PGM20A;
DO A=1 TO 4;
DO B=1 TO 3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
431 490 902
388 410 800
495 587 950
137 179 325
;
run;
ods html;
PROC FREQ;
WEIGHT F;
TABLES A*B / CHISQ;*exact;
RUN;
ods html close;
样本大小 = 6094
练习七:单向有序R*C 秩和检验
*方法1;(单因素非参数 HO三个药物疗效相同 H1不完全相等)
DATA PGM20C;
DO A=1 TO 4;
DO B=1 TO 3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
15 4 1
49 9 15
31 50 45
5 22 24
;
run;
ods html;
PROC NPAR1WAY WILCOXON;
FREQ F;
CLASS B;
VAR A;
RUN;
*方法2;(FIQ CHIM)
proc freq data=PGM20C;
weight f;
tables b*a/cmh scores=rank;
run;
ods html close;
总样本大小 = 270
练习八: 双向有序 属性不同 R*C 4种目的4种方法 SPEARMAN秩相关分析
DATA PGM20E;
DO A=1 TO 3;
DO B=1 TO 3;
INPUT F @@;
OUTPUT;
END;
END;
CARDS;
215 131 148
67 101 128
44 63 132
;
run;
ods html;
PROC CORR SPEARMAN;
VAR A B;
FREQ F;
RUN;
ods html close;
统计分析与SAS实现第1次上机实习题
一、定量资料上机实习题
要求:
(1) 先判断定量资料所对应的实验设计类型;
(2) 假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS软件实现统计计算;
(3) 摘录主要计算结果并合理解释,给出统计学结论和专业结论。
【练习1】取4窝不同种系未成年的大白鼠,每窝3只,随机分配到三个实验组中,分别注射不同剂量雌激素,经过一定时间后处死大白鼠测子宫重量,资料见表1。问剂量和窝别的各自水平下子宫重量之间的差别有无统计学意义?若剂量间差别有统计学意义,请作两两比较。
表1 未成年大白鼠注射不同剂量雌激素后的子宫重量
窝别
子宫重量(g)
剂量(μg/100g):0.2
0.4
0.8
合计
1
106
116
145
367
2
42
68
115
225
3
70
111
133
314
4
42
63
87
192
合计
260
358
480
1098
【SAS程序】:程序1
【练习2】一位工程师研究由钻头压力产生的冲力。考察了A(钻孔速度)和B(进料速度),两因素分别取2与3水平,各水平组合下均做了两次独立重复实验,资料见表2。假定资料满足参数检验的前提条件,且两因素对观测结果的影响地位平等,已知冲力越小越好,试作分析,尽可能给出较为明确的统计和专业结论。
表2 在钻孔速度和进料速度取不同水平的条件下冲力的测定结果
钻 孔 冲力(单位)
速 度 进料速度:0.015 0.030 0.045
125 2.70 2.45 2.60
2.78 2.49 2.72
200 2.83 2.85 2.86
2.86 2.80 2.87
【SAS程序】:程序2.
二、定性资料上机实习题
要求:
(1)若题目中未给出表格,请列出标准的列联表,并对其命名;
(2)若题目中已列出不规范的表格,先修改,然后对其命名;
(3)根据分析目的或自己提出分析目的、资料的前提条件选用相应的统计分析方法,并用SAS软件实现计算;
(4)将主要计算结果摘录出来,给出统计学和专业结论。
【练习1】某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,结果如下表。试比较屠宰场与肉食零售点猪肉表层沙门氏菌的带菌率之间差别有无统计学意义?
表1 屠宰场及肉食零售点猪肉表层沙门氏菌抽检结果
采样地点
检查数
阳性数值
带菌率(%)
屠宰场
28
2
7.14
零售点
29
8
27.59
【SAS程序】:练习1
【练习2】有人对某部门22707名雇员中,普查了HBsAg,其中3454名阳性,19253名为阴性。从1975年起,追踪了3年,发现在阳性组有40名患了肝癌,阴性组仅一名患肝癌。试选用合适的方法对资料进行全面分析。
【SAS程序】:练习2
【练习3】APOE-4等位基因与老年痴呆性的关联研究:以600名晚发及散发老年痴呆患者和400名正常对照为研究对象,分析APOE-4等位基因与老年痴呆性的关系。
表4 APOE-4等位基因与老年痴呆性病例对照关联研究
AGT等位基因
例数
合计
病例组
对照组
APOE-4
240
60
300
非APOE-4
360
340
700
合计
600
400
1000
【SAS程序】:练习3
【练习4】请分析下表资料。已从专业上认定培养的阳性结果就是“真阳性”,而不会出现假阳性。
表3 两种培养基对同一批痰液标本同时培养的结果
甲培养基
培养结果
例数
乙培养基结果:
+
-
合计
+
36
34
70
-
0
135
135
合计
36
169
205
配对设计2×2列联表资料总体率差异性检验统计量的计算公式
若b+c≥40时
若b+c<40时
【SAS程序】:练习4
【练习5】请分析下表资料。
表6 两法检查室壁收缩运动的符合情况
━━━━━━━━━━━━━━━━━━━
对比法测 冠心病人数
定的结果核素法∶正常 减弱 异常
───────────────────
正 常 58 2 3
减 弱 1 42 7
异 常 8 9 17
───────────────
合计 67 53 27
━━━━━━━━━━━━━━━━━━━
【SAS程序】:练习5
简单kappa检验和加权kappa检验这两种方法都是用来检验两种评价方法是否具有一致性的方法。其主要的区别是两种方法计算的公式不一样,更具体地说是对两个变量的打分不一样,简单kappa检验主要是利用对角线上的信息,加权kappa检验除了利用对角线上的数据外,还将对角线外的数据进行加权打分,将对角线外的信息也充分利用。所以在选择方法时应根据专业知识,如果两个变量取值的界线比较明确,如“+”“++”“+++”等,这时可以选用简单的kappa检验,如果两个变量的取值不十分明确,人为的因素较多时,就可选用加权kappa检验。
【练习6】请分析下表资料。
表5 某地6094人按2种血型系统划分的结果
━━━━━━━━━━━━━━━━━━━
ABO 人 数
血型 MN血型:M N MN
───────────────────
O 431 490 902
A 388 410 800
B 495 587 950
AB 137 179 325
───────────────
合计 1451 1666 2977
━━━━━━━━━━━━━━━━━━━
【SAS程序】:练习6
• 分析方法选择
不超过1/5的格子理论频数<5时,此类资料应采用检验处理。
其他情形,可采用Fisher精确检验处理。
【练习7】请分析下表资料。
表7 3种药物疗效的观察结果
━━━━━━━━━━━━━━━━━━━
疗 人 数
效 药物∶ A B C
───────────────────
治愈 15 4 1
显效 49 9 15
好转 31 50 45
无效 5 22 24
───────────────
合计 100 85 85
━━━━━━━━━━━━━━━━━━━
【SAS程序】:练习7
【练习8】请分析下表资料。
表8 眼晶状体混浊度与年龄之关系
━━━━━━━━━━━━━━━━━━━
晶状体混 眼 数
浊 程度 年龄∶20~ 30~ 40~
───────────────────
+ 215 131 148
++ 67 101 128
+++ 44 63 132
───────────────
合计 326 295 408
━━━━━━━━━━━━━━━━━━━
展开阅读全文