1、1 随机取组 有无重复试验的两种 本题是无重复DATA PGM15G;DO A=1 TO 4; /*A为窝别*/ DO B=1 TO 3; /*B为雌激素剂量*/INPUT X ; /*X为子宫重量*/OUTPUT;END; END;CARDS;106 116 145 42 68 115 70 111 133 42 63 87 ;RUN;ods html; /*将结果输出成网页格式,SAS9.0以后版本可用*/PROC GLM DATA=PGM15G;CLASS A B;MODEL X=A B / SS3;MEANS A B; /*给出因素A、B各水平下的均值和标准差*/MEANS B / S
2、NK; /*对因素B(即剂量)各水平下的均值进行两两比较*/RUN;ODS HTML CLOSE;2 2*3析因设计 两因素 完全随机 统计方法 2*3析因设计 tiff =f的开方 DATA aaa;DO zs=125,200;DO repeat=1 TO 2; /*每种试验条件下有2次独立重复试验*/do js=0.015,0.030,0.045;INPUT cl ;OUTPUT;END; END; END;CARDS;2.70 2.45 2.602.78 2.49 2.722.83 2.85 2.862.86 2.80 2.87;run;PROC GLM;CLASS zs js;MODE
3、L cl=zs js zs*js / SS3;MEANS zs*js;LSMEANS zs*js / TDIFF PDIFF; /*对 zs和js各水平组合而成的试验条件进行均数进行两两比较*/RUN;ODS HTML CLOSE;练习一:2*2横断面研究列链表 方法:卡方 矫正卡方 FISHER DATA PGM19A;DO A=1 TO 2;DO B=1 TO 2;INPUT F ;OUTPUT;END;END; CARDS;2 268 21;run;PROC FREQ;WEIGHT F;TABLES A*B / CHISQ;RUN;样本大小 = 57练习二:对裂列连表 结果变量 换和不换
4、 三部曲 1横断面研究 P0.05 RDATA PGM19B;DO A=1 TO 2;DO B=1 TO 2;INPUT F ;OUTPUT;END;END;CARDS;40 34141 19252;run;ods html;PROC FREQ;WEIGHT F;TABLES A*B / CHISQ cmh;RUN;ods html close;样本大小 = 57练习三:病例对照2*2 病例组中 有何没有那个基因 是正常的3.8倍, 则有可能导致痴呆 要做前瞻性研究 用对裂DATA PGM20;DO A=1 TO 2;DO B=1 TO 2;INPUT F ;OUTPUT;END; END;C
5、ARDS;24060360340;run;ods html;PROC FREQ;WEIGHT F;TABLES A*B / CHISQ cmh;RUN;ods html close;总样本大小 = 1000练习四:配对设计 隐含金标准2*2 MC卡方 检验 34和0在总体上(B+C40 用矫正卡方) 是否相等 则可得甲培养基优于乙培养基 一般都用矫正 因卡方为近似计算DATA PGM19F;INPUT b c;chi=(ABS(b-c)-1)*2/(b+c);p=1-PROBCHI(chi,1);求概率 1减掉从左侧积分到卡方的值chi=ROUND(chi, 0.001);IF p0.0001
6、 THEN p=ROUND(p,0.0001);FILE PRINT;PUT(打印在输出床口) #2 10 Chisq 30 P value(#表示行) #4 10 chi 30 p;CARDS;34 0;run;ods html close;练习五:双向有序R*C列连表 用KPA data aaa;do a=1 to 3;do b=1 to 3;input f ;output;end; end; cards;58 2 3 1 42 7 8 9 17 ;run;ods html;*简单kappa检验;proc freq data=aaa; weight f;(频数)tables a*b;tes
7、t kappa;run;*加权kappa检验;proc freq; weight f;tables a*b;test wtkap;run;ods html close;SAS 系统FREQ 过程频数 百分比 行百分比 列百分比 a * b 表ab合计1 2 3 1 5839.4692.0686.5721.363.173.7732.044.7611.116342.862 10.682.001.494228.5784.0079.2574.7614.0025.935034.013 85.4423.5311.9496.1226.4716.981711.5650.0062.963423.13合计 674
8、5.585336.052718.37147100.00a * b 表的统计量对称性检验统计量 (S)2.8561自由度3Pr S0.4144对称性检验指 总体上主对角线的上三角数相加是否与下三角三个数相加 对称性检验与KPA 检验是否一致 是否一个可以代替另一个检验 Pe理论观察一致率 独立假设性基础上计算的 相互独立 简单 Kappa 系数Kappa0.6809渐近标准误差0.050095% 置信下限0.583095% 置信上限0.7788H0 检验: Kappa = 0总体的H0 下的渐近标准误差0.0597Z11.4112单侧 Pr Z|Z| S0.4144简单 Kappa 系数Kapp
9、a0.6809渐近标准误差0.050095% 置信下限0.583095% 置信上限0.7788加权的 Kappa 系数加权的 Kappa0.6614渐近标准误差0.056095% 置信下限0.551695% 置信上限0.7711H0 检验: 加权的 Kappa = 0H0 下的渐近标准误差0.0646Z10.2406单侧 Pr Z|Z|.0001对加权的KPA检验 与简单的(利用对角线上的数据分析)加权还要利用对角线以外的数据分析 样本大小 = 147练习六:双向无序R*C 列连表 用卡方理论频数小于5没有超过五分之一,一般用卡方 实在不行用FISHER检验 超过用KPA 两种血型都是按小中大
10、排列 相互不影响 独立的 接受H0 不一致 行与列变量相互不影响DATA PGM20A;DO A=1 TO 4;DO B=1 TO 3;INPUT F ;OUTPUT;END;END;CARDS;431 490 902388 410 800495 587 950137 179 325;run;ods html;PROC FREQ;WEIGHT F;TABLES A*B / CHISQ;*exact;RUN;ods html close;样本大小 = 6094练习七:单向有序R*C 秩和检验 *方法1;(单因素非参数 HO三个药物疗效相同 H1不完全相等)DATA PGM20C;DO A=1 T
11、O 4;DO B=1 TO 3;INPUT F ; OUTPUT;END;END; CARDS;15 4 149 9 1531 50 45 5 22 24;run;ods html;PROC NPAR1WAY WILCOXON; FREQ F;CLASS B; VAR A; RUN;*方法2;(FIQ CHIM)proc freq data=PGM20C;weight f;tables b*a/cmh scores=rank;run;ods html close;总样本大小 = 270练习八: 双向有序 属性不同 R*C 4种目的4种方法 SPEARMAN秩相关分析DATA PGM20E;DO
12、 A=1 TO 3; DO B=1 TO 3;INPUT F ; OUTPUT;END; END;CARDS;215 131 148 67 101 128 44 63 132;run;ods html;PROC CORR SPEARMAN;VAR A B; FREQ F;RUN;ods html close;统计分析与SAS实现第1次上机实习题一、定量资料上机实习题要求:(1) 先判断定量资料所对应的实验设计类型;(2) 假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS软件实现统计计算;(3) 摘录主要计算结果并合理解释,给出统计学结论和专业结论。 【练习1】取4
13、窝不同种系未成年的大白鼠,每窝3只,随机分配到三个实验组中,分别注射不同剂量雌激素,经过一定时间后处死大白鼠测子宫重量,资料见表1。问剂量和窝别的各自水平下子宫重量之间的差别有无统计学意义?若剂量间差别有统计学意义,请作两两比较。表1 未成年大白鼠注射不同剂量雌激素后的子宫重量窝别子宫重量(g)剂量(g/100g):0.20.40.8合计1106116145367242681152253701111333144426387192合计2603584801098 【SAS程序】:程序1【练习2】一位工程师研究由钻头压力产生的冲力。考察了A(钻孔速度)和B(进料速度),两因素分别取2与3水平,各水平
14、组合下均做了两次独立重复实验,资料见表2。假定资料满足参数检验的前提条件,且两因素对观测结果的影响地位平等,已知冲力越小越好,试作分析,尽可能给出较为明确的统计和专业结论。表2 在钻孔速度和进料速度取不同水平的条件下冲力的测定结果 钻 孔 冲力(单位) 速 度 进料速度:0.015 0.030 0.045 125 2.70 2.45 2.60 2.78 2.49 2.72 200 2.83 2.85 2.86 2.86 2.80 2.87 【SAS程序】:程序2.二、定性资料上机实习题要求:(1)若题目中未给出表格,请列出标准的列联表,并对其命名;(2)若题目中已列出不规范的表格,先修改,然后
15、对其命名;(3)根据分析目的或自己提出分析目的、资料的前提条件选用相应的统计分析方法,并用SAS软件实现计算;(4)将主要计算结果摘录出来,给出统计学和专业结论。 【练习1】某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,结果如下表。试比较屠宰场与肉食零售点猪肉表层沙门氏菌的带菌率之间差别有无统计学意义?表1 屠宰场及肉食零售点猪肉表层沙门氏菌抽检结果采样地点检查数阳性数值带菌率(%)屠宰场282 7.14零售点29827.59 【SAS程序】:练习1【练习2】有人对某部门22707名雇员中,普查了HBsAg,其中3454名阳性,19253名为阴性。从1975年起,追踪了3
16、年,发现在阳性组有40名患了肝癌,阴性组仅一名患肝癌。试选用合适的方法对资料进行全面分析。【SAS程序】:练习2【练习3】APOE-4等位基因与老年痴呆性的关联研究:以600名晚发及散发老年痴呆患者和400名正常对照为研究对象,分析APOE-4等位基因与老年痴呆性的关系。表4 APOE-4等位基因与老年痴呆性病例对照关联研究AGT等位基因例数合计病例组对照组APOE-424060300非APOE-4360340700合计6004001000【SAS程序】:练习3【练习4】请分析下表资料。已从专业上认定培养的阳性结果就是“真阳性”,而不会出现假阳性。表3 两种培养基对同一批痰液标本同时培养的结果
17、甲培养基培养结果例数乙培养基结果:+-合计+363470-0135135合计36169205配对设计22列联表资料总体率差异性检验统计量的计算公式 若b+c40时若b+c40时【SAS程序】:练习4【练习5】请分析下表资料。表6 两法检查室壁收缩运动的符合情况对比法测 冠心病人数定的结果核素法正常 减弱 异常正 常 58 2 3减 弱 1 42 7异 常 8 9 17合计 67 53 27【SAS程序】:练习5简单kappa检验和加权kappa检验这两种方法都是用来检验两种评价方法是否具有一致性的方法。其主要的区别是两种方法计算的公式不一样,更具体地说是对两个变量的打分不一样,简单kappa检
18、验主要是利用对角线上的信息,加权kappa检验除了利用对角线上的数据外,还将对角线外的数据进行加权打分,将对角线外的信息也充分利用。所以在选择方法时应根据专业知识,如果两个变量取值的界线比较明确,如“+”“+”“+”等,这时可以选用简单的kappa检验,如果两个变量的取值不十分明确,人为的因素较多时,就可选用加权kappa检验。【练习6】请分析下表资料。表5 某地6094人按2种血型系统划分的结果ABO 人 数血型 MN血型:M N MNO 431 490 902A 388 410 800B 495 587 950AB 137 179 325合计 1451 1666 2977【SAS程序】:练习6 分析方法选择不超过1/5的格子理论频数5时,此类资料应采用检验处理。其他情形,可采用Fisher精确检验处理。【练习7】请分析下表资料。表7 3种药物疗效的观察结果疗 人 数效 药物 A B C治愈 15 4 1显效 49 9 15好转 31 50 45无效 5 22 24合计 100 85 85【SAS程序】:练习7【练习8】请分析下表资料。表8 眼晶状体混浊度与年龄之关系晶状体混 眼 数浊 程度 年龄20 30 40 215 131 148+ 67 101 128+ 44 63 132合计 326 295 408