资源描述
单击以编辑母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。不能作为科学依据。,李国春,流行病学和卫生统计教研室,南京中医药大学,统计软件SPSS10.0,1/30,1,统计方法复习与思考,2/30,2,统计方法,医学资料,选择合,适方法,选择合,适方法,3/30,3,变量的类型,数值变量(Numerical variable),分类变量(Categorical variable),等级变量(Rank variable),确定了变量类型,对于选择适当统计方法有非常主要作用。变量类型决定了资料类型,普通来说,不一样资料类型所用统计方法也不一样。如数值变量资料比较可选取t 检验、u 检验等统计方法,而率比较多用X,2,检验。在有些文章中,因为资料类型误判而造成统计方法失误,最常见错误是将数值变量资料错判为分类变量资料。,4/30,4,统计方法有很各种,实际上各种统,计方法都是研究,两个变量或多个变量之,间关系。,因为变量类型不一样,采取,统计方法也不一样。分清了变量类,型,对于特定资料选择正确统计方,法有极其主要作用。,统计方法与变量类型之间的关系,5/30,5,模型的解释,寻找疾病病因和寻找防治疾病药品或,方法这两类医学科研,其数学模型是相同;,即寻找两类事物或现象有没有因果关系。在寻,找疾病病因中,把研究原因作自变量indepe,ndent variable)X,疾病发生作因变量(dependent variable)Y(注意:不论自变量或因变量,能够是一个,也能够是两个或多个,后者应记为X,i,,和Y,i,,下同)。假如X对Y有作用(或有影响),则该研究原因是病因,不然不,6/30,6,模型的解释,是病因。在寻找防治疾病药品或方法中,把药品或方法作自变量X,疾病防治效果作因变量Y。假如X对Y有作用,则是有效药品或方法,不然不是。自然科学都有一个从定性研究向定量研究发展过程,数量化程度是科学成熟主要标志。统计方法也由:,单变量,多变量,神经网络,复杂关系,研究,7/30,7,病 因,X1、X2、,发病Y,药品或治疗方法,X1、X2、,疾病,痊愈,Y,因果链,原因factor,应因变量,independent variable,8/30,8,变量 X,变量 Y,=,结果变量,反应变量,因变量,响应变量,两变量之间的关系,自变量,协变量,分组变量,广 义 线 性(非线性)模 型,9/30,9,举例:,变量,组别(grp)类固醇排出量(Y),2.90 5.41 5.48 4.60 4.03 2.37 2.09,病人(1)5.10 4.97 4.24 4.36 2.72 7.10 5.92,5.18 8.79 3.14 6.46 3.72 6.64 5.60,健康人(0)4.57 7.71 4.99 4.01,分别测得14 例老年性慢性支气管炎病人,及11例健康人尿中17 酮类固醇排出量,(mg/dl),以下 ,试比较两组均数有没有差,别。,10/30,10,11/30,11,12/30,12,13/30,13,Y =5.528 -1.150 grp,14/30,14,15/30,15,16/30,16,变量 X,1,+,变量 X,2,+,变量 Y,=,结果变量,反应变量,因变量,多个变量之间的关系,自变量,协变量,分组变量,广 义 线 性 模 型,17/30,17,统计方法与变量的类型的关系,变量(或指标)类型,统计方法,变量,X,变量,Y,分类 数值 t,检验、方差分析,分类 分类 卡方检验,分类 等级 秩和检验,数值 数值 相关与回归分析,一元统计(两变量),18/30,18,变量(或指标)类型,统计方法,变量,Y,自变量,X,1,、,X,2,数值 数值 多元线性回归,二分类 分类(数值)Logistic回归,截尾 分类(数值)生存分析(Cox,回归),数值 分类 多原因ANOVA,数值 分类及数值 协方差分析,I型多元统计(多变量),19/30,19,型多元统计(多变量),变量类型,统计方法,X,1,X,2,X,3,X,4,数值 聚类分析(指标和样品),分类及数值 判别分析,数值 因子分析,数值 主成份分析,资料降维,20/30,20,确定变量,类型,单原因还,是多原因,单变量还,是多变量,选择合适的统计方法,21/30,21,选择合适的统计方法,变量,类型,资料,类型,统计方法,选择,参数检验,非参数检验,是否满足条件,是,否,22/30,22,统计方法选择应注意的问题,在设计(design)时,就应该考虑用什么统计方法,不一样设计往往所用统计方法是不一样。在众多临床科研设计中,每一个设计方法都有与之相适应统计方法。假如统计方法与设计方法不一致,统计分析得到任何结论都是错误。如在惯用统计方法中,成组设计(完全随机设计)t检验、配对t检验等,都是设计与统计方法相关佐证。,(分析方法直接依赖于所用设计),23/30,23,应用统计方法,一定要防止机械,套用公式。,要注意数理统计条件,数理统计和概率,论是统计学,理论基础,。每种统计方法都要,包括数理统计公式,而这些数理统计公式都,是在一定条件下推导和建立。也就是说,,只有当某个或一些条件满足时,某个数理统,计公式才成立,反之若不满足条件时,就不,能使用某个数理公式。,在数理统计公式推导和建立条件中,,包括最多是数据分布特征。数据分布特,24/30,24,征是指数据数理统计规律,许多数理统计,公式都是在特定分布下推导和建立。若,实际资料服从(符合)某种分布,即可使用,该分布所含有数理统计规律来分析和处理,该实际资料,反之则不能。在临床资料统,计分析过程中,包括得最多分布有正态分,布、偏态分布、二项分布等。除了数据分,布特征外,有些数理统计公式还有其它一些,条件,如方差齐性、理论频数大小等。,25/30,25,选择或构建适合本研究设计和资料类型,统计模型(statistic model)。,如:两原因两水平析因设计统计模型为:,Y=A +B +A*B,随机区组设计统计模型为:,Y=treat +block,而不是:Y=treat +block+treat*block,成组独立样本 t 检验统计模型为:,Y =group,26/30,26,尽可能选择量化统计指标。,值得注意是,有些临床工作者,经常,人为地将数值变量结果转化为分类变量,临床指标,然后参加统计分析,如患者血,红蛋白含量,研究者惯用正常、轻度贫血、,中度贫血和重度贫血来表示,这么即使照料,了临床工作习惯,却降低了资料所提供,信息量。换言之,在多数情况下,数值变量,27/30,27,尽可能选择量化统计指标。,资料提供信息量最为充分,可进行统计分,析伎俩也较为丰富、经典和可靠,与之相,比,分类变量在这些方面都不如数值变量资,料。所以,在临床试验中要尽可能选择量化,指标反应试验效应,若确实无法定量时,,才选取分类数据,通常不宜将定量数据转变,成份类数据。中医药研究中要尽可能使一些分,类或等级变量量化,这么选择统计方法余,地就较大,另外还要尽可能用硬指标(相对,客观指标),而少用软件指标。,28/30,28,谢谢大家,完,29/30,29,Thanks a lot,30/30,30,
展开阅读全文