资源描述
单击此处编辑母版标题样式,Click to edit Master text styles,*,*,有趣的统计数字,1,一、概述,2,何为医学统计学,?,为什么要学医学统计学,?,如何学习医学统计学,?,1.,何为医学统计学,?,统计学(,statistics,):是一门研究数据的,搜集、整理、分析和推断,的科学。它指导人们在科学实践中如何有效地获取数据、正确地分析数据以及合理地解释所得到的结果。,医学统计学(,medical statistics,):是用统计学原理和方法研究医学问题,是统计学的一个分支。,C.R.,LAO,:“统计学关注的是如何探知由观察数据获取的知识中的不确定性的量度,以及如何明确在最小损失下的最优决策。”,3,中医的统计思想,汉,张仲景论广汤液,为十数卷,,用之多验,;,伤寒论序,余宗族素多,向余二百,建安纪年以来,犹未十年,其死亡者,,三分有二,伤寒十居其七,。,伤寒卒病论集,问曰:脉有阳结阴结者,何以别之?答曰:,其脉浮而数,能食,不大便者,此为实,名曰阳结也,,期十六日当剧,。其脉沉而迟,不能食,身体重,大便反硬,名曰阴结也。,期十四日当剧,。,伤寒论,卷第一,辨脉法第一,6,3.,如何学习医学统计学?,方法学,工具,,应用,是最终的目的,掌握最基本的概念、原理和方法,掌握各种统计方法的应用条件,归纳推理是统计学的逻辑规则,建立统计思维,结合专业知识来学习,练习、勤思善问、广泛阅读是学好统计学的关键,7,二、统计学常用的基本概念,变异,变量和随机变量,总体、个体和样本,统计量和参数,误差,概率,8,(一)变异(,variance,),统计学研究的对象就是有变异的事物。,变异,是指不同的个体在相同的条件下,对外界环境因素产生不同反应的现象。,如:同一疾病的人对同样治疗措施或治疗药物有不同的反应,治疗结局不同。,偶然,必然:概率论和数理统计,9,(二)随机变量,(random variable),变量,(,variable,),指可测量的不同观察单位、有变异的观察指标,在概率论中称为,随机变量,,统计上习惯用,大写拉丁字母,表示,如,X,、,Y,、,Z,、,。,变量取值可以用变量名加下标形式表示,如性别,X,1,=1,,,X,3,=0,。,10,编号(,ID,),性别(,X,),体重,(kg),(,Y,),疗效(,Z,),张,1,1,66,0,李,2,1,78,1,王,3,0,57,2,(三)总体、个体和样本,11,总体(,population,):根据研究目的确定的同质研究对象的全体(集合)。,个体(,individual,):总体中的一个研究单位或观察单位(,study unit,)。,样本(,sample,):从总体中,随机抽取,的部分观察单位的集合,抽样(,sampling,),从研究总体中抽取有代表性样本的过程,就称为抽样。,代表性,(representation),:指样本是总体的无偏估计。,可靠性,(reliability),:可重复,随机性,(randomization),:总体中的每个个体有相同的几率被抽中。随机抽样的方法有:,抽签法,机械抽样法:等间隔抽样或系统抽样,分层抽样,随机数字表,12,四、统计量和参数,13,参数,(parameter),:,描述总体特征的统计指标,如总体均数、标准差,采用,希腊字母,分别记为,、,。,固定的常数,统计量,(statistic),:根据样本观测值计算的描述样本特征的统计指标,如样本均数、标准差,采用,拉丁字母,分别记为,、,。,总体,样本,抽取部分观察单位,推断,inference,参 数,统计量,五、误差,(error),误差:指测量值(实际值)与真值(理论值)之差。,(,1,)随机误差(,random error,):随机测量误差(,random measurement error,)和抽样误差,(sampling error),(,2,)系统误差(,system error,),也称为偏差(,bias,,偏倚):由各种非随机因素所造成的测定值,系统地,偏离了真实值所产生的误差,。,准确度(,accuracy,):指所测得的数据能否真正反映该变量的实际水平。,可靠度(,reliability,):指所测定数据的可重复性。,14,六、概率(,probability,),确定性现象:在一定条件下,,一定,会发生或一定不会发生的现象。其表现结果为两种事件(,event,):肯定发生某种结果的叫,必然事件,;肯定不发生某种结果的叫,不可能事件,。,随机现象:在同样条件下,可能,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为,随机事件,。随机事件的特征:,随机性,;,规律性,:每次发生的可能性的大小是确定的。,概率:随机事件发生的可能性大小,用大写的,P,表示;取值,0,,,1,。,15,小概率事件,16,必然事件,P,=1,不可能事件,P,=0,随机事件,0,P,1,P,0.05,(,5,)或,P,0.01,(,1,)称为小概率事件,(,习惯,),,统计学上认为不大可能发生。,第二节 变量类型及统计数据分类,变量的类型决定数据的类型,一份统计数据中可能包括所有的变量类型。,17,一、变量类型(,),变量按变量值的性质分为不同类型:,分类变量,(categorical variable),:表现为互不相容的类别或属性,也称为定性变量。分类变量分为无序和有序两类:,无序分类变量,(unordered categorical variable),:指所分类别或属性之间无程度和顺序的差别。按照所分类别或属性的数量,还可以细分为:,二分类变量,(binary variable),,如男、女,中医的虚、实,阴、阳等;,多分类变量,(polytomous variable),,如中医的六气,风、寒、暑、湿、燥、火。,18,变量类型(,),有序分类变量,(ordinal categorical variable),:各类别之间有程度的差别。如:疾病的严重程度可以分为,轻、中、重;中医辨证中按脉的深浅,可以分为浮、中、沉。,数值变量,(numerical variable),:其变量值是定量的,表现为数值大小,有度量衡单位。如,例如:患者的身高(,cm,)、体重(,kg,)、血压(,mmHg,)、脉搏(次,/,分)、红细胞计数(,10,/L,);草药量(两或钱),19,变量的赋值或编码规则:,无序分类变量:可以任意赋值,如,1=,男,,0=,女;,有序分类变量:按照程度的升序或降序赋值,如,1=,轻,,2=,中,,3=,重。,二、统计数据的分类(数据类型),定性数据,(qualitative data),:又称计数资料,(counting/enumeration data),,分类变量。,1.,二项分类数据,(binary data),2.,多项分类数据,(polytomous data),:,(,1,)无序,(,2,)有序:等级资料,(ordinal data),定量数据,(quantitative data),:又称计量资料,(measurement data),,数值变量。,20,二、统计数据的分类,1.,定性数据:又称计数资料,按某种属性分类,然后清点每类的数据,特点:无固有计量单位,(,1,)二项分类数据,(,2,)多项分类数据(无序、有序),21,病人的性别:男、女,是否吸烟:是、否,无序:血型:,A,型、,B,型、,O,型、,AB,型,有序:,(半定性或半定量的观察结果,有大小顺序),吸烟:不吸、偶尔吸、有时吸、经常吸,变量类型与数据类型示意图,22,变量,数值变量,分类变量,有序分类变量,无序分类变量,二分类变量,多分类变量,等级变量,连续性变量,计数资料或定性资料,计量资料或定量资料,住院号,年龄,身高,体重,住院天数,职业,文化程度,分娩方式,妊娠结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,157,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,观察单位,observations,个体,individuals,变量,variables,Quantitative data,计量资料,Qualitative data,计数资料,Units,;,elements,23,资料间转换关系,24,例:一组,20,40,岁成年人的血压,以,12kPa,为界分为正常与异常两组,统计每组例数,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,定量资料,等级资料,二项分类数据,第二节 医学统计工作的内容,实验设计,(experiment design),收集资料,(collecting data),原始资料,(raw data),的来源,实验数据,现场调查资料,常规保存的记录,(routinely kept records),:医疗卫生工作纪录;报表;报告卡等,统计分析,(statistical analysis),25,本章重点,1.,掌握变量类型、数据的分类,2.,掌握统计学常用的几个基本概念:,总体、个体和样本,参数、统计量,误差,26,参考文献,Barbara Hazard Munro.Statistical Methods for Health Care Research(4,th,ed.).2001.,王洁贞,.,医学统计学,.2002,年,02,月 第一版,.,Jessica M.Utts,,,Robert F.Heckard.Mind on Statistics.-2,nd,ed.,金丕焕,.,医学统计学(第二版),.2003.,27,思考题,28,作业,指出上述思考题各个变量的类型。,结合专业,举出定性资料和定量资料的研究实例,并说明变量的编码方式,尝试进行数据类型的变换。(提示:可以到中医相关杂志或网络上搜集),29,
展开阅读全文