资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,统计学:是一门处理数据中变异性的科学与艺术,内容包括收集、整理、分析、解释和表达数据,目的是求得可靠的结果。,医学统计学,(,Medical Statistics,),:是应用,概率论和数理统计,的原理和方法,研究,医学领域,中有关数据的搜集、整理、分析的一门应用科学。,一、统计学,(statistics),的定义及用途,统计学的用途,统计学好比总体和样本间的桥梁,;,帮助人们设计和实施从总体中科学地抽取样本,使样本中的个体不多也不少,信息丰富,代表性好;,帮助人们挖掘样本中的信息,推断总体的规律性;,帮助人们确切地描述样本中观察到的现象,恰当地解释总体中可能存在的规律性。,二、统计工作的基本步骤,1,、,统计设计,(,design,),:,包括观察性、实验性设计。对资料收集、整理和分析全过程进行的总体设想和安排。,2,、,收集资料,(,collection of data,):采取措施取得准确可靠的原始数据。,要求:准确、及时,来源:(,1,)统计报表,(,2,)经常性工作记录,(,3,)专题调查或实验,(二)总体和样本,总体,(,population,),:表示大同小异的对象(某个测量值)全体。或根据研究目的所确定的同质研究对象的全体(集合)。如一个国家的所有成年人(身高值);某地的所有小学生(身高值)。,样本,(,sample,),:从研究总体中随机抽取的一部分有代表性的个体(,individuals,)的观察值的集合;,抽样,(,sampling,),:从研究总体中抽取一部分有代表性的个体的方法;,数据,(,data,),:对样本中个体进行深入的观察与测量,获取的测量值。,有限总体:有明确的时间、空间范围限制的总体。,无限总体:没有明确的时间、空间范围限制的总体。,目标总体,(,target population,),:研究结果所要推论到的总体,即试图对某个总体下结论。,研究总体,(,study population,),:来源于目标总体中的一个较小的总体。,如关于吸烟与肺癌的研究以英国成年男子为目标总体;,1951,年英国全部注册医生只是成年男子中的一部分,是研究总体。,(三)参数与统计量,参数,(,parameter,),:,描述总体特征的指标,常用希腊字母表示。,统计量,(,statistic,),:描述样本特征的指标。常用拉丁字母表示。统计量是参数附近波动的随机变量,。,抽样误差,总体,样本,抽取部分观察单位,?,推断,inference,(四)变量的类型(数据的类型),卫生统计学中把所有的医学资料分为两大类:定性资料和定量资料。,住院号,年龄,身高,体重,住院天数,职业,文化程度,分娩方式,妊娠结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,157,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,某医院产科住院产妇基本信息,住院号,年龄,身高,体重,住院天数,职业,文化程度,分娩方式,妊娠结局,2025655,27,165,71.5,5,无,中学,顺产,足月,2025653,22,160,74.0,5,无,小学,助产,足月,2025830,25,158,68.0,6,管理员,大学,顺产,足月,2022543,23,161,69.0,5,无,中学,剖宫产,足月,2022466,25,159,62.0,11,商业,中学,剖宫产,足月,2024535,27,157,68.0,2,无,小学,顺产,早产,2025834,20,158,66.0,4,无,中学,助产,早产,2019464,24,158,70.5,3,无,中学,助产,足月,2025783,29,154,57.0,7,干部,中学,剖宫产,足月,Quantitative data,计量资料,Qualitative data,计数资料,观察单位,observations,个体,individuals,Units,;,elements,变量,variables,定性资料,:按某种属性分类,然后清点每类的数据,称计数资料,(,count data,),或,(enumeration data),。,也叫定性数据,(Qualitative data),。包括无序分类资料和有序分类资料。,无序分类变量,(,categorical variable,),资料:或名义变量,(,nominative variable,),变量只能定性的划分成两类或少数几个互相排斥的类别。有二分类,(,binary variable,),,多分类等等。,例如,性别(男女)、疾病(有无)和结局(生死)等。,有序分类变量,(,ordinal variable,),资料:变量值之间存在程度上的差别。,例如,问卷调查常问对某件事情的满意程度:极不满意、有点满意、中度满意、很满意、极满意。有些临床体检或实验室检验常用,、,、,+,、,+,和,+,来表示测量结果,定量变量资料,:用仪器、工具等测量,(measure),方法获得的数据,即为计量资料,(measurment data),。,变量值是定量的,表现为数值的大小,一般有度量衡单位。可分为离散型变量和连续型变量。,离散型变量,(,discrete variable,),:变量值只能取整数。,例如,一月中的手术病人数,一年里的新生儿数。,连续型变量,(,continuous variable,),:变量可以在实数轴上连续变动。,例如,血压、身高、体重等。,例:一组,20,40,岁成年人的血压(舒张压),以,12kPa,(,90mmHg,)为界分为正常与异常两组,统计每组例数。,8,低血压,8,正常血压,12,轻度高血压,15,中度高血压,17,重度高血压,计量资料,等级资料,计数资料,变量转化:变量只能由高级向低级转化。,离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。,连续型,有序,二值,(五)概率(,probability,),确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。,随机现象:在同样条件下,可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:随机性;规律性:每次发生的可能性的大小是确定的。,概率,(,probability,):,描述随机事件发生可能性大小的指标。常用,P,表示。,0 p 1,。,小概率事件,:发生的可能性小于等于,0.05,(,P 5,)或,0.01,(,P 1,)称为小概率事件,(,习惯,),,统计学上认为一次抽样过程中不大可能发生。,必然事件:必然会发生的事件(,P=1,)。,不可能事件:必然不会发生的事件(,P=0,),频率,frequency,样本的实际发生率称为频率。设在相同条件下,独立重复进行,n,次试验,事件,A,出现,f,次,则事件,A,出现的频率为,f/n,。,频率与概率间的关系:,样本频率总是围绕概率上下波动,样本含量,n,越大,波动幅度越小,频率越接近概率。,(六)误差,误差:实际观察值与客观真实值之差。,(,1,)系统误差,(,2,)随机误差,(,1,)系统误差(,systematic error,),概念:由人为因素造成的有一定倾向性或规律性的误差。(在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成)。流行病学称之为偏倚(,bias,)。,特点:观察值有系统性、方向性、周期性的偏离真值。,控制:可以通过严格的实验设计和技术措施消除。,(,2,),随机误差(random error),概念:排除上述误差后尚存的误差,受多种无法控制的偶然因素的影响。,特点:大小方向不一的随机变化。,种类:,测量误差(,measurement error,),抽样误差(,sampling error,),由于个体变异和抽样造成的样本统计量之间、样本统计量和总体参数之间的差异。,四、统计、计算机和统计软件的关系,统计和计算机的关系,统计和统计软件的关系,SPSS,软件,五、学习统计应注意的问题,注重培养统计思维(概率和应用),掌握统计的基本方法和技能,正确理解和表达统计分析结果,六、,医学统计学,主要学习内容,1,、统计描述(定量资料和分类资料的集中趋势和离散趋势指标、抽样误差和参数估计及常用统计图表);,2,、常见的理论分布及其应用(正态分布);,3,、总体参数的估计(分总体均数、总体率和总体平均数);,4,、假设检验(,t,检验、,u,检验、方差分析、相对数、四格表及列联表资料的卡方检验、秩和检验等);,5,、回归与相关;,6,、实验设计和调查设计,目的和要求,熟悉医学统计学的概念,掌握统计工作的基本步骤,掌握重要的统计学概念,掌握资料,/,数据的类型,统计描述,-,统计推断 总体,-,样本,参数,-,统计量 概率,-,小概率事件,定性资料,-,定量资料(计数资料,-,计量资料),抽样误差,
展开阅读全文