1、2024/5/7 周二西安医学院公共卫生系卫生统计学卫生统计学卫生统计学卫生统计学流病统计教研室流病统计教研室雷静雷静2024/5/7 周二西安医学院公共卫生系统计学(统计学(statisticsstatistics),是研究数据的搜集、),是研究数据的搜集、整理与分析的科学,面对不确定性数据(偶然整理与分析的科学,面对不确定性数据(偶然性的)作出科学的推断。性的)作出科学的推断。意义:偶然性意义:偶然性 必然性(客观规律)必然性(客观规律)卫生统计学(卫生统计学(health statisticshealth statistics)是应用)是应用统计学的原理、方法(如概率论数理统计的理统计学
2、的原理、方法(如概率论数理统计的理论)研究医学数据资料的收集、整理、分析和论)研究医学数据资料的收集、整理、分析和推断的一门学科。推断的一门学科。绪论绪论2024/5/7 周二西安医学院公共卫生系医学统计的发展医学统计的发展早在早在1818世纪末,法国数学家世纪末,法国数学家LaplaceLaplace就认为医就认为医疗是概率论应用的一个重要领域;疗是概率论应用的一个重要领域;稍后,临床医生稍后,临床医生LouisLouis通过观察、计算、比较,通过观察、计算、比较,得出放血疗法(当时它被广泛用于伤寒、肺炎、得出放血疗法(当时它被广泛用于伤寒、肺炎、扁桃体炎等的治疗)无效的结论;扁桃体炎等的治
3、疗)无效的结论;1919世纪初,伦敦统计学会成立,此时统计学的世纪初,伦敦统计学会成立,此时统计学的目标是数据收集。目标是数据收集。2024/5/7 周二西安医学院公共卫生系Karl PearsonKarl Pearson(卡尔(卡尔皮尔逊)是英国生物皮尔逊)是英国生物学家和统计学家,现代统计学之父,开创了学家和统计学家,现代统计学之父,开创了统计方法学。统计方法学。他开始把数学运用于遗传和进化的随机过程,他开始把数学运用于遗传和进化的随机过程,首创次数分布表与次数分布图,提出一系列首创次数分布表与次数分布图,提出一系列次数曲线;推导出卡方分布,提出卡方检验;次数曲线;推导出卡方分布,提出卡方
4、检验;发展了回归和相关理论;发展了回归和相关理论;2020世纪初,世纪初,FisherFisher提出随机化实验,认为统提出随机化实验,认为统计学家在实验的设计阶段就必须参与,否则计学家在实验的设计阶段就必须参与,否则这样的实验可能会毫无意义。这样的实验可能会毫无意义。2024/5/7 周二西安医学院公共卫生系Austin Bradford HillAustin Bradford Hill,一位著名的英国公,一位著名的英国公共卫生学家、统计学家,是现代临床试验的共卫生学家、统计学家,是现代临床试验的主要推动者。他有三项重要的贡献:主要推动者。他有三项重要的贡献:他于他于19371937年发表在
5、著名的医疗期刊柳叶刀年发表在著名的医疗期刊柳叶刀(LancetLancet)上的一系列医学统计论文,这些论文被)上的一系列医学统计论文,这些论文被重新编入医学统计原理(重新编入医学统计原理(Principles of Medical Principles of Medical StatisticsStatistics)一书;)一书;他提出一些研究方针:关于他提出一些研究方针:关于如何遵循适当试验设计及研究方法,以获取有效的如何遵循适当试验设计及研究方法,以获取有效的数据,进而用来确认病因及病症之间的因果关系。数据,进而用来确认病因及病症之间的因果关系。是将随机处理的方法导入医学试验中。是将随机
6、处理的方法导入医学试验中。2024/5/7 周二西安医学院公共卫生系统计学是公共卫生专业人员的统计学是公共卫生专业人员的得力工具;得力工具;现代公共卫生领域对统计学同现代公共卫生领域对统计学同样也提出了新要求、新挑战。样也提出了新要求、新挑战。2024/5/7 周二西安医学院公共卫生系统计学的基本概念统计学的基本概念一、总体(一、总体(populationpopulation)与样本()与样本(samplesample)总体:总体:同质的所有观察单位某种变量值的集合。同质的所有观察单位某种变量值的集合。有限总体:如一定时刻某特定人群的有限总体:如一定时刻某特定人群的H H、W W无限总体:如用
7、某药治疗的患者(时间、空间上无限总体:如用某药治疗的患者(时间、空间上无限,观察数无限)。无限,观察数无限)。目标总体;研究总体目标总体;研究总体2024/5/7 周二西安医学院公共卫生系样本:样本:是从总体中随机抽取部分观察单位,其是从总体中随机抽取部分观察单位,其实测值的集合。实测值的集合。目的是用样本信息来推断总体特征。目的是用样本信息来推断总体特征。样本含量(样本大小、样本例数):即样本包样本含量(样本大小、样本例数):即样本包含的观察单位数。含的观察单位数。随机,不是随意,随机,不是随意,它应保证总体中每个个体被它应保证总体中每个个体被抽取的机率是相等的。抽取的机率是相等的。医学研究
8、的现象绝大多数是随机现象。医学研究的现象绝大多数是随机现象。2024/5/7 周二西安医学院公共卫生系二、同质与变异:二、同质与变异:同一总体中的个体间具有同质性同一总体中的个体间具有同质性变异:即同一总体中个体间存在差异的现象。变异:即同一总体中个体间存在差异的现象。由众多的、偶然的、次要的因素造成。由众多的、偶然的、次要的因素造成。不能由个体代替总体,如许多药物广告不能由个体代替总体,如许多药物广告 2024/5/7 周二西安医学院公共卫生系三、变量的类型三、变量的类型变量,即总体中个体的某种特性,变量,即总体中个体的某种特性,用一个或多个数量来描述。用一个或多个数量来描述。分定性和定量变
9、量两种分定性和定量变量两种2024/5/7 周二西安医学院公共卫生系定性,以分类变量最常见,分类变量又分为定性,以分类变量最常见,分类变量又分为有序和无序两种有序和无序两种无序分类变量包括二分类变量和多分类变量;无序分类变量包括二分类变量和多分类变量;有序分类变量即等级变量有序分类变量即等级变量定量,分为离散型变量和连续型变量两种。定量,分为离散型变量和连续型变量两种。离散型变量只能取整数值,如人数、菌落数;离散型变量只能取整数值,如人数、菌落数;连续型变量可以取实数轴上的任何数值,该变连续型变量可以取实数轴上的任何数值,该变量可以在实数轴上连续变动。量可以在实数轴上连续变动。特殊的连续型变量
10、:如血细胞计数,它们在以特殊的连续型变量:如血细胞计数,它们在以千或万为单位时可以取小数值,所以视为连续千或万为单位时可以取小数值,所以视为连续型变量。型变量。2024/5/7 周二西安医学院公共卫生系四、资料类型四、资料类型一般分为定量资料、定性资料两大类。一般分为定量资料、定性资料两大类。1.1.定量资料定量资料(measurement datameasurement data)是对每个观察单位(对象)的某项特征是对每个观察单位(对象)的某项特征(指标)进行定量测定所得到的资料。一般有(指标)进行定量测定所得到的资料。一般有度量衡单位,如身高、体重、浓度、脉搏、血度量衡单位,如身高、体重、
11、浓度、脉搏、血钠、血钾等。钠、血钾等。等比资料为其特例,如抗体滴度资料;等比资料为其特例,如抗体滴度资料;也可以为离散型资料,如细菌菌落数等。也可以为离散型资料,如细菌菌落数等。2024/5/7 周二西安医学院公共卫生系2.2.定性资料即计数资料、分类资料定性资料即计数资料、分类资料(enumeration dataenumeration data)1 1)无序分类资料:先将观察单位的某项)无序分类资料:先将观察单位的某项指标按性质或类别进行分组,然后计算各指标按性质或类别进行分组,然后计算各组的数目所得的资料。组的数目所得的资料。二项分类:两类间互相对立,二项分类:两类间互相对立,如如+、-
12、;治愈与未愈。;治愈与未愈。多项分类:互不相容的多个类别。多项分类:互不相容的多个类别。如血型(如血型(A A、B B、ABAB、O O)2024/5/7 周二西安医学院公共卫生系 2 2)有序分类资料:又称等级分组资料)有序分类资料:又称等级分组资料各类间既有程度的差别,又具计数资料的各类间既有程度的差别,又具计数资料的特性。又称特性。又称“半定量半定量”资料。资料。如:如:-、+、+;无效、有效、显效。;无效、有效、显效。根据需要,可以将定量资料转化为定性资料。根据需要,可以将定量资料转化为定性资料。试判断下列资料的类型试判断下列资料的类型2024/5/7 周二西安医学院公共卫生系试判断下
13、列资料的类型试判断下列资料的类型1.1.测得某班女生的身高资料如下测得某班女生的身高资料如下(cm)(cm):150150、152152、156156、159159、159159、160160、160160、161161、161161、162162、163163、165165、168168、170170。2.2.将上述资料加以整理,分为两组:将上述资料加以整理,分为两组:不超过不超过160 cm160 cm者者 7 7人人 超过超过160 cm160 cm者者 7 7人人3.3.较低较低 (150159150159)3 3人人 一般一般 (159164159164)8 8人人 较高较高 (16
14、4 164 )3 3人人2024/5/7 周二西安医学院公共卫生系五、参数与统计量五、参数与统计量统计学上常用一些典型的分布模式来近似的统计学上常用一些典型的分布模式来近似的描述变量取值的实际分布,称之为统计模型。描述变量取值的实际分布,称之为统计模型。常见的模型有:正态分布、二项分布、泊松常见的模型有:正态分布、二项分布、泊松分布等。分布等。描述总体分布特征的数值称之为参数;描述描述总体分布特征的数值称之为参数;描述样本分布特征的数值称之为统计量。样本分布特征的数值称之为统计量。THANK YOUSUCCESS2024/5/7 周二17可编辑2024/5/7 周二西安医学院公共卫生系六、设计
15、与分析六、设计与分析统计工作的步骤:统计工作的步骤:1.1.设计设计2.2.搜集资料搜集资料3.3.整理资料整理资料4.4.分析资料分析资料以上四步缺一不可,任何一步以上四步缺一不可,任何一步的缺陷,都会影响统计结果。的缺陷,都会影响统计结果。2024/5/7 周二西安医学院公共卫生系设计(设计(designdesign):内容包括资料搜集、整理和分析全过程内容包括资料搜集、整理和分析全过程 的总的设想和安排。的总的设想和安排。如:研究目的和假说如:研究目的和假说 观察对象和观察单位观察对象和观察单位 需搜集哪些原始资料需搜集哪些原始资料 用什么方式、方法取得这些资料用什么方式、方法取得这些资
16、料 怎样对所得资料进一步整理怎样对所得资料进一步整理 汇总、计算统计指标汇总、计算统计指标 如何控制误差?如何控制误差?预期结果?需要经费?等等。预期结果?需要经费?等等。返回2024/5/7 周二西安医学院公共卫生系搜集资料(搜集资料(collection of datacollection of data):):取得准确可靠的原始数据取得准确可靠的原始数据 资料来源:(资料来源:(1 1)统计报表)统计报表 (2 2)经常性的工作记录)经常性的工作记录 (3 3)专题调查或实验)专题调查或实验返回2024/5/7 周二西安医学院公共卫生系整理资料(整理资料(sorting datasort
17、ing data)即净化原始数据,使其系统化、条理化,即净化原始数据,使其系统化、条理化,便于进一步计算指标和分析。便于进一步计算指标和分析。返回2024/5/7 周二西安医学院公共卫生系分析资料(分析资料(analysis of dataanalysis of data)即计算有关指标,反映数据的综合特征,即计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。阐明事物的内在联系和规律。统计分析包括:统计分析包括:(1 1)统计描述()统计描述(descriptive statisticsdescriptive statistics)指用)指用统计指标、统计表、统计图等方法,对资料的数
18、量统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述,不涉及由样本特征及其分布规律进行测定和描述,不涉及由样本推论总体的问题。推论总体的问题。(2 2)统计推断()统计推断(inferential statisticsinferential statistics)指如)指如何抽样,及如何由样本信息推断总体问题(包括参何抽样,及如何由样本信息推断总体问题(包括参数估计和假设检验)。数估计和假设检验)。返回2024/5/7 周二西安医学院公共卫生系复习复习1.1.随机现象:在基本条件不变的情况下,观察随机现象:在基本条件不变的情况下,观察的实验,可能出现这种结果,也可能出现
19、那的实验,可能出现这种结果,也可能出现那种结果,呈现出一种偶然性,这种现象称随种结果,呈现出一种偶然性,这种现象称随机现象。机现象。随机试验的三个特点:随机试验的三个特点:可在相同条件下重复进行;可在相同条件下重复进行;每次试验的可能结果不止一个,并且事先能明确每次试验的可能结果不止一个,并且事先能明确试验的所有可能结果;试验的所有可能结果;进行一次试验之前不能确定哪一种结果会出现。进行一次试验之前不能确定哪一种结果会出现。2024/5/7 周二西安医学院公共卫生系2.2.随机事件(随机事件(random eventrandom event)随机事件:在随机试验中,可能出现的结果随机事件:在随
20、机试验中,可能出现的结果称为随机事件。称为随机事件。频率频率:在相同条件下重复进行:在相同条件下重复进行N N次随机试验次随机试验中,若事件中,若事件A A出现出现m m次,则次,则m/Nm/N称为事件称为事件A A在在N N次试验中出现的频率,简称为事件次试验中出现的频率,简称为事件A A的频率的频率记作记作W W(A A)。)。大量的重复试验显示,某事件出现的频率具大量的重复试验显示,某事件出现的频率具稳定性,说明随机事件出现的可能性大小是稳定性,说明随机事件出现的可能性大小是事件本身固有的一种客观属性,可以对它进事件本身固有的一种客观属性,可以对它进行度量。行度量。2024/5/7 周二
21、西安医学院公共卫生系3.3.概率概率(probabilityprobability)统计定义:若在某一组条件下,当试验次数越统计定义:若在某一组条件下,当试验次数越来越多,事件来越多,事件A A出现的频率稳定在某一常数出现的频率稳定在某一常数p p附近作微小摆动,称常数附近作微小摆动,称常数p p为事件为事件A A的概率,的概率,记作记作P P(A A)=p=p是描述随机事件发生的可能性大小的数值是描述随机事件发生的可能性大小的数值。常用常用P P表示,事件表示,事件A A发生的概率记为发生的概率记为P P(A A)。)。频率频率一般是不确定的数,一般是不确定的数,概率概率则为确定的数;则为确
22、定的数;当试验次数足够多时,频率相对稳定,便把当试验次数足够多时,频率相对稳定,便把频率作为概率的近似值。频率作为概率的近似值。即即P P(A A)W W(A A)。)。2024/5/7 周二西安医学院公共卫生系概率的三个性质概率的三个性质(1 1)对于任何事件)对于任何事件A A,有,有0P0P(A A)1 1;(2 2)对于必然事件,)对于必然事件,P P(A A)=1=1;(3 3)对于不可能事件,)对于不可能事件,P P(A A)=0=0。2024/5/7 周二西安医学院公共卫生系4.4.小概率事件小概率事件:习惯将习惯将P0.05P0.05或或P0.01P0.01称为小概率称为小概率
23、事件。表示事件发生的可能性很小。事件。表示事件发生的可能性很小。这种小概率事件在一次试验中可以认这种小概率事件在一次试验中可以认为不会发生为不会发生 即即小概率原理小概率原理。以此作为。以此作为假设检验判断的基本依据。假设检验判断的基本依据。2024/5/7 周二西安医学院公共卫生系目标与方法目标与方法 一、基本概念、方法与技能一、基本概念、方法与技能1.1.能够正确理解基本概念,如置信区间、置能够正确理解基本概念,如置信区间、置信水平、样本量、差异有无显著性、差异信水平、样本量、差异有无显著性、差异有无统计学意义等等;有无统计学意义等等;2.2.方法的介绍:方法的介绍:设计方法:完全随机设计
24、、配对设计、配设计方法:完全随机设计、配对设计、配伍设计等;伍设计等;统计方法:统计方法:t t检验、检验、u u检验、卡方检验、线检验、卡方检验、线性相关回归、秩和检验等。性相关回归、秩和检验等。3.3.技能要求:会查书就是好学生。不必死记技能要求:会查书就是好学生。不必死记公式,只需注意公式间的区别、知道如何公式,只需注意公式间的区别、知道如何使用,如何通过统计软件完成分析、计算使用,如何通过统计软件完成分析、计算?2024/5/7 周二西安医学院公共卫生系二、教与学的方法:二、教与学的方法:统计学不是数学!应用是根本目的。不需统计学不是数学!应用是根本目的。不需要死记硬背,理解概念与动手
25、实践是根本。要死记硬背,理解概念与动手实践是根本。对统计公式,只要求了解其意义、用途和对统计公式,只要求了解其意义、用途和应用条件,不必深究其数学推导。应用条件,不必深究其数学推导。2024/5/7 周二西安医学院公共卫生系卫生统计学的主要内容:卫生统计学的主要内容:(1 1)基本原理和方法)基本原理和方法 数据处理:统计描述数据处理:统计描述 统计推断统计推断 -参数估计参数估计 假设检验假设检验 研究设计:实验研究设计、调查研究设研究设计:实验研究设计、调查研究设计计 (2 2)健康统计:人口统计)健康统计:人口统计 疾病统计疾病统计 生长发育统计等生长发育统计等2024/5/7 周二西安医学院公共卫生系小结小结统计工作的步骤统计工作的步骤定量资料、定性资料定量资料、定性资料总体、样本总体、样本频率、概率、小概率事件频率、概率、小概率事件THANK YOUSUCCESS2024/5/7 周二32可编辑