收藏 分销(赏)

人群健康研究的统计学方法.ppt

上传人:a199****6536 文档编号:3261195 上传时间:2024-06-27 格式:PPT 页数:223 大小:5.23MB
下载 相关 举报
人群健康研究的统计学方法.ppt_第1页
第1页 / 共223页
人群健康研究的统计学方法.ppt_第2页
第2页 / 共223页
人群健康研究的统计学方法.ppt_第3页
第3页 / 共223页
人群健康研究的统计学方法.ppt_第4页
第4页 / 共223页
人群健康研究的统计学方法.ppt_第5页
第5页 / 共223页
点击查看更多>>
资源描述

1、主讲:裴丽萍主讲:裴丽萍1 1卫生统计学授课提纲卫生统计学授课提纲课时:课时:3030第一讲医学统计的基本概念与基本步骤第二讲数值变量的统计描述;集中趋势指标第三讲数值变量的统计描述;离散趋势指标第四讲数值变量的统计推断:总体均数的估计第五讲两均数比较的假设检验第六讲分类变量的统计描述第七讲分类变量的统计推断:X2检验第八讲统计图表、复习、阶段考试复习、阶段考试2 2工作生活中常见的统计学问题如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)

2、3 3第一节第一节医学统计方法概述医学统计方法概述4 4在自然界,在人们的实践活动中,所遇到的现象在自然界,在人们的实践活动中,所遇到的现象一般可以分为两类:一般可以分为两类:确定现象确定现象随机现象随机现象(偶然现象)(偶然现象)一、一、统计学的意义透过偶然现象,分析、透过偶然现象,分析、判断和阐述事物的内在规律性判断和阐述事物的内在规律性5 5确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫发生某种结果的叫必然事件必然事件;肯定不发生某种结;肯定不发生某种

3、结果的叫果的叫不可能事件不可能事件。例如,向上抛一枚硬币,由于受到地心引力的作用,例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落我们把这类现象称硬币上升到某一高度后必定会下落我们把这类现象称为确定性现象(或必然现象)水在为确定性现象(或必然现象)水在2会结冰,会结冰,肯定肯定不发生称不发生称不可能事件不可能事件。6 6随机现象随机现象(偶然现象)(偶然现象)在一定的条件下,可能会出现各在一定的条件下,可能会出现各种不同的结果,也就是说,在完全相种不同的结果,也就是说,在完全相同的条件下,进行一系列观测或实验,同的条件下,进行一系列观测或实验,却未必出现相同的结果却

4、未必出现相同的结果7 7例如例如抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪一面朝上我们把这类现象称为随机现象(或偶然现象)同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中10环,也可能击中9环8环甚至脱靶等等也都是随机现象随机现象8 8统计规律性统计规律性对随机现象,从表面上看,由于人们事先不能知道会出现哪一种结果,似乎是不可捉摸的;其实不然人们通过实践观察到并且证明了,在相同的条件下,对随机现象进行大量的重复试验(观测),其结果总能呈现出某种规律性例如,多次重复抛一枚硬币,正面

5、朝上和反面朝上的次数几乎相等;对某个靶进行多次射击,虽然各次弹着点不完全相同,但这些点却按一定的规律分布;等等我们把随机现象的这种规律性称为统把随机现象的这种规律性称为统计规律性。计规律性。9 9统计学统计学是是以医学理论为指导,运用以医学理论为指导,运用统计学原理和方法研究医学领域中统计学原理和方法研究医学领域中居民健康状况以及卫生服务领域中居民健康状况以及卫生服务领域中有关数据的搜集、整理、分析的一有关数据的搜集、整理、分析的一门应用性科学门应用性科学,是是研究研究随机现象随机现象的的统计规律性统计规律性的的一门科学一门科学1010二、二、统计学的几个基本概念统计学的几个基本概念1.1.同

6、质与变异同质与变异2.2.总体与样本总体与样本3.3.变量及变量及变量变量值值4.4.参数与统计量参数与统计量5.5.抽样与误差抽样与误差6.6.概率概率11111.同质与变异同质与变异homogeneityandvariation同质同质:指事物的性质、影响条件或背景相:指事物的性质、影响条件或背景相同或非常相近。同或非常相近。变异变异:指同质的个体之间的差异:指同质的个体之间的差异。1212同质与变异的例子同质与变异的例子例例1调查调查2003年西安市年西安市7岁男童的身岁男童的身高和体重高和体重同质同质:2003年、西安市、年、西安市、7岁男童岁男童变异变异:身高和体重各不相同:身高和体

7、重各不相同例例2研究某降压药的疗效研究某降压药的疗效同质同质:高血压患者、用某药治疗:高血压患者、用某药治疗变异变异:疗效各不相同:疗效各不相同13132.总体与样本总体与样本populationandsample总体总体:根据研究目的:根据研究目的确定的确定的同质同质观察单位观察单位(个体)(个体)的的全体全体(集(集合)。分有限总体与合)。分有限总体与无限总体无限总体样本样本:从总体中随机:从总体中随机抽取的部分观察单位抽取的部分观察单位1414随机抽样随机抽样randomsampling为了保证样本的为了保证样本的可可靠性靠性和和代表性代表性,需,需要采用随机的抽样要采用随机的抽样方法(

8、在总体中每方法(在总体中每个个体具有个个体具有相同的相同的机会机会被抽到)。被抽到)。15153.变量及变量值变量及变量值研究者对每个观察单位的某项特征研究者对每个观察单位的某项特征进行观察和测量,这种特征称为进行观察和测量,这种特征称为变量变量,变量的测得值叫,变量的测得值叫变量值变量值(也叫观察值),称为资料。(也叫观察值),称为资料。统计上习惯用大写拉丁字母表示,如X、Y、Z、。变量值变量值习惯习惯用小写拉丁字母表示,如性别x11(男)、x21(男)、x30(女)、。编号编号(ID)性别性别(X)体重体重(kg)疗效疗效(Z)张张11660李李21781王王305721616表表表表11

9、201120名正常成年男子红细胞计量值名正常成年男子红细胞计量值名正常成年男子红细胞计量值名正常成年男子红细胞计量值(10(101212/L)/L)5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.

10、534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.57171

11、74.参数与统计量参数与统计量parameterandstatistic参数参数:总体总体的统计指标,的统计指标,如总体均数、标准差,采如总体均数、标准差,采用希腊字母分别记为用希腊字母分别记为、。(为为固定的常数固定的常数)总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记为。(参数附近波动的随机变量参数附近波动的随机变量)18185.抽样与抽样与误差误差(error)误差误差:实际:实际观察值观察

12、值与客观与客观真实值真实值之差之差(1)系统误差)系统误差(2)随机误差)随机误差1919(1 1)系统误差)系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为律性的误差。流行病学称之为偏倚偏倚(bias)。)。特点:观察值有特点:观察值有系统性系统性、方向性方向性、周期性周期性的偏离真值。的偏离真值。可以通过严格的可以通过严格的实验设计实验设计和和技术措施技术措施消除消除。2020

13、(2)随机误差随机误差random errorrandom error排除上述误差后尚存的误差,受多种无法控制排除上述误差后尚存的误差,受多种无法控制的因素的影响。的因素的影响。特点:大小方向不一的随机变化。特点:大小方向不一的随机变化。随机测量误差随机测量误差(randommeasurementerror)提高操作者熟练程度可以减少这种误差提高操作者熟练程度可以减少这种误差随机抽样误差随机抽样误差(randomsamplingerror):):由抽样造成的样本统计量和总体参数间的差异。由抽样造成的样本统计量和总体参数间的差异。2121指样本指标之间或与总体指标之间存在的差别。指样本指标之间或

14、与总体指标之间存在的差别。例如:随机抽取例如:随机抽取110名名7岁男孩,样本的平均身高一岁男孩,样本的平均身高一般不等于全体般不等于全体7岁男孩的平均身高;岁男孩的平均身高;(3)抽样误差:抽样误差:2222种类种类原因原因性质性质表现表现存在与解决存在与解决测量误差测量误差(系统)(系统)单一因单一因素素测值测值-真值真值方向单方向单一一大小一大小一致致可避免可避免查明并去除原查明并去除原因因测量误差测量误差(随机)(随机)测量变测量变异异测值测值-真值真值随机随机不可避免不可避免提高测量精度提高测量精度抽样误差抽样误差(随机随机)个体变个体变异异样本样本-总体总体样本样本-样本样本随机随

15、机不可避免不可避免增加样本含量增加样本含量三种误差的比较三种误差的比较23236.概率概率probability 概率:概率:随机事件发生的可能性大小,用大写的随机事件发生的可能性大小,用大写的P P表表示;取值示;取值00,1.1.是对总体而严的,属于参数是对总体而严的,属于参数。确定性现象确定性现象:在一定条件下,:在一定条件下,一定一定会发生或一定不会发生的现象。会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫其表现结果为两种事件:肯定发生某种结果的叫必然事件必然事件;肯定不发生某种结果的叫肯定不发生某种结果的叫不可能事件不可能事件。随机现象随机现象:在同样条件下:

16、在同样条件下可能可能会出现两种或多种结果,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件随机事件。随机事件的特征:随机事件的特征:随机性随机性;规律性规律性:每次发生的可能性的大小是确定的。每次发生的可能性的大小是确定的。2424样本的实际发生率称为样本的实际发生率称为频率频率(f)。设在相。设在相同条件下,独立重复进行同条件下,独立重复进行n次试验,事件次试验,事件A出现出现x次,则事件次,则事件A出现的频率出现的频率f=x/n。频率与概率间的关系:频率与概率间的关系:样本频率总是围绕概率上下波动样本频率总是围绕

17、概率上下波动样本含量样本含量n越大,波动幅度越小,频率越越大,波动幅度越小,频率越接近概率。接近概率。频率频率 frequencyfrequency2525必然事件必然事件 P P=1 =1 不可能事件不可能事件 P P=0 =0 随机事件随机事件 00P P11 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称为小概率事件小概率事件(习惯习惯),统计学上认为在一次,统计学上认为在一次实验或观察中该事件发生的可能性很小,可视实验或观察中该事件发生的可能性很小,可视为很可能不发生。为很可能不发生。小概率事件小概率事件2626三、三、统计资料的类型统计资料的类型

18、(一)变量一般可分为两类:(一)变量一般可分为两类:数值变量:数值变量:多为连续变量,也称定量或计量资料。分类变量分类变量:无序分类变量,无序分类变量,也称也称计数资料计数资料(定性资料)(定性资料)(二项分类;多项分类)(二项分类;多项分类)有序分类变量,也称有序分类变量,也称等级资料等级资料2727数值变量(计量资料)数值变量(计量资料)定义:定义:用仪器、工具等测量用仪器、工具等测量用仪器、工具等测量用仪器、工具等测量(measure)(measure)(measure)(measure)方法获得方法获得方法获得方法获得的数据,即为计量资料,也叫定量数据。即的数据,即为计量资料,也叫定量

19、数据。即的数据,即为计量资料,也叫定量数据。即的数据,即为计量资料,也叫定量数据。即通过通过度量衡的方法,测量每一个观察单位的某项统计度量衡的方法,测量每一个观察单位的某项统计指标的量的大小,得到的一系列数据资料。指标的量的大小,得到的一系列数据资料。例如:体重例如:体重(kg)(kg)与身高与身高(cm)(cm)特点:特点:1 1、有度量衡单位、有度量衡单位 2 2、多为连续性资料、多为连续性资料 (通过测量得到)(通过测量得到)2828(二)变量间的转化资料不同与其适应的统计分析方法资料不同与其适应的统计分析方法也不同,进行处理时要分清是什么也不同,进行处理时要分清是什么类型的资料,选择合

20、适的统计分析类型的资料,选择合适的统计分析方法进行分析。如:计量资料一般方法进行分析。如:计量资料一般选用选用t检验、方差分析。检验、方差分析。2929 三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等等级级资资料料计数资料计数资料3030四四、统计工作的基本步骤统计工作的基本步骤第一步第一步.统计设计:统计

21、设计:制定计划,对整个过程进行安排。是制定计划,对整个过程进行安排。是整个工作的关键。包括现场调查、实验设计。整个工作的关键。包括现场调查、实验设计。如何进行设计?举例。背景如何进行设计?举例。背景-目的目的-方法方法-内容内容-经费预算经费预算第二步第二步搜集资料搜集资料(现场调查现场调查):根据计划取得准确、可靠、根据计划取得准确、可靠、完整的原始资料完整的原始资料收集资料的方法有三种:统计报表、日常性工作、专题调收集资料的方法有三种:统计报表、日常性工作、专题调查。注重资料的真实性。查。注重资料的真实性。第三步整理资料:第三步整理资料:原始资料的整理、清理、核实、查原始资料的整理、清理、

22、核实、查对,使其条理化、系统化便于计算和分析。可借助于计算对,使其条理化、系统化便于计算和分析。可借助于计算机(常用软件:机(常用软件:SPSS、SAS)。)。第四步分析资料第四步分析资料(统计分析统计分析):统计学的关键所在。统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律。指标和数据,揭示事物内部的规律。3131统计描述:将计算出的统计指标与统计图统计描述:将计算出的统计指标与统计图表相结合,全面描述资料的数量特征及分表相结合,全面描述资料的数量特征及分布规律布规律统计推断:利用样本信息推断总体特征统计推断

23、:利用样本信息推断总体特征(总体参数的估计和假设性检验)(总体参数的估计和假设性检验)3232目标自测题目标自测题(单项选择题单项选择题单项选择题单项选择题)1、统计学上所说的样本是指(、统计学上所说的样本是指()A、按研究者要求取总体中有意义的部分、按研究者要求取总体中有意义的部分B随意抽取总体中任意部分随意抽取总体中任意部分C有意识地选择总体中典型部分有意识地选择总体中典型部分D按随机原则抽取总体中有代表性部分按随机原则抽取总体中有代表性部分E总体中的每一个个体总体中的每一个个体2抽样误差是由(抽样误差是由()A测量引起的测量引起的B个体差异造成的个体差异造成的C计算引起的计算引起的D采样

24、结果不准确引起的采样结果不准确引起的E试剂、仪器未校正引起的试剂、仪器未校正引起的3已知某地出生男婴平均体重已知某地出生男婴平均体重3.2公斤,从该地随机抽取名公斤,从该地随机抽取名出生男婴,测出生男婴,测得体重均数为得体重均数为3.3公斤则公斤则3.3公斤与公斤与3.2公斤不同公斤不同,主要原因是主要原因是()A个体变异个体变异B抽样误差抽样误差C样本均数不同样本均数不同D随机测量误差随机测量误差4研究某地正常成年男子血压情况,用未经校正的血压计测定研究某地正常成年男子血压情况,用未经校正的血压计测定200名正名正常成年人的血压值,所得资料可出现(常成年人的血压值,所得资料可出现()A系统误

25、差系统误差B随机测量误差随机测量误差C抽样误差抽样误差D个体差异个体差异E偶然误差偶然误差33335、为了了解某地、为了了解某地2029岁健康女性血红蛋白的正常值范岁健康女性血红蛋白的正常值范围,现随机调查了该地围,现随机调查了该地2000名名2029岁的健康女性,并对岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是(其血红蛋白进行测量,请问本次调查的总体是()A该地所有该地所有2029的健康女性的健康女性 B该地所有该地所有2029的健康女性的血红蛋白测量值的健康女性的血红蛋白测量值 C抽取的这抽取的这2000名名2029岁女性岁女性 D抽取的这抽取的这2000名名2029岁女性的

26、血红蛋白测量值岁女性的血红蛋白测量值3434B1型题型题A、计数资料(无序分类变量)、计数资料(无序分类变量)B、计量资料、计量资料(数值变量)(数值变量)C、等级资料(有序分类变量)、等级资料(有序分类变量)D、总体中的个体、总体中的个体6、身高是(、身高是()7、脉搏数(次、脉搏数(次/分)是(分)是()8、血型是(、血型是()9、疗效是(、疗效是()3535第二节数值变量的统计分析第二节数值变量的统计分析3636(一)频数表与频数分布(一)频数表与频数分布一、一、一、一、数值变量的数值变量的频数分布频数分布3737表表表表7-11027-1102名正常成年女子的体温值名正常成年女子的体温

27、值名正常成年女子的体温值名正常成年女子的体温值编号编号体温值体温值编号编号体温值体温值1 137.037.02 237.237.2959536.936.93 337.337.3969637.237.24 437.337.3979737.137.15 537.537.5989836.936.96 637.237.2999937.337.37 736.536.510010036.736.78 836.836.810110137.037.010210236.936.93838频数表的编制步骤频数表的编制步骤(1)求计算全距()求计算全距(极差)极差):即最大值与最小值之差,又:即最大值与最小值之差,

28、又称为称为极差极差。本例极差:本例极差:R=37。536。5=1。0(C)(2)决定决定组数组数、组段组段和和组距组距:根据研究目的和样本含量:根据研究目的和样本含量n确定。组距确定。组距=极差极差/组数,通常分组数,通常分10-15个组,为方便计,个组,为方便计,组距参考极差的十分之一组距参考极差的十分之一,再略加调整。再略加调整。本例本例i=R/10=1。0/10=0.1(C)(3)列出组段:第一组段应包含列出组段:第一组段应包含最小值最小值,最后一个组段,最后一个组段上限必须包含最大值上限必须包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4)划记计数划记计数:用划记法将所有数据

29、归纳到各组段,得:用划记法将所有数据归纳到各组段,得到各组段的频数。到各组段的频数。3939 组段组段 (1)划划 记记(2)频数,频数,f(3)组中值,组中值,X(4)fX(5)=(3)(4)36.5 一一136.5536.5536.6336.65109.9536.7正正536.75183.7536.8正正正正1236.85442.2036.9正正正正正正1736.95628.1537.0正正正正正正正正正正2537.05926.2537.1正正正一正正正一1637.15594.4037.2正正一正正一1137.25409.7537.3正正737.35261.4537.4437.45149.

30、8037.537.6一一137.5537.55 合计合计 1021023779.80均数3779.8/10237.06C4040(二)(二)频数分布图(见频数分布图(见P138图图7-1)人数4141(三三)频数表的分布特征频数表的分布特征集中趋势集中趋势(centraltendency):变量值集中变量值集中位置。本例在组段位置。本例在组段“37.0”。平均水平指标平均水平指标离散趋势离散趋势(tendencyofdispersion):变量变量值围绕集中位置的分布情况。离值围绕集中位置的分布情况。离“中心中心”位置位置越远,频数越小;且围绕越远,频数越小;且围绕“中心中心”左右对称。左右对

31、称。变异水平指标变异水平指标4242(四)频数分布类型(四)频数分布类型1、正态分布正态分布 正态分布是高峰位于中央(均数所在处)两侧逐渐降低且左右对称、不与横轴相交的钟型光滑曲线,也叫高斯分布,是,是,是,是最常见、最重要的一种连续型分布。最常见、最重要的一种连续型分布。最常见、最重要的一种连续型分布。最常见、最重要的一种连续型分布。2、偏态分布、偏态分布 有正偏态分布和负偏态分布有正偏态分布和负偏态分布4343正态分布:中间高、两边低、左正态分布:中间高、两边低、左右对称右对称正偏态分布:正偏态分布:长尾向长尾向右右延伸延伸负偏态分布:负偏态分布:长尾向长尾向左左延伸延伸4444(五)(五

32、)频数表和频数表和频数分布图的应用频数分布图的应用频数表和频数分布图可揭示频数的分布特征分布类型,是资料分析的基础,还可发现可疑值,我们可根据分布特征分布类型选择统计分析方法4545二、二、集中趋势集中趋势(平均指标)平均指标)又又称为称为平均数平均数反映了资料的集中趋势。反映了资料的集中趋势。常用的有:常用的有:1.算术均数算术均数(arithmeticmean),简称,简称均数均数(mean)2.几何均数几何均数(geometricmean)3.中位数中位数(median)4.众数众数(mode)4646(一)算术均数(一)算术均数(meanmean)为求和符号,读成sigma意义:一组性

33、质相同(同质)的观察值在数量上的平均水平。意义:一组性质相同(同质)的观察值在数量上的平均水平。表示表示(总体)总体)X(样本)(样本)计算:直接法、加权法(间接法)、计算机计算:直接法、加权法(间接法)、计算机特征:特征:(X-X)=0估计误差之和为估计误差之和为0。应用:正态分布或近似正态分布应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义注意:合理分组,才能求均数,否则没有意义。X X1 1+X2+X3+.+Xn+X2+X3+.+Xn=-=/n=-=/n n n 4747(二)(二)几何均数(几何均数(geometric meangeometric mean)几何均数

34、:变量几何均数:变量对数值的算术均对数值的算术均数的反对数。数的反对数。4848几何均数的适用条件与实例几何均数的适用条件与实例适用条件适用条件:呈倍数关系的等比资料或对数正态分:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料布(正偏态)资料;如抗体滴度资料意义:意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:表示:G例如:血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。此例的算术均数为此例的算术均数为22222,显然不能代表滴度的,显然不能代表滴度的平均水平。同一资料,几何均数平均水平。同一资料,几何均数时,表示在H0

35、成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。拒绝拒绝检验假设:检验假设:若P,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P时,按所取检验水准,拒绝H0,接受H1。正确理解结论的概率性(都隐含着犯错误的可能性)。正确理解结论的概率性(都隐含着犯错误的可能性)。126126其分析目的是推断样本所代表的未知总体均数与已知总体均数0有无差别。(三)均数的(三)均数的 t t检验检验检验检验1.1.样本均数与总体均数比较的样本均数与总体均数比较的t t检验检验检验检验127127

36、P151例7-17据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?128128(1)建立检验假设,确定检验水准H0:=0山区成年男子平均脉搏数与一般人群相等H1:0山区成年男子平均脉搏数与一般人群不等双侧=0.05(2)计算统计量:(3)确定P值,作出统计推断查附表9,t界值表,t0.05,24=2.064,t0.05,按=0.05水准,拒绝H1,可认为该山区健康成年男子的脉搏均数与一般健康成年男子的脉搏均数无差别。1291292.配对设计的均数比较在医学科学

37、研究中的配对设计主要有以下情况:配对的两个受试对象分别接受两种处理之后的数据;同一样品用两种方法(或仪器等)检验的结果;同一受试对象两个部位的数据。其目的是推断两种处理(或方法)的结果有无差别。1301303、两个样本均数比较、两个样本均数比较目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本所代表的总体均数间有无差别。所代表的总体均数间有无差别。方法方法:1).两个小样本均数比较的两个小样本均数比较的t检验检验:p153例例7-182).两个大样本均数比较的两个大样本均数比较的u检验检验:p155例例7-20131131假设检验中的注意事项要保证组间的可比性要根据研究目

38、的、设计类型和资料类型选用适当的检验方法正确理解差别有无显著性的统计学意义结论不能绝对化单、双侧检验应事先确定132132(四)I型错误与II型错误拒绝了实际上成立的H0,这类“弃真”的错误为I型错误(typeIerror)也称错误;不拒绝实际上不成立的H0,这类“存伪”的错误为II型错误(typeIIerror)也称错误。133133客观实际拒绝H0不拒绝H0H0成立I型错误()推断正确(1-)H0不成立推断正确(1-)II型错误()134134第三节分类变量的统计分析第三节分类变量的统计分析一、相对数一、相对数135135学习目标学习目标 叙述相对数的概念和常用种类叙述相对数的概念和常用种

39、类能计算及应用常用相对数指标能计算及应用常用相对数指标说出相对数应用时的注意事项说出相对数应用时的注意事项叙述率的抽样误差和总体率的估计叙述率的抽样误差和总体率的估计136136相对数的概念相对数的概念(一)计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。但绝对数通常不具有可比性:1、如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义2、如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义因此需要在绝对数的基础上计算相对数。相对数相对数相对数相对数:指几个相关数据或指标之比值指几个相关数据或指标之比值137137 (二二)常用的

40、相对数指标常用的相对数指标1.率:指现象或事件发生的率:指现象或事件发生的强度强度甲地人口甲地人口30003000,某年高血压患者,某年高血压患者300300人,患病率人,患病率10%10%;乙地人口乙地人口10001000,同年高血压患者,同年高血压患者250250人,患病率人,患病率25%25%。l 何处高血压流行情况严重?何处高血压流行情况严重?l 哪处高血压医治工作量较大?哪处高血压医治工作量较大?l 观察疾病防治工作的效果,应观察什么?观察疾病防治工作的效果,应观察什么?138138率:说明某现象发生的频率或强度。常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)

41、等表示,计算公式为:139139(1 1)计划生育统计指标)计划生育统计指标 1)出生率出生率(birth rate):某年出生人数某年出生人数同年平均人口数同年平均人口数出生率出生率=1000 =1000 2 2)人口自然增长率:)人口自然增长率:人口自然增长率人口自然增长率=出生率死亡率出生率死亡率社区常用的生命统计指标社区常用的生命统计指标社区常用的生命统计指标社区常用的生命统计指标140140生育率生育率=1000 =1000 某年出生人数某年出生人数同年平均育龄妇女数同年平均育龄妇女数3 3)生育率()生育率(fertility rate):):141141 (2 2)疾病统计指标疾

42、病统计指标 1 1)发病率()发病率(incidence rate):):发病率(年)发病率(年)=1000=1000 年内新发生病例总数年内新发生病例总数年平均人口数年平均人口数上年末人口数上年末人口数+本年末人口数本年末人口数2 2年均人口数年均人口数=某病发病率(年)某病发病率(年)=K=K 某年内某病新发生病例数某年内某病新发生病例数同年暴露人口数同年暴露人口数(式中(式中k k可为可为100%,1000,1100%,1000,1万万/1/1万万。)。)142142某一时点新旧病例数某一时点新旧病例数该时点观察人口数该时点观察人口数时点患病率时点患病率=K=K2)患病率患病率(prev

43、alence rate)年患病率年患病率=K=K某年内的新旧病例数某年内的新旧病例数同年平均人口数同年平均人口数3)感染率:(感染率:(infectious rate)感染率感染率=K=K受检阳性人数受检阳性人数受检总人数受检总人数1431434)罹患率罹患率:(attack rate)表达一次疾病流行期内的发病(患病)表达一次疾病流行期内的发病(患病)情况。常用于描述疾病的暴发流行情况。情况。常用于描述疾病的暴发流行情况。罹患率罹患率=K=K观察期内病例数观察期内病例数同期暴露人口数同期暴露人口数144144(3 3)死亡统计指标)死亡统计指标1 1)死亡率)死亡率(mortality ra

44、te):某年地区全部死亡数某年地区全部死亡数年均人口数年均人口数 l总死亡率总死亡率=10001000某年地区因某病死亡数某年地区因某病死亡数年均人口数年均人口数 l某病死亡率某病死亡率=10001000145145l婴儿死亡率婴儿死亡率:表示某年平均每表示某年平均每10001000名名出生人数中未活满一周岁的死亡数。出生人数中未活满一周岁的死亡数。l孕产妇死亡率孕产妇死亡率:指年内直接因妊娠、指年内直接因妊娠、分娩及产后疾病死亡的妇女分娩及产后疾病死亡的妇女人数与同年活产数的人数与同年活产数的比值。比值。1461462 2)某病病死率()某病病死率(case fatality rate)指某

45、类死因的死亡数占总死亡数的百分比。指某类死因的死亡数占总死亡数的百分比。某病病死率某病病死率=100%=100%某时期内因某病死亡人数某时期内因某病死亡人数同期患该病人数同期患该病人数3 3)死因构成:)死因构成:1471471 1)治愈率()治愈率(cure rate)(4 4)医院工作统计指标)医院工作统计指标 治愈率治愈率=100%=100%治愈病人数治愈病人数受治病人数受治病人数治疗有效人数治疗有效人数 受治病人数受治病人数 有效率有效率=100%=100%2 2)有效率()有效率(efficiency rate)3 3)生存率()生存率(survival rate)随访满随访满n n

46、年仍存活的病例数年仍存活的病例数 随访病例数随访病例数 存活率存活率=100%=100%148148 重点掌握发病率、患病率、死亡率的应用意重点掌握发病率、患病率、死亡率的应用意义,主要包括:义,主要包括:p 反映人群的健康状况,反映人群的健康状况,p 反映人群的卫生服务需求,反映人群的卫生服务需求,p 反映疾病对人群健康的威胁程度,反映疾病对人群健康的威胁程度,p 用于评价疾病防治效果,用于评价疾病防治效果,p 描述疾病的三间分布等,用于探讨病因。描述疾病的三间分布等,用于探讨病因。149149上一年度上一年度上一年度上一年度下一年度下一年度下一年度下一年度观察年度观察年度观察年度观察年度1

47、 1 1 1月月月月1 1 1 1日日日日12121212月月月月31313131日日日日5 5 5 5月月月月1 1 1 1日日日日(观察时点)(观察时点)(观察时点)(观察时点)发病发病发病发病痊愈或死亡痊愈或死亡痊愈或死亡痊愈或死亡(预后预后预后预后)A A A A病程病程病程病程年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意病例按病程特点可以分为四种类型。病例按病程特点可以分为四种类型。病例按病程特点可以分为四种类型。病例按病程特点可以分为四种类型。A A A A:上一年度发病,病

48、程跨越整个观察年度。:上一年度发病,病程跨越整个观察年度。:上一年度发病,病程跨越整个观察年度。:上一年度发病,病程跨越整个观察年度。150150上一年度上一年度上一年度上一年度下一年度下一年度下一年度下一年度观察年度观察年度观察年度观察年度1 1 1 1月月月月1 1 1 1日日日日12121212月月月月31313131日日日日5 5 5 5月月月月1 1 1 1日日日日(观察时点)(观察时点)(观察时点)(观察时点)发病发病发病发病痊愈或死亡痊愈或死亡痊愈或死亡痊愈或死亡(预后预后预后预后)A A A AB B B B病程病程病程病程年发病率、年患病率、时点患病率计算示意年发病率、年患病

49、率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意 B B B B:观察年度发病,病程延续至下一年度。:观察年度发病,病程延续至下一年度。:观察年度发病,病程延续至下一年度。:观察年度发病,病程延续至下一年度。151151上一年度上一年度上一年度上一年度下一年度下一年度下一年度下一年度观察年度观察年度观察年度观察年度1 1 1 1月月月月1 1 1 1日日日日12121212月月月月31313131日日日日5 5 5 5月月月月1 1 1 1日日日日(观察时点)(观察时点)(观察时点)(观察时点)发病发病发病发病痊愈或死亡痊愈或死亡痊愈或死亡痊愈

50、或死亡(预后预后预后预后)A A A AC C C C病程病程病程病程年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意年发病率、年患病率、时点患病率计算示意 C C C C:上一年度发病,病程在观察年度终止。:上一年度发病,病程在观察年度终止。:上一年度发病,病程在观察年度终止。:上一年度发病,病程在观察年度终止。B B B B152152上一年度上一年度下一年度下一年度观察年度观察年度1 1月月1 1日日1212月月3131日日5 5月月1 1日日(观察时点)(观察时点)发病发病痊愈或死亡痊愈或死亡(预后预后)A AC CD

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服