收藏 分销(赏)

流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt

上传人:1587****927 文档编号:1639728 上传时间:2024-05-07 格式:PPT 页数:39 大小:520.52KB
下载 相关 举报
流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt_第1页
第1页 / 共39页
流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt_第2页
第2页 / 共39页
流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt_第3页
第3页 / 共39页
流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt_第4页
第4页 / 共39页
流行病预防学-预防统计学-(t检验-u检验)-文档资料.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、 医学统计学方法医学统计学方法主讲人主讲人 刘欣刘欣流行病与卫生统计学教研室流行病与卫生统计学教研室吉林大学公共卫生学院1 第二节第二节 正态分布及应用正态分布及应用 吉林大学公共卫生学院2 正态曲线以均数为中心,左右对称。正态曲线以均数为中心,左右对称。正态曲线的高峰位于均数所在处。正态曲线的高峰位于均数所在处。正态分布具有正态分布具有均值与均值与标准差两个参数。标准差两个参数。确定正态曲线的中心位置。确定正态曲线的中心位置。越大,曲越大,曲 线沿横轴越向右移动;反之越向左移动。线沿横轴越向右移动;反之越向左移动。确定曲线的形状。确定曲线的形状。越大,曲线越扁平;越大,曲线越扁平;越小,曲线

2、越尖峭。一般用越小,曲线越尖峭。一般用N(,2)表示表示 均数为均数为,方差为方差为2的正态分布。的正态分布。正态曲线下面积分布有一定规律。正态曲线下面积分布有一定规律。二、二、正态分布的特征正态分布的特征吉林大学公共卫生学院3(-1,+1 ):68.27%(-1.96,+1.96):95.00%(-2.58,+2.58):99.00%吉林大学公共卫生学院4 理论上,正态曲线下理论上,正态曲线下1.96和和2.58的区间的面积分别各占总面积的的区间的面积分别各占总面积的95%及及99%。图。图示见下图。示见下图。吉林大学公共卫生学院5四、标准正态分布四、标准正态分布 正态分布正态分布有两个不固

3、定的参数有两个不固定的参数与与,为了为了应用方便,可采取变量变换,使二者都为常数,应用方便,可采取变量变换,使二者都为常数,即即=0,=1。其变换为。其变换为:此变换可把此变换可把N(,2)转化为转化为=0,=1的的正态分布正态分布N(0,1),称为称为标准正态分布(标准正态分布(standard normal distribution)。)。吉林大学公共卫生学院6 三、正态分布的应用三、正态分布的应用 吉林大学公共卫生学院7制定参考值范围制定参考值范围 参考值范围(参考值范围(reference ranges)reference ranges)又被称为又被称为正正常值范围常值范围,是指绝大多

4、数是指绝大多数正常人正常人的解剖、生理、生的解剖、生理、生化等各种数据的波动范围。化等各种数据的波动范围。(一)参考值范围的概念(一)参考值范围的概念吉林大学公共卫生学院8(二)参考值范围估计的基本步骤(二)参考值范围估计的基本步骤 从正常人的总体中进行随机抽样从正常人的总体中进行随机抽样。对选定的正常人进行准确测量对选定的正常人进行准确测量。确定取单侧范围还是双侧范围确定取单侧范围还是双侧范围。选择适当的百分范围选择适当的百分范围。根据资料的分布类型根据资料的分布类型选用恰当选用恰当的估计方法。的估计方法。吉林大学公共卫生学院9 (三)参考值范围的估计方法(三)参考值范围的估计方法 根据资料

5、的分布类型可选择根据资料的分布类型可选择正态分布法正态分布法或或百百分位数法分位数法计算计算参考值范围参考值范围。1.正态分布法正态分布法 适用于正态分布或近似正态分适用于正态分布或近似正态分布的资料布的资料。计算公式为:。计算公式为:吉林大学公共卫生学院10 例例 某某地地调调查查正正常常成成年年男男子子144人人的的红红细细胞胞数数(近近似似正正态态分分布布),得得均均数数为为55.321012/L,标标准准差差为为0.441012/L。试试估估计计该该地地成成年年男男子子红细胞数的红细胞数的95%医学参考值范围。医学参考值范围。因红细胞数过多或过少均为异常,故应求双侧范围。因红细胞数过多

6、或过少均为异常,故应求双侧范围。资料近似正态分布,用资料近似正态分布,用正态分布法正态分布法计算如下:计算如下:下限为:下限为:上限为:上限为:该地该地成年男子红细胞数的成年男子红细胞数的95%医学参考值范围为(医学参考值范围为(54.52,56.24)。)。吉林大学公共卫生学院11 2.百分位数法百分位数法 常用于偏态分布资料常用于偏态分布资料。以。以95%范围为例,其计算公式为:范围为例,其计算公式为:双侧:双侧:单侧:单侧:或或吉林大学公共卫生学院12 第三节第三节 数值变量资料的统计推断数值变量资料的统计推断 一、均数的抽样误差与标准误、均数的抽样误差与标准误 1 1、均数的抽样误差、

7、均数的抽样误差 样本均数与总体均数之差异或各样本样本均数与总体均数之差异或各样本 均数之差异,称为均数的均数之差异,称为均数的抽样误差抽样误差。吉林大学公共卫生学院13中心极限定理的直观表述见下图中心极限定理的直观表述见下图x总体总体x2x3x1xi-2xi-1x4xi.样本样本1 1n样本样本2 2样本样本j.总体总体nn吉林大学公共卫生学院14 2 2、标准误(标准误(standard errorstandard error):):反映反映均数抽样误差大小的指标是样本均数的均数抽样误差大小的指标是样本均数的标准差,简称标准误,记作标准差,简称标准误,记作 或或 。吉林大学公共卫生学院15

8、二、二、t t 分分 布布 吉林大学公共卫生学院16图2 t 分布曲线 t分布曲线分布曲线形态类似正态分布曲线。形态类似正态分布曲线。吉林大学公共卫生学院17(一)(一)t 分布的特征分布的特征 t分布曲线以分布曲线以0为中心,左右对称。为中心,左右对称。t分布具有一个参数分布具有一个参数(称称自由度自由度,=n-1)。越小,曲线越扁平;越小,曲线越扁平;越大,曲线越接近越大,曲线越接近 标准正态分布;当标准正态分布;当 时,时,t 分布趋近于分布趋近于 标准正态分布。标准正态分布。t分布是一簇曲线。不同分布是一簇曲线。不同的的t分布曲线见分布曲线见图图3。t分布曲线下面积分布有一定规律。分布

9、曲线下面积分布有一定规律。吉林大学公共卫生学院18=(标准正态曲线)=4=1f(t)图3 自由度分别为1、4、的t分布曲线吉林大学公共卫生学院19(二)(二)t 分布曲线下面积分布规律(即分布曲线下面积分布规律(即t界值表)界值表)t 界值常记为界值常记为 。其中。其中为自由度,为自由度,为概为概率。其意义为:率。其意义为:单侧概率:单侧概率:P(t-t,)=或或P(tt,)=双侧概率:双侧概率:P(t-t,)+P(tt,)=对于双侧概率意义的图形直观表达见下图对于双侧概率意义的图形直观表达见下图4。吉林大学公共卫生学院20图4 t 分布曲线下面积分布示意吉林大学公共卫生学院21 四、总体均数

10、置信区间估计四、总体均数置信区间估计统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计(point estimation)区间估计区间估计(interval estimation)吉林大学公共卫生学院222 2、区间估计、区间估计(interval estimation)(interval estimation)概念:概念:根据样本均数,按给定的根据样本均数,按给定的概率概率计算出总计算出总体均数很可能在的一个体均数很可能在的一个数值范围,数值范围,这个范围这个范围称为总体均数的称为总体均数的可信区间可信区间(confidence(confidence interval,CI)int

11、erval,CI)。方法:方法:(1)u(1)u分布法分布法(2)t(2)t分布法分布法吉林大学公共卫生学院23(1 1)u u 分布法分布法公式公式应用条件应用条件例题例题(xus x,xu s x)即(xus x)未知,但未知,但n n足够大或足够大或已知已知吉林大学公共卫生学院24(2 2)t t分布法分布法公式公式应用条件应用条件例题例题(x ts x,xt s x)即(xts x)未知,且未知,且n n较小较小吉林大学公共卫生学院25区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小,用用 (1-(1-)来衡量。来衡量。99%99%的可信区间好于的可信区间好于95

12、%95%的可信区的可信区间间(n,S n,S 一定时)一定时)。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范指区间范围的宽窄,范围越宽精确度越差。围越宽精确度越差。99%99%的可信区间的可信区间差于差于95%95%的可的可信区间信区间(n,S n,S 一定时)一定时)。吉林大学公共卫生学院26 四、假设检验的基本思想和步骤四、假设检验的基本思想和步骤吉林大学公共卫生学院27 例例 根根据据大大量量调调查查,已已知知正正常常成成年年男男子子脉脉搏搏均均数数为为72次次/分分。某某医医生生在在一一山山区区随随机机抽抽查查了了25名名健健康康成成年年男男子子,求求得得其其脉脉搏搏均均数

13、数为为74.2次次/分分,标标准准差差为为6.0次次/分分。能能否否据据此此认认为为该该山山区区成成年年男男子子脉脉搏搏均均数数高于高于一般成年男子脉搏均数一般成年男子脉搏均数?在本例中,山区成年男子脉搏均数用在本例中,山区成年男子脉搏均数用山山表示,一般成表示,一般成年男子脉搏均数用年男子脉搏均数用0表示。表示。0=72次次/分分一般总体一般总体山山=?山区总体山区总体n=25吉林大学公共卫生学院28 这里这里山山与与0的关系只能有两种:的关系只能有两种:山山0 山山0山山0山山0 这里根据专业知识这里根据专业知识山山0的关系中只能是的关系中只能是 山山0 。造成二种情况的原因有:。造成二种

14、情况的原因有:山山0(同一总体)抽样误差抽样误差 山山0 (不同总体)本质不同本质不同吉林大学公共卫生学院29 假设检验假设检验的基本步骤如下:的基本步骤如下:1 1、建立检验假设和确定检验水准、建立检验假设和确定检验水准 检验假设有两种:检验假设有两种:检验假设检验假设(hypothesis under test)又称又称零零/原原假设假设(null hypothesis)。用。用H0表示。假定通常表示。假定通常为:某两个(或多个)总体参数相等,或某为:某两个(或多个)总体参数相等,或某两个总体参数之差等于两个总体参数之差等于0 0,或某资料服从某一,或某资料服从某一特定分布(正态分布、特定

15、分布(正态分布、Poisson分布)等。本分布)等。本例则为:例则为:H0:山山0。吉林大学公共卫生学院30 单双侧的选择在单双侧的选择在检验之前检验之前由由专业知识专业知识确定。确定。备择假设备择假设(alternative hypothesis)又称又称对立对立假设假设。用。用H1表示。表示。H1与与H0对立。对立。H1的内容可的内容可反映出检验的单双侧。本例为:反映出检验的单双侧。本例为:H1:山山0 即为即为单侧检验单侧检验(one-sided test)或或单尾检验单尾检验(one-tailed test)。若。若H1:山山0 则为则为双侧检验双侧检验(two-sided test)

16、或或双尾检验双尾检验(two-tailed test)。检验水准检验水准(size of a test)是假设检验作判断是假设检验作判断结论的标准,是预先确定的概率值,常常取结论的标准,是预先确定的概率值,常常取小概率事件小概率事件标准。用标准。用表示。也为表示。也为I I型错误型错误 吉林大学公共卫生学院31的概率大小的概率大小(详后详后)。实际工作中,。实际工作中,常取常取0.05。2 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设应根据变量或资料的类型、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。计的方案、检验方法的适

17、用条件等选择检验方法。检验统计量检验统计量(test statistic)是在是在H0假设的条件假设的条件下由统计学家推导出的可由样本指标计算出来用下由统计学家推导出的可由样本指标计算出来用于推断结论的数值。于推断结论的数值。检验方法常用检验方法常用检验统计量检验统计量的名称命名。如的名称命名。如t检检验中的验中的t统计量统计量、u检验中的检验中的u统计量统计量、2检验中检验中的的2统计量统计量等。等。吉林大学公共卫生学院323 3、确定、确定P值和作出推断结论值和作出推断结论 P值的值的统计学含义是指从统计学含义是指从H0规定的总体随机规定的总体随机抽得等于及大于(或等于及小于)现有样本获得

18、抽得等于及大于(或等于及小于)现有样本获得的的检验统计量检验统计量的概率。的概率。通俗地讲,通俗地讲,P值就代表了值就代表了H0成立与否的概率成立与否的概率。将将P值与值与检验水准检验水准进行比较得出推断结论。进行比较得出推断结论。推断结论应包含统计结论和专业结论两部分。推断结论应包含统计结论和专业结论两部分。若若P P ,则按,则按,则按,则按 检验水准拒绝检验水准拒绝检验水准拒绝检验水准拒绝HH0 0,有统计学意,有统计学意,有统计学意,有统计学意义义义义(统计结论)(统计结论),可认为,可认为,可认为,可认为不同或不等不同或不等不同或不等不同或不等(专业(专业结论)结论)。吉林大学公共卫

19、生学院33 若若P P ,则按,则按,则按,则按 检验水准尚不拒绝检验水准尚不拒绝检验水准尚不拒绝检验水准尚不拒绝HH0 0,无,无,无,无统计学意义,还不能认为统计学意义,还不能认为统计学意义,还不能认为统计学意义,还不能认为不同或不等。不同或不等。不同或不等。不同或不等。下面通过下面通过例例10.1710.17具体介绍假设检验的过程:具体介绍假设检验的过程:H0:山山0H1:山山0单侧,单侧,=0.05吉林大学公共卫生学院34 =24,查查单侧单侧t,=t0.05,24=1.711,今求得,今求得 t=1.8331.711,P0.05,按按=0.05水准拒绝水准拒绝 H0,有统计学意义。可

20、认为该山区成年男子脉,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。搏数高于一般成年男子脉搏数。上述上述例题例题属于单样本属于单样本t检验,其假设检验检验,其假设检验的推断结果是依据的推断结果是依据t分布的原理作出的。为了理解分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图(见其推断过程的原理,通过直观的示意图(见附图附图)表达上述例题假设检验的过程。表达上述例题假设检验的过程。吉林大学公共卫生学院35=24H0:山山0单侧单侧t,=t0.05,24=0.051.711接受域接受域山山0拒绝域拒绝域山山0t=1.833P=0.05吉林大学公共卫生学院36 第四节

21、第四节 t 检验和检验和u 检验检验 t 检验检验(t-test,亦称亦称Students t-test)的应用条件:的应用条件:当样本例数当样本例数n较小,样本来自正太总体,总体标准较小,样本来自正太总体,总体标准差未知,在做两个样本均数比较时还要求两样本的差未知,在做两个样本均数比较时还要求两样本的总体方差相等,即总体方差相等,即方差齐性方差齐性(homogeneity)。u 检验检验(u-test)的应用条件:的应用条件:主要适用于两样本主要适用于两样本含量含量n n较大(均大于较大(均大于5050)的情况)的情况。吉林大学公共卫生学院37一、样本均数与总体均数的比较一、样本均数与总体均

22、数的比较 单样本单样本t 检验检验 用于一组定量资料的样本均数用于一组定量资料的样本均数代表未知的总体均数代表未知的总体均数和已知的总体均数和已知的总体均数0(一般为一般为理论值、标准值或经大量观察所得的稳定值理论值、标准值或经大量观察所得的稳定值)进行进行比较。其检验统计量的计算公式为:比较。其检验统计量的计算公式为:吉林大学公共卫生学院38 例题例题 以往通过大规模调查已知某地新生儿出以往通过大规模调查已知某地新生儿出生体重为生体重为3.30kg3.30kg,从该地难产儿中随机抽取,从该地难产儿中随机抽取3535名新名新生儿作为研究样本,平均出生体重为生儿作为研究样本,平均出生体重为3.42kg3.42kg,标准,标准差为差为0.40kg,0.40kg,问该地难产儿出生体重是否与一般新问该地难产儿出生体重是否与一般新生儿体重不同?生儿体重不同?C吉林大学公共卫生学院39

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服