1、卫生统计学名词解释总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料变量:观察单位或个体的某种属性或标志称为变量变量值:对变量进行测量或观察的值称为变量值。分类变量变异:在自然状态下,个体间测量结果的差异称为变异(variation) 。
2、变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 数值变量:概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0之间,即0P1.小概率事件:如果随机事件发生的概率P0.05,或P0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。频数表: 用来表示一批数据各观察值或在不同取值区间的出现的频繁程度 (频数) 。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,220个病人的天数。对于散布区间很
3、大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用 X 表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 百分位数:是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。 四分位数间距:是由第 3 四分位数和第 1 四分位数相减计
4、算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示。正态分布:二项分布:标准正态变换:将服从正态分布的原始变量x(,),进行变量变换(x-u)/,这种变换叫标准正态变换。正常值范围:抽样误差(标准误):在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。可信区间:总
5、体参数所在的范围。正常值范围:医学上常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。构成比:又称构成指标,它表示事物内部个组成部分所占的比重或分布。相对数:是由两个联系的指标之比,是分类变量常用的描述性统计指标,常用的相对数有率、构成比、相对比。率的标准化法:是用于内部构成不同的两个或多个率比较的一种方法。统计描述:用统计图表或计算统计指标的方法表达一个群体的某项特征,称为统计描述。假设检验:是先对总体做出某种假定(检验假设),然后根据样本信息推断其是否成立的一类统计方法。统计推断:根据样本的特性对整体的特性做估计或推论的方法称统计推断,常用方法是参数估计和假设检验。抽样
6、研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。这种用样本指标推论总体参数的方法称为抽样研究。参数估计:是指用样本统计量估计总体参数,主要有两种方法:点估计和区间估计。统计表:是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。统计图:是以各种几何图形(如点、线、面或立体)显示数据的大小 、升降、分布以及关系等,它也是对资料统计描述时一种常用手段。均方:均方差(MS)或方差,是由离均差平方和被自由度相除而得。 方差分析:方差分析(analysis of variance,ANOVA)就是根据资料的设计类型,即变异的不同来源
7、将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。 总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,
8、这种设计叫做完全随机设计。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。 非参数检验:是一种不依赖总体分布类型,也不对总体参数进行统计推断的假设检验。随机抽样:是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序资料。如患者的治疗结果可分
9、为治愈好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 参数:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 统计量:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归回归系数:即直线的斜率,
10、在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位。 直线相关:又称简单相关,用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。相关系数:又称积差相关系数,以符号r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。秩相关又称等级相关,是用双变量等级数据作直线相关分析,适用于下列资料:不服从双变量正态分布而不宜作积差相关分析;总体分布型未知;用等级表示的原始数据。参数统计:通常要求样本来自总体分布型是已知的(如正态分布) ,在这种假设的基础上,对总体参数(如总体均数)
11、进行估计和检验,称为参数统计。秩次:变量值按照从小到大顺序所编的秩序号称为秩次。 秩和:各组秩次的合计称为秩和,是非参数检验的基本统计量。、随机抽样:是指调查者用随机抽样的方法抽取样本,然后以样本统计量推断总体参数的一种研究方法。常用的随机抽样方法有:单纯随机抽样、系统抽样、整群抽样和分层抽样。检验水准:也称显著性水准,符号位a,是预先规定的概率值,通常取0.05,它是“是否拒绝H0的界限”。检验效能:又称检验功效(1-),它的含义是:当两总体确实有差别时,按规定的检验水准a,能够发现两总体间差别的能力。可比性:是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“
12、齐同”。发病率:指一定时期内,可能发生某病的人群中发生某病新病例数的强度,常用于描述急性病的发病情况。患病率:可分为时点患病率与时期患病率,常用于描述在这个时间点或时期是否曾处于患病状态,适用于慢性病或发病时间不易确定的疾病患病情况,时期患病率也可以用于估计就医的需求状况。某病病死率:指在某一期间内患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可以反映一个医疗单位医疗水平和医疗质量。某病死亡率:是一定时期内某人群因某病而死亡的频率。动态数列:按时问顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势人口金字塔:人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。总和生育率:假定同时出生的一代妇女,按照某年的年龄别生育水平度过其一生的生育历裎,各年龄别生育率之和乘以年龄组组距,就是这一代妇女平均每人可能生育的子女数。