资源描述
1、医学统计学:以医学理论为指导,运用概率论和数学统计等数学的原理和方法,研究医学领域中资料的搜集、整理、分析和推断的一门学科。
2、同质性:同一总体或其样本中的观察单位在所取指标方面必须具有相同的性质或对观察单位有影响的因素相同或相近。
3、异质性(间杂性):与上述相反。
4、(个体)变异:同质事物之间的差别,包括两方面:1)同一个体在不同阶段的差异;2)其观察单位在个体之间显示的差别。由于观察单位通常为观察个体,故变异亦称个体变异。变异表现为定量的,可形成定量资料(血清总胆固醇);变异表现为定性的,可形成定性资料(病人性别);变异表现为等级的,可形成等级资料(心功能分级)。
5、总体:指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
6、个体:构成总体的最基本的观察单位。
7、样本:指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
8、样本含量:样本所含个体量。
9、随机:是机会均等、无主观影响、目的是保证样本对总体的代表性、可靠性。包括抽样随机(有相同的机会被抽到)、分组随机(有相同的机会被分到不同的组中)、顺序随机(有相同的机会先后接受处理)。
10、概率:是随机事件发生可能性大小的一个度量,常用P来表示,取值范围为0≤P≤1。11、小概率事件:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件;其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,即为小概率原理。
11、频率:在n次随机试验中,有v次得到所要的结果,v≤n,频率=v/n。
12、抽样误差:由于个体变异的存在,抽样引起的样本统计量与总体参数间的差异。
13、总体参数:描述某总体特征的指标。
14、样本统计量:描述某样本特征的指标称为样本统计量。
15、参考值范围:是绝大多数正常人的某观察指标的范围。
16、正常人:不具有影响所测指标的因素或疾病的那类人群。
17、标准误:在统计理论上将样本统计量的标准差称统计量的标准误,样本均数的标准差óx称为均数的标准误,简称标准误。
18、统计推断:就是根据样本所提供得信息,以一定得概率推断总体的性质,包括参数估计和假设检验。
19、参数估计:由样本信息估计总体参数,包括点估计和区间估计。
20、点估计:一般是直接用样本统计量作为参数的估计值。
21、区间估计:是按一定的概率或可信度(1—a)用一个区间估计总体参数所在范围,这个范围称作可信度为1—a的可信区间,又称置信区间。
22、秩次:全部观察值按某种顺序排列。
23、秩和:同组秩次之和。反映等级的高低。
24、秩变换:将等级变成秩次的方法。反应各组等级的分布位置。
25、秩和检验:通过秩次的排列求出秩和,从而对总体的分布进行建设检验的方法。
26、随机变量:个体的特征或指标存在个体差异,观察结果在 测量前不能准确预测,称为~,简称变量;变量的取值称为变量值和观察值。
27、正偏态:是指分布的尾部偏向数轴正侧(或右侧),故又称右偏态
28、负偏态:是指分布的尾部偏向数轴负侧(或左侧),故又称左偏态。
29、率:又称频率指标,用以说明某事物或某观察现象在可能发生的范围内实际发生的频率或强度,常以百分率千分率表示。
30、构成比:又称构成指标,表示一事物内部各组成部分所占的比重或频率,常以百分数表示。
31、比:A、B两个有关指标之比,亦称相对比。
32、标准化率:又称调整率,实际上是一加权平均,选定一个标准组,各小组观察人数为N;总观察人数为N:∑N,以该标准组的构成比Ni:N作为加权系数:W1、W2、W3……Wk,各组均按该组系数求加权平均率,即为标准化率(P’)。
33、第一/二类错误:Ho真实时被拒绝为第一类错误/Ho不真实时被拒绝为第二类错误。
34、单/双侧检验:
1、医学统计学的三个步骤:研究设计、资料分析、结论。
2、变量的分类(三类资料):1)定量资料:以定量值表达每个观察单位的某项观察指标,如血脂、心律的特点:1各观察单位间只有量的差别;2数据间有连续性;2)定性资料:以定性方式表达每个观察单位的某项观察指标如血型、性别的特点:1观察单位间或者相同、或者有质的差别;2有质的差别者之间无连续性;3)等级资料:以等级方式表达每个观察单位的某项观察指标如疗效分级、血粘度、心功能分级等,特点:1各观察单位间或者相同,或者存在质的差别;2各等级间只有顺序,而无数值大小,不可度量。
3、个体变异的规律性:1变异表现为定量的-形成定量资料;2。。。定性的-。。。定性资料;3。。。等级的-。。。等级资料。
4、数据分布的类型(会判断):频数分布可分为对称分布与非对称分布。非对称分布又称偏态分布,包括正偏态和负偏态:正偏态是指分布的尾部偏向数轴正侧(或右侧),故又称右偏态;负偏态是指分布的尾部偏向数轴负侧(或左侧),故又称左偏态。分布只有一个高峰者称为单峰分布;出现两个或多个高峰者称为双峰或多峰分布。
6、定性资料与等级资料的统计量指标:(一)相对数的概念:表示相对关系,包括率、构成比、相对比等;(二)常用相对数:1)率:用以说明食事物或某现象在其可能发生的范围内实际发生的频率或强度;2)构成比:表示某一事物内部各组成部分所占的比重或频率;3)比:是A、B两个有关指标之;(三)正确应用相对数:1)计算相对数的分母不宜过小;2)分析时不能以构成比代替率;3)对观察单位数不等的几个率,不能直接相加求其平均率(或称总率);4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性。
7、正态曲线下面积的分布规律:1)x轴与正态曲线所夹面积恒等于1;2)对称区域面积相等;3)90%区间为u+1.64ó,95%区间为u+1.96,99%区间为u+2.58。
8、参考值范围的估计方法:1)正态分布法;2)百分位数法;3)对数正态分布法。
9、抽样误差的两种表现形式:1)样本统计量与总体参数间的差异;2)不同样本的统计量间的差异。
10、抽样误差产生的必备条件:1)抽样研究;2)个体变异。
11、中心极限定理的涵义:1)从均数为u,标准差为ó的正态总体中独立、重复、随机抽取含量为N的样本,样本均数的分布仍为正态分布,其均数为u,标准差为ó;2)即使从非正态总体(均数为u,标准差为ó)中独立、重复、随机抽取含量为n的样本,只要样本含量足够大(如n≥50),样本均数近似服从均数为u,标准差为óx的正态分布。
12、t分布的特征-中心极限定理的应用:1)为一簇单峰分布曲线;2)以0为中心,左右对称;3)与自由度v有关,v小,峰越低,而两侧尾部翘得越高,逐渐增大时,t分布逐渐逼近标准正态分布;当v无穷大时,t分布就是标准正态分布。
13、可信区间的两个要素:1)可靠性;2)精确性
14、可信区间的涵义:1)可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,而无概率可言;2)95%可信度,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间中,又95个包含总体均数,而有5个不包含总体均数;3)总体参数是未知的固定的值,因此95%的可信区间不能理解为:1总体参数有95%的可能落在该区间内;2有95%的总体参数在该区间内,而5%不在该区间内,因为相应总体参数只有一个。
15、假设检验的基本意义是:分辨两个样本是否分别属于两个不同的总体,并对总体作出适当的评论。两个样本的概念也可适当地扩展为三个及以上地样本。同时也包括分辨一个样本是否属于某特定总体等。
20、方差分析的基本思想:1)组内变异:抽样误差;2)组间变异:组间本质差别+抽样误差;3)如果组间无本质差别:则组间差异=组内变异。
16、方差分析的有点:1)不受比较组数的限制;2)可同时分析多个因素的作用;3)可分析因素间的交互作用。
17、x2检验的基本思想:理论频数与实际频数的吻合程度。
18、x2的应用条件:(一)两个率比较:1)n≥40,T≥5,用x2;2)n≥40,单1≤T≤5,用校正x2;3)n≤40,T≤1,用确切概率;(二) 多个率比较:1)R×C表中不宜有1/5以上格子的Ti大于5;2)不宜有一个理论频数小于1。
19、四格表确切概率的基本思想:在四格表的周边合计不变的条件下,用公式直接计算四格表内四个数据的各种组合之概率。
20、秩和检验的优缺点:优点:1)不依赖于资料的分布类型,适用范围广;2)对于偏态分布的资料功效明显;
缺点:对于符合t检验条件的小样本资料功效降低明显。
21、两样本相关系数的比较:1)画散点图;2)分别计算两样本相关系数r;3)分别对两相关系数是否为0进行假设检验;4)最后比较两总体相关系数是否相等。
22、相关分析的正确应用:1)相关关系是一种共变关系;2)充分利用散点图;3)识别离群值;4)排出资料的间杂性
23、求直线回归方程的步骤:1)画散点图;2)进行回归分析;3)求直线回归方程;4)绘制回归直线。
34、回归系数的意义:1)b的意义:1回归系数:为斜率:b=0时,不存在回归关系;2表示自变量增加一个单位时,应变量的平均改变;2)a的意义:1回归系数:为截距;2表示当x=0时,应变量Y的估计值Y^;3)Y^的意义:1表示给定x时Y的平均值的估计;2其涵义是均数;4)Y-Y^的意义:1称残差,各散点到回归直线的纵向距离;2∑(Y-P)=0 ;5)∑(Y-Y^)的意义:剩余平方和/残差平方和
展开阅读全文