资源描述
1、 算术平均数:
适用条件:资料成正态分布(或近似正态,或对称分布)。
2、几何均数
适用条件:(1)观察值为非对称分布,差距较大,用算术均数表示其平均水平会受少数特大或特小值影响;(2)数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。
3、中位数
适用于:(1)资料偏态分布;(2)两端无确定数值;(3)资料分布不清楚。
4、正态分布的特征和分布规律:
(1)曲线在x轴的上方,与x轴不相交,当x=μ时,曲线位于最高点。
(2)曲线关于直线x=μ左右对称。
(3)正态分布有两个参数:均数,标准差;标准正态的参数分别为:0, 1
(4)正态曲线在1 σ,标准正态曲线在1处各有一个拐点,
(5)正态分布的面积分布有一定规律。
5、均数的抽样误差概念:
由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差。
6、 均数标准误与标准差的区别:
标准差:表示一般变量值的离散程度;均数标准误特别说明样本均数这一变量值离散程度的指标。
7、标准误的应用:(1)用来衡量抽样误差的大小:标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;(2)结合标准正态分布与 t 分布曲线下的面积规律,估计总体均数的置信区间;(3)用于假设检验。
一、协方差分析
1.协方差分析:协方差分析是把线性回归与方差分析结合起来,用于检验两个或多个修正均数间有无差别的方法,其目的是把与结果变量(因变量)Y呈直线关系的自变量X(协变量)化成相等后,检验两个或多个修正均数间有无差别。
2.应用协方差分析的条件: (1)理论上要求各组资料(样本)均来自方差相同的正态总体,各观察变量相互独立。(2)各总体存在回归关系且各总体直线回归系数ß相等,且都不为0。(3)各样本方差齐性。(4)如果不满足以上条件,建议进行变量变换,符合上述条件后,再进行协方差分析。要求:在进行协方差分析前,应先进行方差齐性检验和回归系数的检验。
二、二项分布
1.二项分布的条件:(1)各观察值是相互独立的. (2)各事件是相互排斥的。
2.怎样求总体率可信区间;样本率与总体率、样本率与样本率的比较: (1)n >50 且 np 和n(1-p)均≥5时(同率u-test),二项分布近似正态分布, 故可用正态法求率可信区间、率的比较.
⑵n<50且 np 和n(1-p)均<5时,须用二项分布法的相应方法。
三、等级相关(秩相关)
1. 等级相关适用资料:⑴ 不服从双变量正态分布 ⑵ 总体分布类型未知 ⑶ 原始数据用等级表示。
2. Spearman等级相关:适用于分析两个变量之间是否在数量上相关。等级相关系数 rs——反映两变量间相关的密切程度与方向 。
3. Kendall等级相关:适用于当一个变量的等级为标准时,另一个变量的等级与它不一致的情况(可分析两个以及多个变量间的等级相关性)。Kendall等级相关系数t 取值±1之间.
四、生存分析
1.生存分析:是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。
2.生存时间:指观察到的存活时间。
3.完全数据:在随访过程中,观察到了病人的确切结局,也就知道其具体的存活时间。
4.删失数据:随访工作中,由于某种原因未能观察到病人的明确结局,这样,就不知道该病人的确切生存时间,称之为删失数据。常在生存时间数据后加上符号+表示删失数据。
5.生存概率:某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。
6.生存率:亦称生存函数或累积生存概率,指病人经过t个单位时段之后仍存活的概率。
7.生存概率与生存率的差别:前者:单位时段存活的条件概率。后者:t=0开始连续若干时段上存活的概率。
五、流行病学调查设计与分析
1. 流行病学的研究方法按研究的性质可分为:描述性研究、分析性研究、实验性研究和理论性研究四类。
2. 病例—对照研究优缺点:病例—对照研究是一种回顾性具有对照的调查研究方法,是分析性研究中常用的一种设计方案;优点:病例—对照研究可以很快地为病因学研究、防治研究和预后研究提供重要信息,它具有节约时间、花费较少。缺点:容易产生回忆偏倚;它是一种从结果到原因的研究方法,因而它不能确切地论证病因学因—果联系。
3. 相对危险度(RR)概念:就是暴露者的发病率对非暴露者发病率的倍数。相对危险度为1就是暴露者与非暴露者相等,所暴露的因素对发病没有影响。
4. 定群(队列)研究优缺点:定群研究是一种前瞻性调查研究方法,也是分析性研究中常用的一种设计方案;优点:可以避免回忆偏倚;它是一种从原因到结果的研究方法,因而它对论证病因学因—果联系有更强的说服力。缺点:短期不容易得到结果,需要较长的研究时间、花费较大。
5.暴露人年数优点:研究对象进入研究的时间可以不同;失访者或死于其它疾病退出的对象也可以参加分析。
六、Poisson分布
1.Poisson’s distribution 是单位时间、面积或容积中某罕见事件的概率分布。
2.Poisson分布的条件: 各事件是相互独立的,不符合此条件不属于Poisson分布。
3.Poisson分布与二项分布的比较:
⑴当总体比例π很小,样本含量n趋向于无穷大时(重复次数n>100,每次出现概率p<0.01),二项分布趋向于Poisson分布;
⑵两种分布均要求各事件是独立的,均属离散型分布。
4.Variances of Poisson’s distribution:
⑴ 方差σ2(标准差的平方)表示Poisson分布变量的变异程度。
⑵ Poisson分布的方差等于其平均数:σ2=μ。
5.Shape of Poisson’s distribution:
⑴ Poisson分布的特征取决于平均数;
⑵平均数越大(>50),Poisson分布越接近正态分布。
二项分布 正态分布
n>100, but p<0.01 均数越大(>50)
Poisson分布
6.总体均数的可信区间:
(1)当样本计数x≤50时,可查附表15-1: 用x查表得精确的可信区间。
(2)当x>50时,x近似于正态分布。
七、Ridit分析(R-test)
Relative to an identified distribution unit-Ridit与特定分布有关的单位。
1.适用资料:(1)等级分组资料(与秩和H检验等价);
(2)数量分组不很确切的资料(e.g. <20,20-,40-);
(3)计量资料转化为计数资料.
2.优点:Ridit分析能检验各组间的优劣和强弱。X2-test只能检验各组间的构成是否不同,不能检验各组间的优劣和强弱。
3.应用本法的注意点:
(1)标准组要求例数较多,否则应当作"两组比较"处理。
(2)近似法较实际情况得出更多的"差异无意义"的结论。因此,当可信区间刚好触及0.5线时,下结论应慎重。
展开阅读全文