资源描述
医学统计学
基本概念:
1.医学统计学Statistics:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。
2.同质和异质:具有相同性质的事物称为同质(homogeneous)。否则称为异质的或者间杂的(heterogeneous)。不同质的个体不能笼统地混在一起分析,同质和异质是相对的概念。
3.变异:同质事物之间的差别称为变异(variation),亦称个体变异。变异的两个方面:
个体与个体间的差别
同一个体重复测量值间的差别
结果是随机的,不可预测的;
一种或多种不可控因素(已知的或未知的)作用下的综合表现;
个体变异是普遍存在的;
个体变异是有规律的;
没有个体变异,就没有统计学。
4.总体和样本:
总体(population):根据研究目的所确定的同质观察单位的全体;分为有限总体和无限总体。
个体(individual):是构成总体的最基本观察单位。
样本(sample):是从总体中按照一定的目的随机抽取的一部分具有代表性的个体集合。
样本含量(sample size):样本中包含的个体个数。
5.参数和统计量:
Ø 总体参数(parameter):描述某总体特征的指标,简称参数,一般用希腊字母表示,如:m 、s 、 π 。
Ø 统计量(statistic):描述某样本特征的指标,一般用拉丁字母表示,如: 、s、p 。
Ø 在总体被确定之后,总体参数就是一个常数,是不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。
6.随机(random):是指机会均等,目的是保证样本对总体的代表性、可靠性。
7.概率和频率:
频率( relative frequency ):在n次随机试验中,事件A发生了m次,则比值m/n称为事件A在这n次试验中出现的频率。
概率(probability):是随机事件发生可能性大小的一个度量,是一种参数,常用P表示,0≤P ≤1。
8.小概率事件和小概率原理:
小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。
小概率原理:小概率事件并不表示不可能发生,但在某一次试验中,是不会发生的。
9.变量的分类:
Ø 按照取值的特性:
n 数值变量 numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的。
n 分类变量 categorical Variable 定性变量:取值是是分散、定性的,表现为互不相容的类别和属性。
• 无序分类 unordered categorics: 无顺序,无间隔,仅有分类
– 二项分类
– 多项分类
• 有序分类 ordered categorics 等级变量:仅有顺序,无单位;取值间的差异是不可度量的
Ø 不同分类的互相转化
n 数值变量→无序分类变量
n 数值变量→有序分类变量
n 有序分类变量→无序分类变量
信息量只有减少,不可增加
统计描述指标,呈现方式可分为两种
统计图:直观,但精确度稍差
统计报表:能尽量详细,精确,但不够直观
统计推断:从样本信息外推到总体,以最终获得对所感兴趣问题的解答
参数估计:样本→所在总体特征
假设检验:该指标可能的影响因素分析
频数分布
1.频数表编制步骤
求极差:R=Xmax-Xmin
选定适当的组段数后估计组距:组段数的选取以能反映资料的分布特征为宜,一般取8 ~ 12组
列出组段:组段的含义:包括组段的下限而不含组段的上限 。如:3.2~ 等价于 [3.2,3.5)。
划记归组获得频数
求频率,完成频数表 :相应的频数除以总数即为频率,各组段的频率总和为1或者100%。
2.频数分布所提供的信息
Ø 频数分布图用以表示数据的分布规律。
Ø 观察有无可疑值。
Ø 考察分布的类型。
n 对称分布
n 非对称分布(偏态分布)
• 左偏态(负偏态) :指分布的长尾在峰的左侧。
• 右偏态(正偏态) :指分布的长尾在峰的右侧。
Ø 考察分布的特征
n 集中位置 (Central Tendency):描述指标有平均数(算术均数(Mean)、几何均数(Geometric Mean) 、中位数(Median)、百分位数(Percentile) )。
n 离散趋势 (Tendency of Dispersion):描述指标有极差(Range)、四分位数间距(interquartile range) 、方差(Variance) 、标准差(Standard Deviation) 、变异系数( coefficient of variation ) 。
3.平均数应用的注意事项:
Ø 同质的资料计算平均数才有意义。
Ø 均数适用于:单峰对称分布的资料。
Ø 几何均数适用于:对数变换后单峰对称的资料。等比资料、滴度资料、对数正态分布资料。计算几何均数时:
n 变量值中不能有0
n 同一组变量值不能同时存在正、负值,若变量值全为负值,可先将负号除去,算出结果后再冠以负号
Ø 中位数:理论上可用于任何分布资料,常用于描述偏态资料,开口资料,有不确定值的资料的集中位置。但当资料适合计算均数或几何均数时,不宜用中位数。
中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;
中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。
不同质的资料应考虑分别计算平均数。
Ø 百分位数:样本含量较少时不宜计算靠近两端的百分位数。
Ø 平均数要与变异指标结合使用。
4.变异度指标:
四分位数间距(inter-quartile range):QU - QL = P75 - P25,即中间一半观察值的极差。
方差及标准差:
变异系数(coefficient of variation, CV):
为标准差和均数的比值,排除了平均水平的影响,并取消了单位。因此变异系数常用于:
n 比较度量衡单位不同的两组或多组资料的变异度
n 比较均数相差悬殊的两组或多组资料的变异度
5.变异度的正确应用:
Ø 极差不稳定,不灵敏
Ø 标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。
Ø 在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。
Ø 变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。
6.总结:
Ø 每个观察指标均有其特定的变异规律;
Ø 描述变异:
n 图形描述
n 统计量描述
ü 平均数:均数、几何均数、中位数和百分位数
ü 变异度:极差、方差、标准差、四分位数间距、变异系数
ü 不同分布的指标,用不同的统计量描述;
Ø 用平均数与变异度共同描述。
正态分布
1.公式:如果随机变量X的概率密度函数为 (-∞< X <+∞)
则称X服从正态分布,记作X~N(m,s2),其中, m为分布的均数, s 为分布的标准差。m为总体均数,s为总体标准差。
π为圆周率,e为自然对数的底,X为变量,代表横轴的数值,f(X)为纵轴数值。
2.正态分布的特征(重要):
} 单峰分布;高峰在均数处;
} 以均数为中心,均数两侧完全对称。
} 正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。
} 有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
} 正态曲线下的面积分布有一定的规律。
X轴与正态曲线所夹面积恒等于1 ,对称区域面积相等。
m-1.64s~ m+1.64s内面积为90%;
m-1.96s~ m+1.96s内面积为95%;
m-2.58s~ m+2.58s内面积为99%。
正态分布曲线下的面积与标准正态分布曲线下的面积对应(以标准正态离差为单位)。
3.标准正态分布:
标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。
概率密度函数为: (-∞< u <+∞)
正态分布转换为标准正态分布:若 X~N(m,s2),作变换:
则u服从标准正态分布,u称为标准正态离差(standard normal deviation)
4.正态分布的应用:估计频数分布、质量控制、确定临床参考值范围
参考值范围:
1.参考值范围(reference interval):是绝大多数正常人的某观察指标所在的范围,绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。
“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。
2.参考值范围确定的原则:
} 选定足够例数的同质的正常人作为研究对象:例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性
} 控制检测误差
} 判断是否分组(性别,年龄组)
} 单、双侧问题 (one sided or two sided)
} 选择百分界值(90%,95%)
} 确定可疑范围
3.参考值范围的估计方法:正态分布法、百分位数法
抽样误差
1.概念:由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。
抽样误差的表现:样本均数和总体均数间的差别、样本均数和样本均数间的差别。
2.中心极限定理 (central limit theorem):
Ø 从均数为μ,标准差为σ的正态总体中随机抽样,样本均数服从均数为μ,标准差为 的正态分布。
Ø 从均数为μ,标准差为σ的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为μ,标准差为 的正态分布。
3. 标准误(standard error):用样本统计量的标准差来反映抽样误差的大小,又称标准误。
其中,σ为总体标准差,n为抽样的样本例数
在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计
4.标准误的意义:
Ø 反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。
Ø 标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。
Ø 标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。
t分布
1.根据中心极限定理的内容,当样本含量足够大时,对从均数为μ,标准差为σ的任意总体中随机抽样所得的样本均数进行标准化变换,有
2.由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差:
这里,ν为自由度,取值为n-1
3. t 分布的性质:
Ø t分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。
Ø t分布以0为中心,左右对称。
Ø 分布的高峰位置比 u 分布低,尾部高。
Ø t分布与自由度n有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。
Ø 每一自由度下的t分布曲线都有其自身分布规律。t界值表 。
可信区间
1. 统计推断(statistical inference):是指如何抽样,以及如何用样本性质推断总体特征,分为参数估计(parameter estimation)、假设检验(hypothesis testing)。
2.参数估计:
点估计(Point Estimation):用样本统计量作为总体参数的估计。
区间估计 (Interval Estimation):
3.可信区间定义:按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidence level),常取95%或99%。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限。
4.可信区间的计算:
样本含量较小时 (n≤100):下限: 上限:
样本含量较大时 (n>100):下限: 上限:
5.均数之差可信区间的计算:
均数之差”与“均数之差的标准误”之比,服从自由度n = n1+n2 -2的 t 分布。
样本含量较大时,服从标准正态分布。
合并方差: 均数之差的标准误:
6.可信区间的两个要素:
Ø 可信度(Confidence):准确性,可靠性,即1-α。一般取90%,95%,可人为控制。
Ø 精确性(Precision):区间的大小,越小越好。
Ø 必须二者兼顾
7.可信区间的宽度:
Ø 可信度越大,可信区间越宽,说明用该区间来估计总体参数(总体均数)越可靠。
Ø 标准差越小,可信区间就越窄,意味着如果总体内变异程度较小时,在相同的可信度下,只需要一个比较窄的可信区间就可以估计总体均数。
Ø 随着样本含量的增加,可信区间逐渐变窄。
8.正确理解可信区间:
Ø 可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。
Ø 这里的95%,指的是方法本身!而不是某个区间!
Ø 总体参数虽未知,但却是固定的值,而不是随机变量值 。
假设检验
1.假设检验的目的:基本目的就是分辨两个样本是否属一个总体或两个不同的总体,并对总体作出适当的结论。
2.假设检验的一般步骤:
步骤1:建立假设,在假设的前提下有规律可寻
n 零假设(null hypothesis),记为H0 ,表示目前的差异是由于抽样误差引起的。
n 备择假设(alternative hypothesis),记为H1 ,表示目前的差异是主要由于本质上的差别引起。
步骤2:确立检验水准α(significance level) ,用于确定何时拒绝H0 ,一般取0.05。
步骤3:计算检验统计量和 P 值
计算检验统计量,即计算样本与所假设总体的偏离;样本均数与总体均数m0 间的差别可以用统计量 t 来表示
统计量 t 表示,在标准误的尺度下,样本均数与总体均数 m0 的偏离。这种偏离称为标准 t 离差(standard t deviation)。
根据抽样误差理论,在H0的假设前提下,统计量 t 服从自由度为 n-1的 t 分布,即 t 值在0的附近的可能性大,远离0的可能性小,离0越远可能性越小。
步骤5:界定P值并作结论
3.假设检验应用的注意事项:
A.I型错误和II型错误:
第一类错误(Type I Error):拒绝了实际上是成立的H0;
第二类错误(Type II Error):不拒绝实际上是不成立的H0。
B.检验水准的选择:
检验水准有单双侧之分。选择要有专业背景。 检验水准大小的选择要慎重。
选择要在计算检验统计量之前。
C.双侧检验与单侧检验:
在相同的检验水准下,正确地选择单侧检验将比双侧检验得到更多的检验效能。
D.P和a的涵义:
P值意义:从 H0 总体中随机获得等于或大于现有统计量值的概率。拒绝H0时所冒的风险。
a的意义:犯第一类错误的概率;在假设检验之前人为规定;说明拒绝H0所冒的风险不可超过a。
E.正确对待统计结论和专业结论
专业上有差别,假设检验拒绝H0:结果有效,可以下专业结论;
专业上无差别,假设检验不拒绝H0:下无差别的结论;
专业上有差别,假设检验不拒绝H0:增大样本含量,减少二类误差;
专业上无差别,假设检验拒绝H0:改进试验,减少误差。
F.Significant 的意义
4.假设检验和可信区间的区别:
在相同的α之下,若假设检验拒绝H0(p<= α),那么可信度为(1- α)的可信区间必然不包括总体参数;反之成立。
可信区间和假设检验是对同一问题所作的不同结论,效果等价。
t检验
1.成组设计计量资料比较的t检验:
合并方差(方差的加权平均):
均数之差的标准误: 自由度n = n1+n2 -2
2.两组资料比较的 u 检验:
当随机抽样的样本例数足够大时,t 检验统计量的自由度逐渐增大,t 分布逐渐逼近于标准正态分布,可以利用近似正态分布的原理进行u检验。
3.配对计量资料的 t 检验:
配对 t 检验的实质就是检验样本差值的总体均数是否为0。
4.均数的假设检验应用条件:
独立性、正态性、方差齐性
与应用条件有关的一些内容:正态性检验、方差齐性检验、方差不齐时的近似 t 检验、大样本时,均数比较的 u 检验
5.两个方差的齐性检验:
Levene法:从同一总体随机抽取的样本之两方差,其方差比(大方差/小方差)的分布服从 F 分布:
6.方差不齐时两样本均数比较的近似 t 检验:
7.大样本时均数比较的 u 检验:
Ø 单样本u检验
Ø 两样本u检验
方差分析(ANOVA)Analysis of Variance
t检验的局限性—单因素两水平
1.因素和水平:
Ø 因素(factors):将试验对象随机分为若干个组,加以不同的干预,称为处理因素。方差分析中所要检验的对象。
Ø 在相同的因素下的不同干预,称为不同的水平(level)。方差分析中因素的不同表现。
2.假如每次t检验犯第一类错误的概率是0.05,那么要完全地进行比较,犯第一类错误的概率是1-(1-a)k。此为多组间不能进行t检验的原因。
3.单因素方差分析:研究的是一个处理因素的不同水平间效应的差别。
4.完全随机设计资料的方差分析:
完全随机设计是医学科研中最为常用的一种实验设计方法,它是将受试者随机地分配到各实验组(可包括对照组)中,进行实验并观察实验效应。该设计适用面广,可用于两组或多组实验研究,且各组的样本含量可不相等。
证明:
5.随机区组(配伍组)设计的方差分析(两因素多个样本均数的比较):
概念:随机区组设计又称配伍组设计,是配对设计的扩展,也可看作1:X的配对设计。它是将几个条件相同的受试者划为一个区组(block)或配伍组,然后再按随机的原则,将同一区组的受试者随机分配到各实验组中。
实质:两因素方差分析。
变异分解,N为总样本含量,k为水平数,n为区组数;
6.多个样本均数的两两比较:
又叫多重比较,Multiple Comparison;分类:
事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组间的比较或者特定组间的比较;(Planned Multiple Comparison)
方差分析得到有差别的结论后多个组之间的相互比较的探索性研究(Post Hoc);
Ø Student-Newman-Keuls法(SNK法)
Ø LSD法
Ø Dunnet法:
7.两两比较的注意事项:
Ø 对于方差分析后的两两比较均应以方差分析拒绝相应的H0为前提,且结论均不应与方差分析的结论相悖;
Ø 出现模糊结论,下结论应该谨慎;
Ø 方差分析拒绝H0,但两两比较得不出有差异的结论,因为方差分析效率高。
两种错误的说法:
X2所来自的总体位于X1所来自的总体和X3所来自的总体之间;
X1和X2来自同一总体,X2和X3来自同一总体。
只能说明无法判断样本2来自于何总体!
Ø 不能用t 检验代替方差分析,也不能用t 检验代替两两比较。
Ø 无论是SNK法还是Dunnett法,用于两组比较时,结果与t 检验等价。
8.方差分析的要求:
Ø 独立随机抽样(Independence);正态性(Normality);方差齐性(Homoscedascity)
9.方差齐性检验:
Ø 两个方差的齐性检验:Levene法
Ø 多个方差的齐性检验:Bartlett法
10.方差分析小结:
A.均数、方差的比较
Ø 样本均数与总体均数的比较( t 检验)
Ø 配对设计样本均数的比较(配对t 检验)
Ø 两样本均数的比较
( t 检验, u 检验, F 检验, SNK, Dunnett)
o 多样本均数的比较( F 检验,ANOVA)
n 各组间的比较(SNK法);
n 各试验组与某一对照组间的比较用(Dunnett法)
o 两个方差的比较( F 检验)
B.两个方差的比较( Bartlett 检验)
Ø 分析单因素多水平间的比较或多个因素对结果的影响;
Ø 要求数据满足正态性、独立性、方差齐性
Ø 单因素方差分析 两因素方差分析
Ø 两两比较
Ø 变量变换
Ø 方差分析应用于两组资料的比较时,等价于t检验。
11.变量变换(Variable Transformation)
Ø 方差齐性是一个很strong的假设,如果不齐,就一般不能直接进行方差分析;
Ø 变量变换:
目的:方差齐性化,正态化,线性化
常用方法:对数变换、平方根变换、倒数变换、平方根反正弦变换
分类资料的统计描述statistical description for categorical data
1.常用的相对数:
作用:第一,表示事物出现的频度。第二,便于比较。
率:说明某现象发生的频率与强度
构成比:说明某一事物内部各组成部分所占比例。
比:说明A 是B的多少倍,或百分之几。
2.相对数应用的注意事项:
} 计算相对数时,分母不宜太小
} 对两个或多个相对数指标进行比较时,要考虑抽样误差,进行假设检验,并不能凭相对数的数值大小轻易做出结论。
} 区分构成比和率
} 合计率的计算不是直接求率的平均
} 两合计率的比较需注意两者的内部构成是否相同
3.标准化率
标准化法就是用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
n 不同的标准,所得标准化率不同;
n 标准化率是相对的,其作用仅在于比较,而不表示实际水平;
n 标准化率不代表总率,也不能完全代替分组比较。
二项分布及其应用Binomial distribution and its application:
1.概率分布:随机变量的概率分布:离散分布和连续分布,依赖于相应的随机变量是离散的还是连续的。
2.概念:令x为n次试验中的二项随机变量,成功的概率P(成功)=p,则x的取值为0,l,2,…,n,其联合概率分布为二项分布。
3.二项分布的概率
设事件A出现的概率为p。则在n次独立试验中,事件A恰好出现 k 次的概率为:
4.二项分布的均数和方差
如果X~B(n, p),则
若均数与标准差不用绝对数而用率表示时,
二项分布的累计概率:
5.二项分布的图形:
} 当p=0.5,分布对称;当p ¹0.5,分布呈偏态;
} 当p<0.5时分布呈正偏态;当p>0.5时分布呈负偏态;特别是当n值不是很大时,p偏离0.5愈远,分布愈偏。
} 随着n的增大,二项分布逐渐逼近正态分布。
} 一般地说,如果np或n(1-p)大于5时,常可用正态近似原理处理二项分布问题。
6.二项分布的应用条件:
} ① 各观察单位只能有互相对立的一种结果,如阳性或阴性,生存或死亡等。
} ② 已知发生某一结果(如阴性)的概率p不变,其对立结果(如阳性)的概率则为1-p。
} ③ n次试验在相同条件下进行,且各观察单位的结果互相独立。
7.二项分布的应用
} 率的抽样分布及其性质
} 总体率的可信区间估计
} 两总体率之差p1-p2的区间估计
} 两样本率的比较
} 样本率与总体率的比较
7.1率的抽样分布及其性质(P37)
在n足够大时,样本率 p 的分布近似正态分布。率的均数和方差X~B(n, p),p=X/n
样本率的均数:
样本率的标准差:
(率的标准误)
7.2 总体率的可信区间估计
①查表法 n≤50
②正态近似法 np>5 n(1-p)>5 p±uasp
当样本例数n足够大,且样本率p和(1-p)都不太小时,即np和n(1-p)均大于5时,样本率p的抽样分布近似正态分布.
率的 95%的CI:
7.3 两总体率之差p1-p2的区间估计
} 设p1=r1/n1,p2=r2/n2是两个样本率,p1-p2是它们的差。
} 如果 n1p1,n1(1-p1),n1p1,n2(1-p2)均大于5,则正态近似的方法可用于求总体率之差的可信区间:
7.4 两样本率的比较( n 较大时)(page73)
7.5 样本率与总体率的比较( n 较小时)
χ2检验
一、两个率的比较
1.卡方四格表
根据检验假设H0计算出来的数称作理论频数(theoretical frequency)T。
2.χ2检验的基本思想:如果H0假设成立,则实际频数与理论频数应该比较接近。差值属于随机误差,用χ2 统计量表示:
H0成立时,实际数与理论数的差别不会很大,出现较大χ2 值概率很小。若P≤α,则拒绝H0;若P>α,则尚无理由拒绝它。
3.χ2检验的步骤:
(1)假设两总体率相等
H0:两组总体存活率相同,即π1=π2;
H1:两组总体存活率不同,即π1≠π2;
α=0.05。
(2)实际数与理论数的差值服从χ2分布
(3) 查χ2分布界值表确定P值并作出推论
4.卡方总结:
4.1比较两个样本率所代表的总体率是否有差别,实质是考察现有的样本频数分布是否与假设下的理论频数分布间差异到底是否包含了本质上的差异。χ2 统计量代表了实际数与理论数吻合的程度。
4.2.χ2检验相关问题 -自由度
4.3.χ2检验相关问题-四格表专用公式:
4.4. χ2检验相关问题-χ2值的校正:
p χ2分布是连续性分布;
p 定性资料;
p 实际数过小,增加了第一类错误。
校正公式:
4.5. χ2检验相关问题-应用条件:
n n ≥ 40,T ≥ 5,用c2检验;
n N>40,但1 ≤ T < 5 ,用校正c2。
n n < 40,或T < 1,用确切概率法。
二、配对四格表资料的c2检验
1.计算公式:
2.当20<b+c≤40时,需要校正:
3.配对四格表资料的c2检验步骤
H0:两种检验方法阳性率相同 ,总体B=C;
H1:两种检验方法阳性率不同 ,总体B≠C。
a=0.05。
计算统计量并作出推论:
三、多个率比较的c2检验
多组率或构成比比较时,由于行数或列数超出了2,我们把这样的资料称为行×列表资料。
行×列表的χ2检验统计量:
四、构成比的比较
五、总结:c2检验的应用条件:
o 四格表的分析方法选择条件:
n n ≥ 40,T>5,用c2;
n n ≥ 40,但1 ≤ T < 5,用校正c2。
n n < 40,或T < 1,用Fisher确切概率。
o 配对四格表的分析方法选择条件:
n b+c>40;
n 20<b+c≤40用校正c2 。
n b+c<20,二项分布直接计算概率。
o R×C表的分析方法选择条件:
n 理论数不能小于1;
n 理论数大于等于1小于5的格子数不超过总格子数的1/5。
n 否则用Fisher确切概率;
n 或似然比检验(likelihood ratio test)
o 如果以上条件不能满足,可采用:
ü 增加样本含量
ü 删去某行或某列
ü 合理地合并部分行或列
ü Fisher精确概率法
ü 多个率或构成比比较的χ2检验,结论为拒绝H0时,仅表示几组有差别,并非任2组之间都有差别。若要了解之,可进行多重比较:χ2表的分割或率的可信区间法.
ü 对于有序的分类变量,采用卡方检验方法不能考虑数据的有序性质。为此,对于单向有序可采用秩和检验、Ridit分析,双向有序可采用趋势检验等。
等级资料的统计分析
1.等级资料的特点:
既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;
比“定量”粗,而比一般的“定性”细;
等级间既非等距,亦不能度量。
2.概念:
秩次(rank):秩统计量,是指全部观察值按某种顺序排列的位序;
秩和(rank sum):同组秩次之和。
o 秩次:在一定程度上反映了等级的高低;
o 秩和:在一定程度上反映了等级的分布
位置。
o 对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。
3.成组设计两样本比较的秩和检验:
基本思想:如果H0 成立,即两组分布位置相同,A组的实际秩和应接近理论秩和n1(N+1)/2;B组的实际秩和应接近理论秩和n2(N+1)/2),或相差不大。
如果相差较大,超出了预定的界值,则可认为H0不成立。
步骤:
A.检验假设:H0 :A、B两组分布相同;
H1 :A、B两组分布不同(相互偏离)。
a =0.05。
B.编秩,同一等级求平均秩次。
C.求秩和并确定检验统计量T,若两样本例数不等,以例数较少者为n1,检验统计量为T1。
D.确定P值(查表法,正态近似法)和做出推断结论
正态近似法(n1,n2-n1超出表的范围时)
n1>10或n2-n1 >10时
相同秩次多时校正
4.配对设计样本比较的秩和检验:
o Wilcoxon符号秩和检验
n 计算等级之差值,对差值进行编秩,按差值的绝对值从小到大编秩,差值为0则舍去,绝对值相等则取平均秩次,最后求秩和并冠以差值的符号。
n 查 T 界值表,或用近似 u 检验,计算 P 值;
n 界定 P 值,作出结论。
4.1步骤:H0:差值的总体中位数为0;
H1:差值的总体中位数不为0。
a =0.05。
当n≤50时,查界值表
当n>50时,用u近似
4.2符号秩和检验的基本思想:
o 总秩和为T=N(N+1)/2
o 如H0成立,则正负各半,T+ 与 T- 均接近 N(N+1)/4。
o 如果相差太大,超出了事先规定的界值,
则H0不成立。
5.秩和检验的正确应用
o 主要对等级资料进行分析;
o 秩和检验可用于任意分布(distribution free)的资料;
o 秩和检验用于定量资料:
极度偏态资料,如L型分布,或或个别数值偏离过大而不属于过失误差者
各组离散度相差悬殊,即使经过变换也难以达到方差齐性。
资料中某一端或两端含有不确定值
分布型尚未确知时可以先用秩和检验法进行分析
o 兼有等级和定量性质的资料
成组设计两样本比较:
o 如资料满足 t 检验的条件,应该用 t 检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。
o 如资料不满足 t 检验的条件,而用了t 检验,同样降低了检验效能。
6.参数检验和非参数检验
o 参数检验(Parametric Test):针对的是总体参数,需要原始资料的总体分布信息
n t检验,u检验,F检验
o 非参数检验(Non Parametric Test,Distribution Free Test) :无法获知原始总体的情况;或者,不需要对原始总体的情况进行假定;检验的对象并非总体参数。
n 卡方检验
n 秩和检验
o 方差齐性的卡方检验属于?
o 大样本含量的秩和检验属于?
相关分析Correlation Analysis
1.相关概念:
当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,也就是有相关关系。
若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positive correlation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negative correlation)。
直线相关(linear correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。
用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlation coefficient),又称为积差相关系数(coefficient of product-moment correlation),Pearson相关系数 。
总体相关系数用希腊字母ρ表示,而样本相关系数用r表示,取值范围均为[-1,1]。
直线相关系数的计算:
2.相关系数的确定及假设检验步骤:
(1)画散点图,判断是否有线性趋势
(2)计算样本相关系数r
(3)对r进行假设检验:
H0:ρ=0,两变量间无直线相关的关系;
H1:ρ≠0。
(4)查表,求得P值,作出推论
3.总体相关系数的区间估计
o 从相关系数r等于0的总体中抽样,样本相关系数的分布是对称的。但是从相关系数r不等于0的总体中抽样,样本相关系数的分布是偏态的。
Fisher(1921) 的z变换,使其趋于正态分布:
z 近似服从均数为 标准差为 的正态分布。
将 r 变换为 z ;根据
展开阅读全文