1、第七章第七章 计数资料假设检验计数资料假设检验1计数资料的假设检验第1页某医生想观察一个新药对流感预防效果,进行了以某医生想观察一个新药对流感预防效果,进行了以下研究,问此药是否有效?下研究,问此药是否有效?两个率两个率P1(14%),P2(25%)不一样。)不一样。2计数资料的假设检验第2页总体率总体率假假设设检验检验z当两个样本率不一样时,有两种可能:P1,P2所代表总体率相同,因为抽样误差存在,造成了样本率不一样,这种差异在统计上叫差异无差异无统计学意义统计学意义。P1,P2所代表总体率不一样,即两个样原来不一样总体,其差异有统计学意义其差异有统计学意义。z用统计学方法进行判断属于那种情
2、况。(反证法)3计数资料的假设检验第3页 x2检验检验z是一个假设检验方法是一个假设检验方法z符合假设检验规律符合假设检验规律z统计量(统计量(率或比率或比)服从)服从 x2分布分布4计数资料的假设检验第4页某医生想观察一个新药对流感预防效果,进行了某医生想观察一个新药对流感预防效果,进行了以下研究,问此药是否有效?以下研究,问此药是否有效?A:观察例数观察例数 T:理论频数理论频数5计数资料的假设检验第5页x2检验基本公式检验基本公式x2=(A-T)2/T A:表示实际频数,即实际观察到例数。T:理论频数,即假如假设检验成立,应该观察到例数。:求和符号,全部格子值之和自由度:=(R-1)x(
3、C-1)R行数,C列数 注意:是格子数,而不是例数。6计数资料的假设检验第6页z假如假设检验成立,假如假设检验成立,A与与T不应该相差太大。不应该相差太大。z理论上能够证实理论上能够证实 (A-T)2/T服从服从x2分布,计算分布,计算出出x2值后,查表判断这么大值后,查表判断这么大x2是否为小概率事件,是否为小概率事件,以判断建设检验是否成立。以判断建设检验是否成立。7计数资料的假设检验第7页x2分布规律分布规律z自由度一定时,P值越小,值越小,x2值越大,反比关系值越大,反比关系。z当P 值一定时,自由度越大,x2越大。=1时,P=0.05,x2=3.84 P=0.01,x2=6.63 P
4、=0.05时,=1,x2=3.84 =2,x2=5.998计数资料的假设检验第8页1、四格表资料、四格表资料x2检验检验z什么是四格表资料?凡是两个率或组成比资料都能够看做四格表资料。某医生想观察一个新药对流感预防效果,进行了以下研究,问此药是否有效?9计数资料的假设检验第9页四格表普通形式四格表普通形式理论频数T计算公式为:TRC=NRxNC/N NR:所在行累计,所在行累计,NC:所在列累计所在列累计10计数资料的假设检验第10页四格表资料专用公式四格表资料专用公式x2=(ad-bc)2 xN/(a+b)(c+d)(a+c)(b+d)该公式从基本公式推导而来,结果相同;计算较为简单。适用条
5、件:适用条件:N40且且T 5当不满足时用校正公式。当不满足时用校正公式。x2=(|A-T|-0.5)2/T或或x2=(|ad-bc|-n/2)2 xN(a+b)(c+d)(a+c)(b+d)11计数资料的假设检验第11页SPSS计算程序z1.ANALYZE-DESCRIPTIVE STATISTICS-CROSSTABSz2.data-weight cases-frequency variable-ok12计数资料的假设检验第12页13计数资料的假设检验第13页例 题z上例:问此药是否有效。z第一步:建立假设 H0:1=2=20%H1:1 2z第二步:确定显著性水平 =0.05 (x2=3.
6、84)z第三步:计算统计量:n=22040,每格T值大于5,x2=4.125z第四步:确定P值z第五步:判断结果14计数资料的假设检验第14页2、配对(列联表)资料、配对(列联表)资料 2检验检验 有93份咽喉涂抹标本,每份标本分别接种在甲乙两种培养基上,观察其生长情况,结果以下表,两种培养基效果是否不一样?甲乙两种培养基生长情况甲乙两种培养基生长情况乙培养法乙培养法甲培养法甲培养法z累计阳性阳性阴性阴性阳性阳性3737 10 104747阴性阴性1919 27 274646z累计56563737939315计数资料的假设检验第15页SPSS计算程序1.data-weight cases 2.
7、ANALYZE-nonparametric test-2 related samples-test pairs-Mcnemar-OK=0.05,x2=3.8416计数资料的假设检验第16页例:问两种培养基效果是否不一样例:问两种培养基效果是否不一样第一步:建立假设 H0:B=C=b+c/2 H1:BC 第二步:确定显著性水平 =0.05第三步:计算统计量:b+c40时,基本公式:x2=(A-T)2/T,专用公式:x2=(b-c)2/b+c b+c40时,校正公式:x2=(|A-T|-0.5)2/T x2=(lb-cl-1)2/b+c自由度:=(2-1)x(2-1)=1第四步:确定P值第五步:判
8、断结果17计数资料的假设检验第17页3、行x列表x2检验z 四格表是指只有2行2列,当行数或列数超出2时,统称为行x列表。z 行x列表x2检验是对多个样本率(或组成比)检验。z 基本公式:x2=(A-T)2/T 专用公式:x2=n x(A2/nR x nC-1)z 自由度:=(R-1)x(C-1)z 适用条件:表中不宜有1/5以上格子理论频数小于5,或有一个格子理论频数小于1。18计数资料的假设检验第18页 为了解花生黄曲霉素污染,随机观察了三个为了解花生黄曲霉素污染,随机观察了三个地域,结果见下表。试问这三个地域花生黄地域,结果见下表。试问这三个地域花生黄曲霉素污染率是否不一样?曲霉素污染率
9、是否不一样?三个地域花生黄曲霉素污染情况三个地域花生黄曲霉素污染情况n调查地域受检样品受检样品n累计污染率污染率()()未污染未污染污染污染甲甲 6232979.3乙乙30144431.8丙丙 8 31127.3n累计44408447.619计数资料的假设检验第19页=2,=0.05,x2=5.9920计数资料的假设检验第20页主要内容主要内容(计数资料统计分析)(计数资料统计分析)一、相对数一、相对数二、应用相对数注意事项二、应用相对数注意事项三、率标准误三、率标准误四、率可信区间四、率可信区间五、五、x x2 2检验:四格表,配对资料,行检验:四格表,配对资料,行列表列表 21计数资料的假
10、设检验第21页前半段课程前半段课程 小小 结结22计数资料的假设检验第22页基本内容基本内容 统计描述统计描述统计推断统计推断(1)统计推断统计推断(2)计量资料计量资料 频数分布频数分布集中趋势集中趋势离散趋势离散趋势抽样误差抽样误差标准误标准误 t u F检验检验秩和检验秩和检验可信区间可信区间直线相关与回归直线相关与回归偏相关偏相关多元线性回归多元线性回归因子分析因子分析计数资料计数资料相对数相对数(率、比)(率、比)z率标准误;可信区间;z2检验Logistic回归回归23计数资料的假设检验第23页 思索:1.均数与标准差适适用于什么资料描述?2.标准差和标准误有何区分和联络?3.可信区间和参考(正常)值范围有何不一样?4.假设检验基本思想是什么?步骤是什么?5.计量资料假设检验类型有哪些?6.方差分析适适用于什么样设计?7.相关与回归区分与联络是什么?8.相对数用于什么资料描述?9.计数资料主要检验方法是什么?24计数资料的假设检验第24页分析计算要求:1.选择适当计算程序;2.在计算机上计算出结果;3.会看结果;4.完整书写过程。25计数资料的假设检验第25页祝大家取得好成绩!祝大家取得好成绩!王晓莉王晓莉26计数资料的假设检验第26页