1、,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。,连续型资料,资 料,离散型资料,小样本,大样本,多个样本,方差分析,1/80,第,五,章,2,检验,2/80,二、,2,检验与连续型资料假设检验区分,一、,2,检验定义,三、,2,检验用途,3/80,2,检验,(Chi-square test),对样本,频数分布,所来自总体分布是否服从某种理论分布或某种假设分布所作假设检验,即依据样本频数分布来推断总体分布。
2、,一、,2,检验定义,4/80,二、,2,检验与连续型资料假设检验区分,对总体参数或几个总体参数之差,不是对总体参数检验,而是对总体分布假设检验,正态分布,总体分布是未知,连续,型,资料,离散型资料,检验对象,总体,数据资料,连续型资料假设检验,2,检验,5/80,三、,2,检验用途,适合性检验,独立性检验,同质性检验,6/80,适合性检验(吻合度检验),是指对样本理论数先经过一定理论分布推算出来,然后用,实际观察值,与,理论数,相比较,从而得出实际观察值与理论数之间是否吻合。所以又叫吻合度检验。,7/80,是指研究,两个或两个以上,计数资料或属性资料,之间是相互独立或者是相互联络假设检验,经
3、过假设所观察各属性之间没相关联,然后证实这种无关联假设是否成立。,独立性检验,8/80,在连续型资料假设检验中,对,一个,样本,方差,同质性检验,也需进行,2,检验。,同质性检验,9/80,第一节:,2,检验原理与方法,2,检验基本原理,2,检验统计量基本形式,2,值特点,2,检验基本步骤,2,检验注意事项,10/80,2,检验,就是统计样本,实际观察值,与,理论推算值,之间偏离程度。,实际观察值与理论推算值之间偏离程度就决定其,2,值大小。理论值与实际值之间偏差越大,,2,值就越大,越不符合;偏差越小,,2,值就越小,越趋于符合;若两值完全相等时,,2,值就为0,表明理论值完全符合。,原理,
4、11/80,理论值,观察值,12/80,2,检验统计量基本形式,2,(O,i,E,i,),2,E,i,O,实际观察频数,(,observational frequency,),E,无效假设下期望频数,(,expectation frequency,),13/80,性别,观察值(O),理论值(E),O-E,公,母,428,448,438,438,-10,+10,累计,876,876,0,876只羔羊性别调察,抽样误差?,实质性变化?,14/80,要回答这个问题,首先需要确定一个统计量,将其用来表示,实际观察值,与,理论值,偏离程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。,判断实
5、际观察值与理论值偏离程度,最简单方法是求出实际观察值与理论值,差数,。,15/80,性别,观察值(O),理论值(E),O-E,公,母,428,448,438,438,-10,+10,累计,876,876,羔羊性别观察值与理论值,因为差数之和正负相消,并不能反应实际观察值与理论值相差大小。,0,16/80,为了防止正、负相抵消问题,可将实际观察值与理论值差数平方后再相加,也就是计算:,(OE),2,O,实际观察频数,E,无效假设下期望频数,17/80,羔羊性别观察值与理论值,性别,观察值(O),理论值(E),O-E,(OE),2,公,母,428,448,438,438,-10,+10,100,1
6、00,累计,876,876,0,18/80,值越大,观察值与理论值相差也就越大,反之越小。,19/80,200元,0元,奖学金,一等,三等,10元,10元,实际得到190元,实际得到60元,谁的贡献大?,5,14,20/80,这两组观测值与理论值的偏离程度是不相同的,两组差数即使相同,但其差数占理论值,比重,不一样。,等级,观察值(O),理论(E),O-E,(OE),2,一等,三等,190,60,200,70,-10,-10,100,100,21/80,为了填补这一不足,可先将实际观察值与理论值差数,平方,,即(OE),2,,再用差数平方除以对应理论值,将之化为相对数,从而来反应(OE),2,
7、比重,最终将各组求和,这个总和就是,2,。,22/80,羔羊性别观察值与理论值,性别,观察值(O),理论值(E),O-E,(OE),2,/E,公,母,428,448,438,438,-10,+10,0.2283,0.2283,累计,876,876,0,0.4566,2,(O,i,E,i,),2,E,i,2,值就等于各组观察值和理论值差平方与理论值之比,再求其和。,23/80,2,值特点,可加性,非负值,随O和E而改变,2,(O,i,E,i,),2,E,i,24/80,2,值与概率P成反比,,2,值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设理论分布越相一致;,2,越大,P值越小,
8、说明二者之差越大,样本分布与假设理论分布越不一致。,25/80,观察值与理论值差异由抽样误差引发,即观察值理论值。同时给出相反备择假设H,A,:观察值与理论值差值不等于0,即观察值理论值,普通确定为0.05或0.01,1.提出无效假设H,0,基本步骤,2.确定显著水平,26/80,3.计算样本,2,值,4.进行统计推断,2,2,2,P,2,P,2,2,49/80,给药方式,有效,无效,总数,有效率,口服,注射,58,64,40,31,98(,R,1,),95(,R,2,),59.2,67.4,总数,122(,C,1,),71(,C,2,),193(,T,),给药方式与给药效果,22列联表,1.
9、H,0,:给药方式与给药效果相互独立。,H,A,:给药方式与给药效果相关联。,2.给出显著水平0.05,50/80,3.依据H,0,,利用概率乘法法则:事件A与事件B同时出现概率为:P(AB)=P(A)P(B),口服与有效同时出现理论频率口服频率有效频率,即P(AB)=P(A)P(B)98/193 122/193,理论频数Ei理论频率总数,(98/193 122/193)193,(98 122)/193=61.95,即E,ij,R,i,C,j,/T=行总数列总数/总数,51/80,E,11,=R,1,C,1,/T=61.95 E,12,=R,1,C,2,/T=36.05,E,21,=R,2,C
10、,1,/T=60.05 E,22,=R,2,C,2,/T=34.95,给药方式,有效,无效,总数,口服,注射,58(,61.95,),64(,60.05,),40(,36.05,),31(,34.95,),98(,R,1,),95(,R,2,),总数,122(,C,1,),71(,C,2,),193(,T,),给药方式与给药效果22列联表,52/80,计算,2,值,:因为df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算,2,值需进行连续性矫正:,给药方式,有效,无效,总数,口服,注射,58(,61.95,),64(,60.05,),40(,36.05,),31(,34.95,),
11、98(,R,1,),95(,R,2,),总数,122(,C,1,),71(,C,2,),193(,T,),53/80,4.查,2,表,当df=1时,,2,0.05,3.841,而,2,c,=0.863,2,0.05,,P0.05,应接收H,0,,拒绝H,A,,说明给药方式与给药效果相互独立.,54/80,2 2列联,表,2,检验可利用以下简式而无须计算理论次数:,T/2为矫正数,55/80,给药方式,有效,无效,总数,口服,注射,58,64,40,31,98(,R,1,),95(,R,2,),总数,122(,C,1,),71(,C,2,),193(,T,),56/80,(二),2c列联表独立性
12、检验,行 列,1,2,C,累计,1,2,O,11,O,21,O,12,O,22,O,1c,O,2c,R,1,R,2,累计,C,1,C,2,C,c,T,2c列联表普通形式,因为df=(2-1)(c-1)2,故计算值时不需作连续性矫正,57/80,检测甲、乙、丙三种农药对烟蚜毒杀效果,结果以下,使分析这三种农药对烟蚜毒杀效果是否一致?,甲,乙,丙,累计,死亡数,未死亡数,37,150,49,100,23,57,109,307,累计,187,149,80,416,三种农药毒杀烟蚜死亡情况,例子,58/80,1.,H,0,:对烟蚜毒杀效果与农药无关,农药类型间相互独立;,H,A,:二者相关,2.取显著
13、水平0.05,3.统计数计算,59/80,60/80,理论值计算:,甲,乙,丙,累计,死亡数,未死亡数,37,(49.00),150,(138.00),49,(39.04),100,(109.96),23,(20.96),57,(59.04),109,307,累计,187,149,80,416,2,值计算:,61/80,(4)查,2,值表,进行推断,查,2,表,当df=(2-1)(3-1)=2时,,2,0.05,5.99,现实得,2,7.694,2,0.05,,则拒绝H,0,,接收H,A,,说明三种农药对烟蚜毒杀效果不一致。,62/80,简便计算公式,甲,乙,丙,累计,死亡数,未死亡数,37,
14、(49.00),150,(138.00),49,(39.04),100,(109.96),23,(20.96),57,(59.04),109,307,累计,187,149,80,416,63/80,64/80,(三)rc列联表独立性检验,行 列,1,2,C,累计,1,2,r,O,11,O,21,O,r1,O,12,O,22,O,r2,O,1c,O,2c,O,rc,R,1,R,2,R,c,累计,C,1,C,2,C,c,T,rc,列联表是指,r3,、,c 3,计数资料,上表是,rc,列联表普通形式。,df=(r-1)(c-1)1,,故不需进行连续性矫正。,65/80,rc列联表计算公式:,i=1,
15、2,r j=1,2,c,66/80,例,某医院用碘及治疗地方性甲状腺肿,不一样年纪治疗效果列于下表,试检验不一样年纪治疗效果有没有差异?,年纪(岁),治愈,显效,好转,无效,累计,1130,3150,50以上,67,32,10,9,23,11,10,20,23,5,4,5,91,79,49,累计,109,43,53,14,219,不一样年纪用碘剂治疗甲状腺肿效果比较,67/80,1.H,0,:治疗效果与年纪无关;,H,A,:治疗效果与年纪相关,即不一样年纪治疗效果不一样;,2.,给出显著水平0.01,68/80,3.计算统计数,2,:,年纪(岁),治愈,显效,好转,无效,累计,1130,315
16、0,50以上,67,32,10,9,23,11,10,20,23,5,4,5,91,79,49,累计,109,43,53,14,219,69/80,4.,查,2,表,当,df=(3-1)(4-1)6,时,,2,0.01,16.81,,所以,2,46.988,2,0.01,,,P0.01,,应拒绝,H,0,,接收,H,A,,说明治疗效果与年纪相关。,70/80,在治疗效果与年纪相关基础上,能够将下面,34,列联表做成,3个24,列联表,测验,2,个年纪段疗效差异:,1130岁,与,3150岁,两个年纪段疗效比较,1130岁,与,50岁以上,两个年纪段疗效比较,3150岁,与,50岁以上,两个年纪
17、段疗效比较,71/80,(1),1130岁,与,3150岁,两个年纪段疗效比较,年纪(岁),治愈,显效,好转,无效,累计,1130,3150,67,32,9,23,10,20,5,4,91,79,累计,99,32,30,9,170,72/80,(2),1130岁,与,50岁以上,两个年纪段疗效比较,年纪(岁),治愈,显效,好转,无效,累计,1130,50以上,67,10,9,11,10,23,5,5,91,49,累计,77,20,33,10,140,73/80,(3),3150岁,与,50岁,以上两个年纪段疗效比较,年纪(岁),治愈,显效,好转,无效,累计,3150,50以上,32,10,23
18、,11,20,23,4,5,79,49,累计,42,34,43,9,128,74/80,1130岁与3150岁两个年纪段疗效比较,2,21.202,(极显著),1130岁与50岁以上两个年纪段疗效比较,2,38.37,(极显著),3150岁与50岁以上两个年纪段疗效比较,2,9.574,(显著),df=(2-1)(4-1)=3,2,0.05,=7.81,2,0.01,=11.34,75/80,小结,适合性检验,2,检验,独立性检验,多组资料,显隐性两组资料,22列联表,2c列联表,rc列联表,76/80,多组资料,显隐性,两组资料,r:m,77/80,22列联表,2c列联表,rc列联表,78/
19、80,习题1.进行大豆等位酶,Aph,电泳分析,193份野生大豆、223份栽培大豆等位基因型次数列于下表,试分析大豆,Aph,等位酶等位基因频率是否因物种而不一样。,物种,等位基因,总计,1,2,3,野生大豆,29(23.66),68(123.87),96(45.47),193,栽培大豆,22(27.34),199(143.13),2(52.53),223,总计,51,267,98,416,79/80,习题2.下表为不一样浇灌方式下水稻叶片衰老情况调查资料。试测验稻叶衰老情况是否与浇灌方式相关。,浇灌方式,绿叶数,黄叶数,枯叶数,总计,深水,146(140.69),7(8.78),7(10.53),160,浅水,183(180.26),8(11.24),13(13.49),205,湿润,152(160.04),14(9.98),16(11.98),182,总计,481,30,36,547,80/80,