收藏 分销(赏)

生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx

上传人:a199****6536 文档编号:3306611 上传时间:2024-07-01 格式:PPTX 页数:40 大小:317.39KB
下载 相关 举报
生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx_第1页
第1页 / 共40页
生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx_第2页
第2页 / 共40页
生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx_第3页
第3页 / 共40页
生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx_第4页
第4页 / 共40页
生物统计学卡方检验省公共课一等奖全国赛课获奖课件.pptx_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、第五章第五章 卡方检验卡方检验第1页教学目要求v掌掌握握:卡卡方方检检验验适适用用条条件件和和计计算算公公式式;适适合合性性检检验验基基本本原原理理和和方方法法;独独立立性性检检验验原原理理和和方法。方法。v熟悉:适合性检验和独立性检验应用。熟悉:适合性检验和独立性检验应用。v了了解解:适适合合性性检检验验在在遗遗传传学学及及其其它它生生物物学学科科中上应用。中上应用。第2页讲授内容讲授内容v一、卡方检验原理和方法一、卡方检验原理和方法v二、适合性检验二、适合性检验v三、独立性检验三、独立性检验第3页一、卡方检验原理和方法一、卡方检验原理和方法v1、卡方检验原理、卡方检验原理 应应用用理理论论

2、值值(expected value,E)与与观观察察值值(observed value,O)之之间间偏偏离离程程度度来来决定卡方值大小。决定卡方值大小。第4页2、卡方检验程序、卡方检验程序v将观察值分为将观察值分为k组组v计算计算n次观察值中每组观察频数,记为次观察值中每组观察频数,记为Oiv依依据据变变量量分分布布规规律律或或概概率率运运算算法法则则,计计算算每每组组理理论论频率为频率为Piv计算每组理论频数计算每组理论频数Eiv检验检验Oi与与Ei差异显著性,判断二者之间不符合度差异显著性,判断二者之间不符合度第5页va、零零假假设设:H0:O-E=0;备备择择假假设设:O-E0(这这里里

3、检检验验不不是参数,而是判断观察数是否符合理论分布)是参数,而是判断观察数是否符合理论分布)vb、检检验验统统计计量量:这这里里要要求求n充充分分大大,当当n50时时(最最好好100),所所定定义义检检验验统统计计量量近近似似服服从从卡卡方方分分布布,Ei=nPi不不得得小小于于5,若若小小于于5,将将尾尾区区相相邻邻组组合合并并,直直到到合合并并后后组组Ei5,合并后再计算卡方值。,合并后再计算卡方值。第6页vc、建立拒绝域、建立拒绝域vd、作出统计学结论、作出统计学结论第7页v用来检验观察数与依照某种假设或分布模型用来检验观察数与依照某种假设或分布模型计算得到理论数之间一致性一个统计假设检

4、计算得到理论数之间一致性一个统计假设检验,方便判断该假设或模型是否与实际观察验,方便判断该假设或模型是否与实际观察数相吻合。数相吻合。二、适合性检验(二、适合性检验(goodness of fit)第8页v(一)总体参数未知正态性检验(一)总体参数未知正态性检验1551551531531591591551551501501591591571571591591511511521521591591581581531531531531441441561561501501571571601601501501501501501501601601561561601601551551601601511511

5、571571551551591591611611561561411411561561451451561561531531581581611611571571491491531531531531551551621621541541521521621621551551611611591591611611561561621621511511521521541541571571621621581581551551531531511511571571561561531531471471581581551551481481631631561561631631541541581581521521631631

6、58158154154164164155155156156158158164164148148164164154154157157165165158158166166154154154154157157167167157157159159170170158158例例1 1 高粱高粱“三尺三三尺三”株高测定结果(株高测定结果(cmcm)第9页题解题解组号组号组限组限/cm/cm组界组界/cm/cm中值中值频数频数频率频率1 1141141143143140.5140.5143.5143.51421421 10.010.012 2144144146146143.5143.5146.5146.514

7、51452 20.020.023 3147147149149146.5146.5149.5149.51481484 40.040.044 4150150152152149.5149.5152.5152.515115113130.130.135 5153153155155152.5152.5155.5155.515415423230.230.236 6156156158158155.5155.5158.5158.515715728280.280.287 7159159161161158.5158.5161.5161.516016015150.150.158 8162162164164161.51

8、61.5164.5164.516316310100.10 0.10 9 9165165167167164.5164.5167.5167.51661663 30.030.031010168168170170167.5167.5170.5170.51691691 10.010.01总计总计1001001 1高粱高粱“三尺三三尺三”株高频数分布表株高频数分布表(1)将将观观察察值值分分为为k组组;按按照照分分组组原原理理分分成成10组组,制制成成频频数数分布表分布表第10页v(2)取得)取得n次观察值中,第次观察值中,第i组观察频数记为组观察频数记为Oi,v(3)第)第i组理论频率为组理论频率为Pi

9、,其计算方法以下:,其计算方法以下:先计算样本平均数和标准差先计算样本平均数和标准差 假假设设高高粱粱“三三尺尺三三”符符合合正正态态分分布布 。依依据据参参数数预预计计原原理理,用用 预预计计,用用s/c4=4.98/0.9975=4.99预预计计(样样本本标标准准差分布矩系数差分布矩系数C4、C5表表)。即假设高粱株高)。即假设高粱株高x服从正态分布服从正态分布 依依据据正正态态分分布布概概率率计计算算关关系系,查查附附表表1,计计算算各各组组组组界界理理论论频率频率第11页组号组号组界组界/cm/cm观察频数观察频数(OiOi)观察频率观察频率(PiPi)理论频率理论频率(P P)理论频

10、数理论频数(EiEi)1 1140.5140.5143.5143.51 10.010.010.0050.0050.50.52 2143.5143.5146.5146.52 20.020.020.0220.0222.22.23 3146.5146.5149.5149.54 40.040.040.0660.0666.66.64 4149.5149.5152.5152.513130.130.130.1420.14214.214.25 5152.5152.5155.5155.523230.230.230.2160.21621.621.66 6155.5155.5158.5158.528280.280.

11、280.2320.23223.223.27 7158.5158.5161.5161.515150.150.150.1760.17617.617.68 8161.5161.5164.5164.510100.10 0.10 0.0940.0949.49.49 9164.5164.5167.5167.53 30.030.030.0350.0353.53.51010167.5167.5170.5170.51 10.010.010.0090.0090.90.91001001.00 1.00 1.00 1.00 100100高粱高粱“三尺三三尺三”株高观察频数和理论频数表株高观察频数和理论频数表v(4)计

12、算各组理论频数为)计算各组理论频数为Ei=npi,填入下表填入下表第12页组号组号组界组界/cm/cm观察频数观察频数(OiOi)观察频率观察频率(PiPi)理论频率理论频率(P P)理论频数理论频数(EiEi)卡方值卡方值1 13 3140.5140.5149.5149.57 70.070.070.0930.0939.30 9.30 0.5690.5694 4149.5149.5152.5152.513130.130.130.1420.14214.214.20.1010.1015 5152.5152.5155.5155.523230.230.230.2160.21621.621.60.091

13、0.0916 6155.5155.5158.5158.528280.280.280.2320.23223.223.20.9930.9937 7158.5158.5161.5161.515150.150.150.1760.17617.617.60.3840.3848 81010161.5161.5164.5164.514140.14 0.14 0.1380.13813.813.80.0030.003总计总计1001001.00 1.00 1.00 1.00 1001002.1412.141(5 5)O Oi i与与E Ei i进行比较,判断二者之间不符合度,检验程序以进行比较,判断二者之间不符合

14、度,检验程序以下:下:零假设:零假设:H0:O-E=0;HA:O-E0 检验统计量:检验统计量:高粱高粱“三尺三三尺三”株高观察频数和理论频数表株高观察频数和理论频数表(合并后合并后)第13页v卡卡方方值值自自由由度度df=k-1-a,其其中中k为为合合并并后后组组数数,a为为需需要要由由样样预预计计总总体体参参数数个个数数;合合并并后后组组数数k=6,由由样样本本预预计计了了总总体体平平均均数数和和标标准准差差,故故a=2,df=3,不不用用校校正正,计算卡方值计算卡方值v建立拒绝域建立拒绝域v结论:高粱株高服从正态分布结论:高粱株高服从正态分布第14页v(二)总体参数已知正态性检验(二)总

15、体参数已知正态性检验例例2 自自动动包包装装袋袋装装食食盐盐重重量量是是否否服服从从正正态态分分布布?已已知知每每袋袋标标准重量为准重量为500g,调查了,调查了100袋,结果以下表所表示。袋,结果以下表所表示。袋装食盐重量调查表袋装食盐重量调查表50050051251251551554254252252251451448848849749747547548748749749750050051851850850853053050850850050047947950650650450449349349149150650648748748648649149150550547847849249251

16、251249849849449448248248248251251252752752252247047049349354854850250249649649449449449448848850550547247248248250650647847849449451851850350350350350350348548552952947647649649650050049949948448451751751751750650650050050350352752750050049949949049049649649149149149149049052052051251248248248848850

17、9509488488518518516516516516530530508508492492486486492492536536494494500500511511511511506506493493522522524524492492478478第15页题解题解(1)零假设:)零假设:H0:O-E=0;备择假设;备择假设HA:O-E0(2)分组:样本容量)分组:样本容量n=100,取组数,取组数m=10,组距为,组距为8g(3)计算理论频率)计算理论频率pi和理论频数和理论频数Ei(4)检验统计量计算)检验统计量计算(5)自由度)自由度df=k-1-a=8-1-1=6(6)拒绝域建立)拒绝域

18、建立(7)接收)接收H0,服从正态分布服从正态分布第16页v(三)总体参数未知二项分布检验(三)总体参数未知二项分布检验例例3 检检验验烟烟草草种种子子发发芽芽率率,每每个个培培养养皿皿放放10粒粒种种子子,共共100个个培培养养皿皿,试试验验结结果果以以下下表表所所表表示示。1000粒粒种种子子有有590粒粒发发芽芽,检检验验发发芽芽种种子子数数是是否符合二项分布。否符合二项分布。第17页每皿发芽种子数每皿发芽种子数XiXi观察频数观察频数(OiOi)0 00 01 10 02 20 03 34 44 414145 522226 627277 719198 89 99 95 510100 0

19、总计总计100100v烟草种子发芽率观察频数第18页每皿发芽种子数每皿发芽种子数XiXi观察频数观察频数(OiOi)OiXiOiXi理论频率理论频率(P P)理论频数(理论频数(EiEi)卡方值卡方值0 00 00 00.00010.00016.256.250.810.811 10 00 00.00190.00192 20 00 00.01250.01253 34 412120.0480 0.0480 4 4141456560.12090.120912.0912.090.3020.3025 522221101100.20870.208720.8720.870.0610.0616 6272716

20、21620.25030.250325.0325.030.1550.1557 719191331330.20580.205820.5820.580.1210.1218 89 972720.11110.111115.7115.710.090.099 95 545450.03550.035510100 00 00.00510.0051总计总计1001005905901 11001001.5391.539v烟草种子发芽率观察频数和理论频数表第19页题解题解v1、提出假设、提出假设 H0:O-E=0;HA:O-E0v2、总体参数未知,需要由样本百分比预计、总体参数未知,需要由样本百分比预计P=590/1

21、000=0.59v3、计算理论值和卡方值,理论频率、计算理论值和卡方值,理论频率Pi按照二项分布公式计按照二项分布公式计算算n=10,0k 1010,理论数,理论数E Ei i=NP=NPi iv4、拒绝域建立、拒绝域建立v5、结论:种子发芽率服从二项分布、结论:种子发芽率服从二项分布第20页v(四)总体参数已知二项分布检验(四)总体参数已知二项分布检验例例4 水水稻稻植植株株中中对对白白叶叶枯枯病病有有抗抗性性纯纯合合体体基基因因型型为为SS,对对白白叶叶枯枯病病敏敏感感纯纯合合体体为为ss,杂杂合合体体基基因因型型为为Ss。其其中中抗抗性性为为显显性性性性状状,敏敏感感为为隐隐性性性性状状

22、,将将Ss与与ss进进行行杂杂交交,20个个后后代代中中有有14株株抗抗性性植植株株,6株株敏敏感感植植株株。问问后后代代分分离离比是否符合孟德尔分离定律?比是否符合孟德尔分离定律?表型表型观察频数(观察频数(Oi Oi)理论频数(理论频数(EiEi)卡方值卡方值抗性植株抗性植株141410101.2251.225敏感植株敏感植株6 610101.2251.225总计总计202020202.452.45第21页题解题解v按按照照孟孟德德尔尔分分离离定定律律,Ss与与ss杂杂交交后后代代代代表表型型百百分分比比应应该该为为1:1,即,即10个抗性植株和个抗性植株和10个敏感植株个敏感植株v(1)

23、提出假设)提出假设 H0:O-E=0;HA:O-E0v(2)计计算算理理论论值值和和卡卡方方值值:理理论论值值就就是是依依据据孟孟德德尔尔遗遗传传定定律计算得到后代分离理论数量律计算得到后代分离理论数量v(3)检检验验统统计计量量计计算算:本本例例是是两两组组数数据据,没没有有预预计计参参数数,k=2,a=0,df=1,样本统计量需要连续矫正,样本统计量需要连续矫正第22页v(4)拒绝域建立)拒绝域建立v(5)结论:符合孟德尔分离定律)结论:符合孟德尔分离定律v适合性检验自动程序:适合性检验自动程序:P=Chitest(Oi,Ei):Oi表示观察值表示观察值区域;区域;Ei表示理论值区域;用于

24、适合性检验表示理论值区域;用于适合性检验第23页三、独立性检验三、独立性检验v原理:经过观察数与理论数之间一致性判断事件之原理:经过观察数与理论数之间一致性判断事件之间独立性,即判断两个事件是否是独立事件或处理间独立性,即判断两个事件是否是独立事件或处理间差异是否显著。间差异是否显著。v方法:将数据列成列联表,也称列联表卡方检验。方法:将数据列成列联表,也称列联表卡方检验。第24页一、一、22列列联联表卡方表卡方检验检验v(一)原理:例(一)原理:例5 青青霉霉素素能能够够注注射射,也也能能够够口口服服,天天天天给给感感冒冒患患者者口口服服或或注注射射80万万单单位位青青霉霉素素,调调查查两两

25、种种给给药药方方式式药药效效,结结果果以以下下表表所所表表示示,试试分分析析青青霉霉素素两两种种给给药药方式药用效果是否有差异?方式药用效果是否有差异?第25页两种青霉素给药方式药用效果调查表两种青霉素给药方式药用效果调查表给药方式给药方式有效有效(A A)无效(无效()总数总数有效率有效率口服(口服(B B)58584040989859.20%59.20%注射(注射()64643131959567.40%67.40%总计总计1221227171193193第26页v普普通通考考虑虑样样本本中中各各处处理理之之间间是是否否相相关关联联,处处理间是否是独立事件理间是否是独立事件v检检验验时时以以

26、各各处处理理间间无无关关联联或或者者各各处处理理是是独独立立事件作为零假设事件作为零假设v在一定自由度下和显著水平下进行卡方检验在一定自由度下和显著水平下进行卡方检验v独立检验(独立检验(independence test)第27页v(二)检验程序(二)检验程序1、提出假设、提出假设 H0:O-E=0;HA:O-E02、依据概率乘法法则计算理论数:理论数计算方法、依据概率乘法法则计算理论数:理论数计算方法给药方式给药方式有效(有效(A A)无效(无效()总数总数口服(口服(B B)O1=58 O1=58 E E1 1=98=98122/193=61.95122/193=61.95O2=40 O

27、2=40 E E2 2=98=9871/193=36.0571/193=36.059898注射(注射()O3=64 O3=64 E E1 1=95=95122/193=60.05122/193=60.05O4=31 O4=31 E E1 1=95=9571/193=34.9571/193=34.959595总计总计1221227171193193两种青霉素给药方式药用效果调查观察值和理论值两种青霉素给药方式药用效果调查观察值和理论值第28页3、检验统计量、检验统计量:4、确确定定自自由由度度:22列列联联表表自自由由度度df=(r-1)(c-1),r是是列列联联表表行行数数,c是是列列联联表表

28、列列数数,若若自自由由度度=1,则则应应做做连连续续性校正,校正后性校正,校正后统计统计量量为为:第29页v5、拒绝域建立:、拒绝域建立:v6、结论、结论 青霉素口服效果与注射效果差异不大。青霉素口服效果与注射效果差异不大。注注意意:22列列联联表表卡卡方方检检验验与与之之前前讲讲吻吻合合度度检检验验一一样样,要要求求理理论论数数不不得得小小于于5;当当理理论论数数小小于于5时,应使用时,应使用22列联表准确检验法。列联表准确检验法。第30页二、二、rc列联表列联表v行数和列数都大于行数和列数都大于2时情况称为时情况称为rc列联表,其理论列联表,其理论数计算仍为数计算仍为第31页v例例6 植植

29、物物转转基基因因方方法法惯惯用用有有三三种种:基基因因枪枪介介导导转转化化法法、农农杆杆菌菌介介导导转转化化法法和和花花粉粉管管通通道道法法,三三种种方方法法转转化化烟烟草草成成功功率率(种种子子数数)如如表表所所表表示示,问问三三种种转转基基因因方方法法转转基基因因成成功功率差异是否显著?率差异是否显著?转基因方式转基因方式阳性种子阳性种子假阳性种子假阳性种子总数总数基因枪法基因枪法1921923378337835703570农杆菌法农杆菌法3193193297329736163616花粉管法花粉管法1941943620362038143814总数总数70570510295102951100

30、011000v三种方法转化烟草试验结果第32页题解题解1、提出假设、提出假设 H0:O-E=0;HA:O-E02、依据概率乘法法则计算理论数:理论数、依据概率乘法法则计算理论数:理论数转基因方式转基因方式阳性种子阳性种子假阳性种子假阳性种子总数总数基因枪法基因枪法O O1 1=192 E=192 E1 1=228.8=228.8O O2 2=3378 E=3378 E2 2=3341.2=3341.235703570农杆菌法农杆菌法O O3 3=319 E=319 E3 3=231.8=231.8O O4 4=3297 E=3297 E4 4=3384.2=3384.236163616花粉管法

31、花粉管法O O5 5=194 E=194 E5 5=244.4=244.4O O6 6=3620 E=3620 E6 6=3569.6=3569.638143814总数总数70570510295102951100011000v三种方法转化烟草试验结果理论数第33页3、检验统计量、检验统计量:4、确确定定自自由由度度:列列联联表表自自由由度度df=(r-1)(c-1),r是是列列联联表表行行数数,c是是列列联联表表列列数数,df=(3-1)(2-1)=2,不不用用做做连连续续性性校校正正5、拒绝域建立:、拒绝域建立:6、结论、结论 三种转基因方法成功率显著不一样。三种转基因方法成功率显著不一样。

32、第34页三、三、22列列联联表准确表准确检验检验法法aba+bcdc+da+cb+dN=a+b+c+d第35页v检验程序:检验程序:1、求求组组合合概概率率:p值值表表示示是是在在行行总总数数和和列列总总数数保保持持不不变情况下,上述列联表出现概率变情况下,上述列联表出现概率2、提提出出假假设设:列列联联表表准准确确检检验验零零假假设设仍仍为为不不存存在在处处理效应,显著水平为理效应,显著水平为第36页3 3、检检验验统统计计量量:即即p p值值,若若a a、b b、c c、d d中中任任何何一一个个出出现现0 0时时,可可直直接接用用上上述述公公式式计计算算p p值值,反反之之则则应应该该确

33、确保保行行总总数数和和列列总总数数不不变变条条件件下下,将将4 4格格中中最最小小那那个个数数再再逐逐一一(每每次次降降1 1)降降低低到到0 0,得得到到2 2个个或或多多个个2 22列列联联表表,并并计计算算每每种种2 22列列联联表表p值值,并并将将多个多个p值之和作为总概率值之和作为总概率p4、拒绝域建立、拒绝域建立5、结论、结论第37页v两种农药灭杀棉铃虫效果差异农药农药存活存活死亡死亡总计总计氧化乐果氧化乐果2 23 35 5一扫光一扫光0 06 66 6总计总计2 29 91111v人类性别对白酒香味反应差异性性别别有有无无总总计计男男4 41 15 5女女3 36 69 9总总

34、计计7 77 71717第38页v1、p=0.181820.05 两种农药杀虫效果差异不显著两种农药杀虫效果差异不显著v2、(1)因因为为4个个观观察察值值中中没没有有0出出现现,先先计计算算本本表表概概率:率:p1=0.122v(2)因因为为观观察察值值中中最最小小数数是是1,在在确确保保行行总总数数和和列列总总数都不变条件下,将数都不变条件下,将1降到降到0情况只有一个,情况只有一个,P2=0.010v人类性别对白酒香味反应差异(降序后)性别有有无无总计总计男5 50 05 5女2 27 79 9总计7 77 71717第39页vP=p1+p2=0.1320.05v结论:男女对该酒精香味反应没有区分结论:男女对该酒精香味反应没有区分第40页

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服