1、医学遗传学遗传学数医学遗传学遗传学数据统计据统计为什么要应用统计方法分析数据?(孟德尔对数据的处理:孟德尔对数据的处理:YY归类统计归类统计(归类记载归类记载)与描述统计。与描述统计。(实际结果与理论比例波动的解释:实际结果与理论比例波动的解释:YY孟德尔杂交试验结果与理论比例的差异;孟德尔杂交试验结果与理论比例的差异;YY试验误差的来源:试验误差的来源:随机误差:随机误差:N(0,N(0,2 2);系统误差。系统误差。(本节中概率定理及二项式公式是用于推算理论比例,本节中概率定理及二项式公式是用于推算理论比例,而而 2 2测验则是用于测定试验结果是否符合理论比例。测验则是用于测定试验结果是否
2、符合理论比例。2医学遗传学遗传学数据统计一、概率原理与应用(一一)、概率、概率(probability):(probability):YY概率概率(机率机率/几率几率/或然率或然率):指一定事件总体中某一事件:指一定事件总体中某一事件发生的可能性发生的可能性(几率几率)。YY例:杂种例:杂种F F1 1产生的配子中,带有显性基因和隐性基因的产生的配子中,带有显性基因和隐性基因的概率均为概率均为5050。YY在遗传研究时,可以采用概率及概率原理对各个世代尤在遗传研究时,可以采用概率及概率原理对各个世代尤其是分离世代其是分离世代(如如F F2 2)的表现型或基因型种类和比率的表现型或基因型种类和比
3、率(各各种类型出现的概率种类型出现的概率)进行算,从而分析、判断该比率的进行算,从而分析、判断该比率的真实性与可靠性;并进而研究其遗传规律。真实性与可靠性;并进而研究其遗传规律。3医学遗传学遗传学数据统计(二)概率基本定理(乘法定理与加法定理)(1.乘法定理:两个独立事件同时发生的概率等于各个事件发生的概率的乘积。YY例:双杂合体例:双杂合体(YyRr)(YyRr)中,中,YyYy的分离与的分离与RrRr的分离是相的分离是相互独立的,在互独立的,在F F1 1的配子中的配子中:具有具有Y Y的概率是的概率是1/21/2,y y的概率也的概率也1/21/2;具有具有R R的概率是的概率是1/21
4、/2,r r的概率是的概率是1/21/2。而同时具有而同时具有Y Y和和R R的概率是两个独立事件的概率是两个独立事件(具有具有Y Y和和R)R)概率的乘积:概率的乘积:1/21/2=1/41/21/2=1/4。4医学遗传学遗传学数据统计(三)、概率定理的应用示例1.1.用乘法定理推算用乘法定理推算F F2 2表现型种类与比例表现型种类与比例.(如前所述,如前所述,根据分离规律,根据分离规律,F F1 1(YyRr)(YyRr)自交得到的自交得到的F F2 2代中:代中:YY子叶色呈黄色的概率为子叶色呈黄色的概率为3/43/4,绿色的概率为,绿色的概率为1/41/4;YY种子形态圆粒的概率为种
5、子形态圆粒的概率为3/43/4,皱粒的概率为,皱粒的概率为1/41/4。YY因此根据乘法定理:因此根据乘法定理:6医学遗传学遗传学数据统计(三)、概率定理的应用示例2.2.用乘法定理推算用乘法定理推算F F2 2基因型种类与比例基因型种类与比例.YYF F1 1雌雄配子均有四种,且每种的概率为雌雄配子均有四种,且每种的概率为1/41/4;并且各种雌雄配;并且各种雌雄配子结合的机会是均等的。子结合的机会是均等的。YY根据乘法定理,根据乘法定理,F F2 2产生的产生的1616种组合方式;种组合方式;YY再根据加法定理。其中基因型再根据加法定理。其中基因型YYRrYYRr出现的概率是出现的概率是1
6、/16+1/161/16+1/16。7医学遗传学遗传学数据统计8医学遗传学遗传学数据统计二、二项式展开式与应用(一一)、二项式公式与通式二项式公式与通式(二二)、杂种自交后代群体的基因型结构、杂种自交后代群体的基因型结构(三三)、测交后代群体的表现型结构、测交后代群体的表现型结构(四四)、杂种自交后代群体表现型结构、杂种自交后代群体表现型结构(五五)、杂种自交后代某种表现型出现的概、杂种自交后代某种表现型出现的概率率9医学遗传学遗传学数据统计(2个子代:(p+q)2=1p2+2pq+1q2Y(Aa+aa)2=1Aa2+2Aa*aa+1aa2(=(1/2+1/2)2=1/4+2/4+1/4(3个
7、子代:(p+q)3=1p3+3p2q+3pq2+1q3(Aa+aa)3=1Aa3+3Aa2*aa+3Aa*aa2+1aa3 1/8+3/8+3/8+1/810医学遗传学遗传学数据统计(一)、二项式公式与通式(用于用于分析两分析两对立事件对立事件(非此即彼非此即彼)在在多次试验多次试验中每种事中每种事件组合发生的概率。件组合发生的概率。(设设A A、B B为对立事件,为对立事件,P(A)=p,P(B)=qP(A)=p,P(B)=q,n n为估测其事件为估测其事件出现概率的事件数(几个子代?)。显然出现概率的事件数(几个子代?)。显然P(A+B)=p+q=1P(A+B)=p+q=1。YYr r:在
8、:在n n次事件中次事件中A A事件出现的次数;事件出现的次数;YYn-rn-r:在:在n n次事件中次事件中B B事件出现的次数;事件出现的次数;11医学遗传学遗传学数据统计(例:Aa X aa,如产生4个子代,问子代中Aa的机会有多少?(因Aa X aa产生配子时分离,子代中出现Aa和aa的概率各为1/2,即:(p,q 1/2,s=1,n=4(求出概率为1/1612医学遗传学遗传学数据统计(二)、杂种自交后代群体的基因型结构(以两对基因杂合体以两对基因杂合体(YyRr)(YyRr)自交为例,分析其自交后代自交为例,分析其自交后代群体群体基因型结构基因型结构时:时:YYA A事件为一个事件为
9、一个F F2 2中出现显性基因中出现显性基因(Y(Y或或R)R),P(A)=p=1/2P(A)=p=1/2;YYB B事件为一个事件为一个F F2 2中出现隐性基因中出现隐性基因(y(y或或r)r),P(B)=q=1/2P(B)=q=1/2。YYn=4n=4为为(杂合杂合)基因基因个数个数,有,有p+q=1.p+q=1.(代入二项公式,得到代入二项公式,得到F F2 2个体中,具有:个体中,具有:YY4 4个显性基因的概率为个显性基因的概率为1/16(1/16(一种基因型一种基因型);YY3 3个显性、个显性、1 1个隐性基因的概率为个隐性基因的概率为4/16(4/16(多种基因型多种基因型)
10、;YY2 2个显性、个显性、2 2个隐性基因的概率为个隐性基因的概率为6/16(6/16(多种基因型多种基因型);YY1 1个显性、个显性、3 3个隐性基因的概率为个隐性基因的概率为4/16(4/16(多种基因型多种基因型);YY4 4个隐性基因的概率为个隐性基因的概率为1/16(1/16(一种基因型一种基因型)。13医学遗传学遗传学数据统计(三)、测交后代群体的表现型结构(以两对基因杂合体以两对基因杂合体(YyRr)(YyRr)测交测交为例,分析其自交后代为例,分析其自交后代群体群体表现型结构表现型结构时:时:YYA A事件:事件:FtFt表现为显性表现为显性(黄子叶或圆粒黄子叶或圆粒),P
11、(A)=p=1/2P(A)=p=1/2;YYB B事件:事件:FtFt表现为隐性表现为隐性(绿子叶或皱粒绿子叶或皱粒),P(B)=q=1/2P(B)=q=1/2。YYn=2n=2为相对性状为相对性状(杂合基因杂合基因)对数对数,有,有p+q=1.p+q=1.(代入二项公式,得到代入二项公式,得到FtFt中,表现:中,表现:YY2 2个显性性状的概率为个显性性状的概率为1/4(1/4(黄圆黄圆);YY1 1个显性、个显性、1 1个隐性性状的概率为个隐性性状的概率为2/4(2/4(黄皱、绿圆黄皱、绿圆);YY2 2个隐性基因的概率为个隐性基因的概率为1/4(1/4(绿皱绿皱)。14医学遗传学遗传学
12、数据统计(四)、杂种自交后代群体表现型结构(以以两对两对基因杂合体基因杂合体(YyRr)(YyRr)自交自交为例,分析其自交后代为例,分析其自交后代群体群体表现型结构表现型结构时:时:YYA A事件:事件:F F2 2表现为显性表现为显性(黄子叶或圆粒黄子叶或圆粒),P(A)=p=3/4P(A)=p=3/4;YYB B事件:事件:F F2 2表现为隐性表现为隐性(绿子叶或皱粒绿子叶或皱粒),P(B)=q=1/4P(B)=q=1/4。YYn=2n=2为相对性状为相对性状(杂合基因杂合基因)对数对数,有,有p+q=1.p+q=1.(代入二项公式,得到代入二项公式,得到F F2 2中,表现:中,表现
13、:YY2 2个显性性状的概率为个显性性状的概率为9/16(9/16(黄圆黄圆);YY1 1个显性、个显性、1 1个隐性性状的概率为个隐性性状的概率为6/16(6/16(黄皱、绿圆黄皱、绿圆);YY2 2个隐性基因的概率为个隐性基因的概率为1/16(1/16(绿皱绿皱)。15医学遗传学遗传学数据统计(四)、杂种自交后代群体表现型结构(当有当有三对三对基因杂合体基因杂合体(YyRrCc)(YyRrCc)自交自交时,其自交后代群时,其自交后代群体体表现型结构表现型结构分析时:分析时:YYA A事件:事件:F F2 2表现为显性表现为显性(黄子叶、圆粒或红花黄子叶、圆粒或红花),P(A)=p=3/4P
14、(A)=p=3/4;YYB B事件:事件:F F2 2表现为隐性表现为隐性(绿子叶、皱粒或白花绿子叶、皱粒或白花),P(B)=q=1/4P(B)=q=1/4。YYn=3n=3为相对性状为相对性状(杂合基因杂合基因)对数对数,有,有p+q=1.p+q=1.(同样代入二项式公式,得到同样代入二项式公式,得到27:27:9:127:27:9:1的表现型结构。的表现型结构。16医学遗传学遗传学数据统计(五)、杂种自交后代某种表现型出现的概率关键在于首先根据给定条件确定p、q、n以及要求推算项的r值。17医学遗传学遗传学数据统计三、2平方测验及应用2测验是一种统计假设测验:先作统计假设(一个无效假设和一
15、个备择假设),然后根据估计的参数(2)来判断应该接受其中哪一个。18医学遗传学遗传学数据统计(一)、2测验的两种应用(1.1.样本方差的同质性检验;样本方差的同质性检验;(2.2.次数分布资料的适合性测验。次数分布资料的适合性测验。YY在检验杂交试验得到的在检验杂交试验得到的 k k 种种表现型表现型的数目的数目(次数分布资次数分布资料料)是否符合一个预期的理论比例时,采用下述公式计是否符合一个预期的理论比例时,采用下述公式计算统计参数算统计参数 2 2值,该参数符合以值,该参数符合以k-1k-1为自由度的一个为自由度的一个 2 2理论分布。理论分布。19医学遗传学遗传学数据统计(二)、2测验
16、应用方法(统计假设:统计假设:YY无效假设无效假设H H0 0:试验结果与理论比例相符合;:试验结果与理论比例相符合;YY备择假设备择假设H HA A:试验结果与理论比例不相符。:试验结果与理论比例不相符。(参数估计与检验:参数估计与检验:YY1.1.按公式计算按公式计算 2 2值值;YY2.2.用统计参数用统计参数 2 2与查表得到的与查表得到的 2 2,k-1,k-1比较;比较;为临界概率值,为为临界概率值,为0.050.05或或0.010.01,通常用,通常用0.050.05;当当 2 20.05)0.05时,接受无效假设时,接受无效假设(差异不显著差异不显著)。20医学遗传学遗传学数据
17、统计X2检验应用实例YYk=4k=4,df=k-1=3df=k-1=3;2 20.05,30.05,3=7.815=7.815;YY 2 2=0.47=0.47,P(P(2 2)(0.90-0.95)(0.90-0.95)(结论:结论:YyRrYyRr个体自交后代四种表现型的比例与个体自交后代四种表现型的比例与9:3:3:19:3:3:1的理论比例间差异不显著。的理论比例间差异不显著。21医学遗传学遗传学数据统计(三)、2测验的两个问题1.1.次数资料作适合性测验且次数资料作适合性测验且df=1df=1时,时,需要对需要对 2 2值进行连续性校正。值进行连续性校正。(原因:原因:2 2分布是连续性分布,而分布是连续性分布,而次数资料是间断性分布资料,由次次数资料是间断性分布资料,由次数资料估计到的数资料估计到的 2 2值有偏大的趋势,值有偏大的趋势,尤其当自由度为尤其当自由度为1 1时。时。(方法:请复习生物统计相关内容。方法:请复习生物统计相关内容。(2.2.2 2测验不能用测验不能用于百分数资料的于百分数资料的检验,所以百分检验,所以百分数资料应该首先数资料应该首先转化成频数资料。转化成频数资料。22医学遗传学遗传学数据统计
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100