资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,群体遗传学(,population genetics,),研究群体中的基因组组成以及世代间基因组变化的学科,第一节 群体的遗传平衡,一、种群(群体)与基因库,种群(,population),:是指可以互相交配潜在的有交配能力的许多个体的集合体,遗传因子(基因)可以以不同的方式从一代传递给下一代,这种可以互相交配的个体所组成的群体称为“孟德尔氏种群”。,种群又指孟德尔群体,即在特定地区内一群能相互交配并繁育后代的个体。一个最大的孟德尔群体就是一个物种。,497,只虎蛾,基因型 分别为:,BB=452,,,Bb=43,和,bb=2,它们的,基因型频率,分别是:,P=f(BB),=452/497=0.909,H=f(Bb),=43/497=0.087,Q=f(bb),=2/497=0.004,合计:,1.000,基因频率,等位频率,(,allelic freguencies,)或称为,基因频率,(,gene freguencie),基因频率,=,(群体中某个基因座位上特定基因的拷贝数,)(,群体中该座位所有等位基因数,),p,=,f,(,B,)=(2,BB,Bb,)/(2,个体总数,),=(2452+43)/(2497),=947/994=,0.953,q,=,f,(,b,)=(22,43)/(2497),=47/994=,0.047,复等位基因的基因频率,牛奶草甲虫,葡萄糖磷酸变位酶,(,PGM,)座位上有,3,个等位基因,每个等位基因编码了酶的不同分子变异体,在一个群体中基因型的数目收集如下:,AA=4,,,AB=41,,,BB=84,,,AC=25,,,BC=88,,,CC=32,,共计,274,个甲虫。它们的等位基因频率是:,f(A),=,p,=(24+41+25)/2274=,0.135,f(B),=,q,=(284+41+88)/2274=,0.542,f(C),=,r,=(232+88+25)/2274=,0.323,由基因型频率来计算基因频率,以深红虎蛾为例:,p=f,(,B,),=(,BB,的频率,+1/2,Bb,的频率,),=0.909+0.0870.5,=0.909+0.0435,=,0.953,q=f,(,b,),=,(,bb,的频率,+1/2,Bb,的频率),=0.004+0.0870.5,=0.004+0.0435,=,0.047,p=f,(X,A,),=,(,2X,A,X,A,),+(X,A,X,a,)+(X,A,Y),2,雌体数,+,雄体数,q=f,(X,a,),=,(,2X,a,X,a,),+(X,A,X,a,)+(X,a,Y),2,雌体数,+,雄体数,X-,连锁座位上的基因频率,第二节 改变基因频率的因素,群体在世代过程中等位基因频率的变化,称为微进化(,microevolution,),即发生在物种内的遗传变化。,大进化(,macroevolution,)指从现有物种中产生新物种的过程,是微进化的扩展、累积的结果,。,改变群体基因频率的因素,突变,能产生新的等位基因,但改变基因频率的速率很慢,自然选择,是进化的潜在动力,突变与选择对常染色体上等位基因频率的联合效应,遗传漂变,对进化平衡的不可预测效应,迁移,造成群体间的基因流(,gene flow,),(,一,),突变(,mutation,),假设:,A,基因频率为,p,a,为,q,A-a,的频率为,u,a-A,的频率为,v,则:每代有,pu,的,A,基因突变为,a,有,qv,的,a,回复突变为,A,当,pu,qv,时,,A,增加而,a,减少;,相反,当,pu,qv,时,,A,减少而,a,增加。,当群体平衡时:,pu=qv,,或,p/q=v/u,即平衡时,基因频率的比率取决于突变频率的比率,。,设正向突变(,Aa,)的频率为,u,,,回复突变(,aA,)的频率为,v,。,群体中,f(A),=,p,,,f(a)=q,,,假设群体很大,无自然选择存在,那么在每一代中,,A,等位基因以,u,频率突变成,a,增加时,回复突变的等位基因增加。,若,up,vq,时,,f,(,a,),增加,即正突变,回复突变,,若,up,vq,时,,f,(,A,),增加,即正突变,回复突变。,若达到平衡时,,p=vq,up,=0,vq=up,vq=u,(1-,q,),解这个等式,我们可以得到平衡时,q,值,vq=u,uq,vq+uq=u,q,(v+u)=u,q=u/,(,v,+,u,),(,二,),自然选择,(Natural Selection),自然界中逐渐淘汰适合度低的个体,选择适合度高的个体作为下一代亲本的过程,.,(),适合度与选择系数,适合度(,fitness,),又称适应值(,adaptive value,),用,W,表示,是指,在一定环境下,,一个个体能够生存并把他的基因传递给子代的相对能力。将具有最高生殖效能的基因型的适应值定为,1,,其它基因型在,01,之间。,选择系数(,selective coefficient),用,s,表示,是指,在一定环境下,,某基因型在群体中不利于生存的程度;或自然选择作用下降低的适合度,即,s=1-W,。,致死或不育的基因型,,s=1,,,W=0,。,相同基因型的个体在不同环境下,其,s,及,W,可能不同。,自然选择(,Natural selection,),达尔文(,Charles Darwin,),华莱士(,Russel Wallace,),工业黑化现象,灰色桦尺蠖(,Biston betularia,)椒花蛾,黑化型,(,carbonaria,),1880,年黑蛾的比例已超过了,90%,。,1959,年黑色型为,93.3%,,,1965,年就下降到,90.2%,。,椒花蛾,(4),选择的作用,趋同进化:在突变和选择的作用下,对不同物种间具有趋同进化的趋势,这种现象称协同进化。,遗传负荷:如果一个群体的突变不断积累,并且这些突变是有害的,就会出现的适合度下降。这种现象被称为遗传负荷。用,1,w/W,来表示遗传负荷的度量。,(,三,),迁移(,migration,),指个体从一个群体迁入另一个群体或个体的迁出。,假设:,新迁入的个体数为,m,迁入前的个体数为,1-m,原群体,a,基因的频率为,q,0,新迁入群体的,a,基因频率为,q,m,迁入后,a,基因频率,q,1,=mq,m,+,(,1-m,),q,0,=m(q,m,-q,0,)+q,0,q=m(q,m,-q,0,)+q,0,-q,0,=m(q,m,-q,0,),说明由于迁移引起的基因频率改变取决于新迁入的个体数以及新迁入的群体与原群体之间基因频率的差异。,迁移,(,migration,)的作用,(,1,)它将新的等位基因导入到群体中。,(,2,)当迁移动物的基因频率和,受纳群体,的不同时,基因流改变了受纳群体的等位基因频率。,假设:群体,I,中,A,等位基因频率(,P,I,)是,0.8,,,群体,II,中,A,的频率(,P,II,)是,0.5,。,每代某些个体从群体,I,迁移到群体,II,。迁移后群体,II,实际含有两组个体:,一组是迁移者,其,A,等位基因频率,P,I,=0.8,。另一组是接纳群体的成员,,A,等位基因频率,P,II,=0.5,。,迁移者在群体,II,中的比例为,m,,那么迁移后群体,II,中,A,基因的频率是:,P,II,=mP,I,+(1-m)P,II,混合后群体,II,中,A,基因频率为:,P,II,mP,I,+(1-m)P,II,在群体,II,中基因频率的改变设为,P,等于混,合的,A,频率减去群体,II,原来的,A,基因频率:,p=P,II,-P,II,将上式代入,p=mP,I,+(1-m)P,II,P,II,展开,p=mP,I,+P,II,mP,II,P,II,p=mP,I,mP,II,p=m,(,P,I,P,II,),最后结果表明迁移使基因频率发生改变,此依赖于两个因素:混合群体中迁移者的比例(,m,)和两个群体之间基因频率的差(,P,I,P,II,)。,迁移造成群体间的基因流(,gene flow,),设有一个大群体,A,,每代有部分(,m,)个体从,B,迁入,某一等位基因在,A,群体中的频率为,q,o,,,B,群体中为,q,m,,则混合后的群体基因频率为,(1-m),n,=q,n,-Q/q,0,-Q,Rh,血型的一个等位基因,R,;,非洲黑人,q,0,=0.630,美国白人,Q,0,=0.028,美国黑人,q,10,=0.446,计算200300年以来,每代由白人导入黑人的群体中的基因占黑人群体的比例。,(1-,m),10,=q,10,-Q/q,0,-Q,=0.446-0.028/0.630-0.028,m=0.036,白人每代迁入基因比例0.036,(,四,),遗传漂变,(,genetic drift,),由于样本的机误(,chance errors,)导致群体基因频率的随机改变称为,遗传漂变,(,genetic drift,)或简称为漂变。,指基因频率在小群体中的随机增减现象。,此概念是由群体遗传学家,S.Wright,于,1930,年提出的,有时人们也把漂变称,S.Wright,效应,(一)基因频率的随机改变,偶然的因素只有在很小的群体中使基因频率发生改变。,机率使结果和预期比产生偏差的这种现象被称为,取样误差,(,sampling error,)。,为了确定遗传漂变的大小,我们必须知道有效种群大小(,effective population size,),等于成体为下代提供的配子的当量数。,Ne=(4NfNm)/(Nf+Nm),等式中,Nf,是交配的雌体数,,Nm,是交配的雄体数。,70,个雌性和,2,个雄性的群体中,每个雄性要为下一代总的基因数贡献,1/21/2=0.25,。而每个雌性只贡献所有基因的,1/21/70=0.007,。,Ne,=(4702)/(70+2)=7.8,或近似等于,8,个交配成体。这意味着,70,雌和,2,雄的群体其遗传漂变相当于只有,4,个交配雄性和,4,个交配雌性的小群体的遗传漂变。,遗传漂变的原因,取样误差,建立者效应,(,founder effect,),瓶颈效应,(,bottleneck dffect,),:,也可以看成是建,立者效应的一种类型,因为仅几个个体的减少结,果就会影响群体。,小的交配单位丢失了,基因流,(,gene flow,),德国浸礼会的教派叫做,Dunkers,在,1719,年到,1729,年之间,有,50,个,Dunker,家庭从德国迁到美国定居,从此,Dunkers,保持了一个隔离的小群体,不能和教派之外的人群通婚,而他们本身的人数又是相当少。,遗传漂变(,genetic drift,):群体内由于抽样误差造成的等位基因频率的随机波动,.,奠基者效应(,founder effect,):遗传漂变的一种形式,指由带有亲代群体中部分等位基因的少数个体重新建立新的群体。,瓶颈效应:由于自然环境急剧的改变,使得群体中大部分个体死亡,仅存的少数个体侥幸逃生,繁衍成新的群体。,低频率基因由于遗传漂变,成为高频率。,东卡罗林群岛,Pringelap,人群,先天性失明占10。由于1780年飓风,原人群大量死亡,遗留下带有失明基因的个体比例很高,使得该群体的后代有病个体大幅度增加。基因频率改变。,AA Aa aa,AA Aa aa,0.95 0.04 0.01 0.4 0.2 0.4,遗传漂变的效应,导致,基因频率逐代改变,,从而使逐代频率随机波动和漂变。,减少群体中的遗传变异,。,导致等位基因的固定和丢失,第三节 哈迪,-,温伯格法则,哈迪,-,温伯格,(,Hardy-Weinberg,),法则,(,1908,年,),在理想群体中,基因频率和基因型频率逐代将保持不变。,此定律可分为,3,个部分:,第一部分是,前提,:,理想群体:,无穷大,随机,交配,没有突变、没有迁移和自然选择;,第二部分:是,结论,:,基因频率和基因型频率逐,代不变;,第三部分:是,关键,随机交配一代以后基因型,频率将保持平衡。,例如有一个群体其三种基因型频率为,fAA,=0.2,,,fAa,=0.2,faa,=0.6,,,那么两种配子中的基因频率为:,fA=fAA,+1/2,fAa,=0.2+1/2(0.2)=0.3,fa=faa+1/2 fAa,=0.6+1/2(0.2)=0.7,若随机交配,可求出下一代中基因频率为:,fAA,=0.09;,fAa,=0.42;,fAa,=0.49,我们再来计算下下一代配子中的基因频率,fA,=0.09+1/2(0.42)=0.3,fa,=0.49+1/2(0.42)=0.7,在一个无限大的可随机交配的群体中,如果没有任何形式的突变、自然选择、迁移、遗传漂变的干扰,则群体中各基因型的频率可以一代一代维持不变。,证明:,假设:,AA,个体为,p,2,,,Aa,为,2pq,,,aa,为,q,2,。,则:产生,A,或,a,配子的频率为:,A,:,p,2,+1/2(2pq)=p,2,+pq=p(p+q)=p,a:q,2,+1/2(2pq)=q,2,+pq=q(p+q)=q,随机交配:,p A,q a,p A,p,2,AA,pq Aa,q a,pq Aa,q,2,aa,子代:,AA p,2,Aa 2pq,aa q,2,与亲代完全一样。,例:,AA0.6,Aa0.4,aa0,的不平衡群体,产生配子的频率:,A,:,p=0.6+x 0.4=0.8,a,:,q=1/2 x 0.4=0.2,随机交配一代:,0.8 A,0.2 a,0.8 A,0.64 AA,0.16 Aa,0.2 a,0.16 Aa,0.04 aa,三种基因型个体为:,AA0.64,Aa0.362,aa0.04,产生配子的频率:,p=0.64+x 0.32=0.8,q=0.04+x 0.32=0.2,随机交配后三种基因型的个体为:,AA0.64,Aa0.362,aa0.04,与上代相同,群体达到平衡。,基因型,AA Aa aa,基因,A a,个体,(,基因)数,30 60 10,120 80,频率,D=0.3 H=0.6 R=0.1,(D+H+R=1),p=0.6 q=0.4,(p+q=1),例:有一群体:,AA 30,个,,Aa 60,个,,aa 10,个,例题:某一,1000,人群中,MN,血型的分布是,M MN N,250 500 250,M,的频率:(250,X2+500)/1000 x2=0.5,N,的频率:(250,X2+500)/1000 x2=0.5,哈迪,-,温伯格定律的扩展,假如存在,3,个等位基因,A,,,B,和,C,的话,它们的频,率分别为,p,、,q,、,r,,在平衡时基因型的频率也等,于等位基因频率的平方:,(,p+q+r,),2,=,p,2,+,q,2,+,r,2,+2,qp,+2,pr,+2,qr,=,p,2,(,AA,),+q,2,(,BB,),+r,2,(CC)+2pq(AB)+2pr(AC)+2qr(BC),例:长岛海峡兰色的贻贝群体中有一基因座位编码,亮氨酸肽酶,,这个座位有,3,个等位基因:,等位基因 频率,LAP,98,p,=0.52,LAP,96,q,=0.31,LAP,94,r,=0.17,若这个群体达到哈迪,-,温伯格平衡,预期它们的基因型频率将是:,基因型 预期频率,LAP,98,/,LAP,98,p,2,=(0.52),2,=0.27,LAP,98,/,LAP,96,2pq=,2(0.52)(0.31)=0.32,LAP,96,/,LAP,96,q,2,=,(,0.31,),2,=0.10,LAP,96,/,LAP,94,2qr,=2(0.31)(0.17)=0.10,LAP,94,/,LAP,98,2qr,=2(0.52)(0.17)=0.18,LAP,94,/,LAP,94,r,2,=(0.17),2,=0.03,平衡群体,在生物个体随机交配,且没有突变、选择的情况下,群体的基因型频率世代保持不变这样的一个群体称为平衡群体。,随机交配一代,基因型频率发生改变的群体不是平衡群体。,一个非平衡群体,随机交配一代以后,成为平衡群体。,平衡群体鉴定,AA Aa aa,是否平衡,1.0.5 /0.5 -,2.0.4 0.2 0.4 -,3.0.25 0.5 0.25 +,哈迪,-,温伯格比例的测定,为了决定一个群体的基因型是否符合哈迪,-,温伯格比,我们首先从基因型频率中计算,p,和,q,。一旦我们求得了这些基因频率就能计算基因型频率(,p,2,2,pq,和,q,2,),并将这些频率和实际获得和基因型的频率相比较,用卡方来测定。,例,以红,-,黑田鼠(,Clethrionomys gapperi,)的血红蛋白基因为例。人们在这个基因座位发现了,3,种基因型:,MM,、,MJ,和,JJ,。,1976,年在加拿大西北部发现了一个田鼠群体,群体中有,12,只,MM,型,,53,只,MJ,型,和,12,只,JJ,型。为了确定它们的基因型是否符合哈迪,-,温伯格比,我们先用我们熟悉的公式来计算它们的基因频率。,例,用从基因型中计算出的,p,和,q,能重新计算基因型的哈迪,-,温伯格比:,f,(,MM,),=p,2,=(0.50),2,=0.25;,f,(,MJ,),=2,pq,=2(0.50)(0.50)=0.50,;,f,(,JJ,),=q,2,=(0.50),2,=0.25,黑田鼠的血红蛋白基因型比的卡方测定,第四节 在自然群体中的遗传变异,突变和基因重组产生进化的原材料,突变,基因 重组,新的等位基因,多种多样的基因型,种群中出现大量可遗传的变异,变异是,不定向,的,形成了,进化的原材料,不能决定生物进化的方向,隔离与物种的形成,因为马与驴交配产生的后代骡没有生殖能力,马和驴是不是一个物种?,什么是物种?,什么叫隔离?,东北虎,华南虎,隔离分类?什么叫隔离?,两个不同虎亚种,(,马和驴杂交产骡),生殖隔离,注:不同种群之间一旦产,生殖隔离,,就不会有基因交流了。,地理隔离,地理隔离,突变、基因重组、自然选择,生殖隔离,新物种,物种的形成:,加拉帕戈斯群岛一的几种地雀,南 美 洲 地 雀,因地理隔离导致生殖隔离比较,常见,新物种形成的标志:,生殖隔离,某海岛上的昆虫出现残翅和无翅类型,物种的形成,原始祖先,新物种,新物种,(不定向变异),(定向自然选择),(地理隔离、生殖隔离),因地理隔离导致生殖隔离比较常见,亚 洲 虎,南 美 洲 地 雀,地理隔离,突变、重组、自然选择,生殖隔离,新物种,一遗传变异的模型,1.,经典模型,(,classical model,)。,是由实验遗传学家提出的,他们认为,大部分自然群体具有较小的遗传变异,。,根据这个模型表明,在每个群体中一个等位基因的功能是最好的,这个等位基因对自然选择能很好地适应。,自然选择的结果使这个群体中的每一个体几乎都是,“,最好,”,的等位基因。,2.,平衡模型,:,没有单个的等位基因是最好的或分布广泛的。,一个群体的基因库在每个座位含有很多的等位基因。,因此群体中的个体在许多座位上都是杂合的。进化是通过逐步地改变等位基因的频率和种类而发生的。,在一个群体中通过自然选择积极地维持了遗传变异。如镰刀形贫血(,Hb,A,Hb,s,)杂合子的红细胞比镰形贫血患者(,Hb,S,Hb,S,纯合体)及正常人(,Hb,A,Hb,A,)的红细胞对疟原虫具有更高的抵抗力,,3,种基因型的适应性分别为,Hb,A,Hb,A,:,0.81,,,Hb,A,Hb,S,:,1.00,Hb,S,Hb,S,:,0.20,。,许多物种用电泳方法所获得的多态座位比例和杂合性的值。研究的结果很清楚表明大部分物种其蛋白质具有大量的遗传变异,而经典模型明显是错误的。,但这并不能证明平衡模型是正确的。平衡模型预言在自然群体中很多的遗传变异,但平衡模型也提出大量的遗传变异是通过平衡选择来维持,而电泳研究的结果并不能证实这一论点。,现在争论的焦点转移到获得的变异是靠什么维持的。,3.,中性突变,学说(,neuture-mutation,),它是由,木村资生,(,1968,年)提出的,他承认在蛋白质中广泛地存在着遗传变异,但这些变异对于自然选择是中性的。,中性突变学说提出在某些位点上的变异也影响适应性,自然选择将排除这些座位上的变异。,第五节 分子进化,一,DNA,顺序的变异,通常将,进化速率,定义为每年每个核苷酸位点被另外核苷所取代的比例。,序列相似性比较,:,将待研究序列与,DNA,或蛋白质序列库进行比较,用于确定该序列的生物学属性。常用的程序包括,BLAST,,,FASTA,等;,序列同源性分析,:,将待研究序列加入到一组与之同源,但来自不同物种的序列中同时进行多序列比对,以确定该序列与其它序列的同源性大小。完成这项工作必须使用多序列比较算法。常用的程序有,CLUSTAL,。,构建系统进化树,:,根据序列同源性分析结果可构建系统进化树。完成此项工作需多种软件包,如,PYLIP,,,MEGA,等。,稳定性检验,:,检测构建好的进化树的可信度。需进行统计可靠性检验。以大概率(,70%,以上)出现的分支点才是可靠的。通用的方法是,Bootstrap,算法。,细胞色素,C,的进化,二,.,多基因家族,(,multigene family),的进化,三线粒体,DNA,的进化,动物,mtDNA,中的核苷酸顺序的进化速率要比核基因的编码顺序快得多,(,快,510,倍,),。,(1),可能和,mtDNA,顺序的高突变率有关。,(2),因为其缺乏修复机制,(3)mtDNA,的,DNA,聚合酶存在较多倾向误差。,(4),可能是选择压力在核基因中淘汰了很多突变,,而在线粒体中这种压力松驰了,(5),再者由,mtDNA,编码的蛋白质,tRNAs,和,rRNAs,的改,变对个体适应性的损伤更少一些。,基因组进化,基因组的起源,RNA,起源学说,原始,RNA,的三种作用,:,剪切,复制和编码,合成。,新基因的形成,突变,转座,重组,扩增。,编码序列的改变,人类中仅仅有,1.5%,的是编码序列。,染色体加倍,基因重组,外显子洗牌,滑序复制,转座以及突变等原因使得编码序列的基因发生改变,在选择压力下,基因组不断进化,DNA,的变化是基因组进化的基础,真正中性的突变不受自然选择的影响,通过遗传漂变维持在群体中或被淘汰。,负选择(,negative selection,)淘汰群体中有害的突变。,一些对生物有利的极稀有的突变通过正选择(,positive selection,)增加等位基因频率,并固定在群体中。,功能域或外显子洗牌(,exon suffling,),由不同基因中编码不同结构域的片段彼此连接形成全新编码顺序,称为外显子洗牌。,例如:组织纤维蛋白溶原酶(,TPA,),,作用是促使血液中凝血块的分解。,由组织纤维蛋白溶原酶原激活因子;血纤维蛋白酶原;生长因子等外显子组成,。,冗余基因具有功能但是通常不表达的重复基因。,新的重复基因,向新基因过渡的重复基因,保留部分功能的重复基因,细胞分裂,,DNA,复制,基础代谢等重要的基因少有重复的多余基因。与发育或涉及生物多样性的多功能域基因冗余。,非编码序列的改变,人类中仅仅有,98%,的是非编码序列。没有选择压力,基因组积累了大量的变异。,非编码序列有未知的功能,玉米中转座因子,MITE,序列,在,225kb,中有,33,个重复,在基因两侧。原来认为是没有生物功能的序列,现发现它与复制和调控有关。,自私,DNA:,本身没有功能,进化中处于中性,只是伴随编码,DNA,复制并遗传。,内含子起源:,GT,AG,真核中的内含子,细菌中没有。晚起源与早起源学说,基因岛与基因协同进化,基因组间基因的间隔相差很大,基因在基因组中的分布疏密不一,某些区段形成基因基因集中的基因岛。,啤酒酵母缺失了一部分裂殖酵母和其它酵母特有的基因。这些基因功能相近,相伴丢失。,利用基因组间遗传差异构建分子种系发生树,分子钟(,molecular clock,):分子进化过程中,特定的分子(核苷酸或蛋白质)在所有谱系中的变化速率是恒定的。分子钟是构建分子种系发生树的理论基础。如流感病毒,A,血细胞凝集素(,hemagglutinin,)基因的分子树。,分子种系发生树(,molecular phylogenetic tree,):同源基因或蛋白质之间的关系的图解。如人的血红蛋白基因的种系发生树。,分子种系发生树的构建,利用遗传学数据构建种系发生树的方法很多,如,Maximum Parsimony,法、,Maximum likelihood,法和,UPGMA,法等,均有相关软件。以,UPGMA,(,Unweighted pair group method using arithmetic averages,)方法为例。从所比较的物种对间的最小遗传距离表开始,.,
展开阅读全文