收藏 分销(赏)

分子标记遗传图谱的构建方法---完整.doc

上传人:xrp****65 文档编号:5919008 上传时间:2024-11-23 格式:DOC 页数:16 大小:86.52KB 下载积分:10 金币
下载 相关 举报
分子标记遗传图谱的构建方法---完整.doc_第1页
第1页 / 共16页
分子标记遗传图谱的构建方法---完整.doc_第2页
第2页 / 共16页


点击查看更多>>
资源描述
分子标记遗传图谱的构建 检测出的每个分子标记反映的都是相应染色体座位上的遗传多态性状态。为了有效地分析利用分子标记所提供的遗传信息,人们希望知道不同分子标记在染色体上的相对位置或排列情况,也就是要构建分子标记的遗传连锁图谱。利用DNA标记构建遗传连锁图谱在原理上与传统遗传图谱的构建是一样的。其基本步骤包括:选择适合作图的DNA标记;根据遗传材料之间的DNA多态性,选择用于建立作图群体的亲本组合;建立具有大量DNA标记处于分离状态的分离群体或衍生系;测定作图群体中不同个体或株系的标记基因型;对标记基因型数据进行连锁分析,构建标记连锁图。至今为止,已构建了许多植物的高密度分子标记连锁图。本章侧重介绍利用DNA标记构建分子遗传连锁图谱的原理与方法。 第一节 作图群体的建立 要构建DNA标记连锁图谱,必须建立作图群体。建立作图群体需要考虑的重要因素包括亲本的选配、分离群体类型的选择及群体大小的确定等。 一、亲本的选配 亲本的选择直接影响到构建连锁图谱的难易程度及所建图谱的适用范围。一般应从四个方面对亲本进行选择,首先要考虑亲本间的DNA多态性。亲本之间的DNA多态性与其亲缘关系有着密切关系,这种亲缘关系可用地理的、形态的或同工酶多态性作为选择标准。一般而言,异交作物的多态性高,自交作物的多态性低。例如,玉米的多态性极好,一般自交系间配制的群体就可成为理想的RFLP作图群体;番茄的多态性较差,因而只能选用不同种间的后代构建作图群体;水稻的多态性居中,美国康乃尔大学S.D.Tanksley实验室1988年发表的RFLP连锁图谱是以籼稻和爪哇稻之间的杂交组合为基础构建的(McCouch et al. 1988)。在作物育种实践中,育种家常将野生种的优良性状转育到栽培种中,这种亲源关系较远的杂交转育,DNA多态性非常丰富。第二,选择亲本时应尽量选用纯度高的材料,并进一步通过自交进行纯化。第三,要考虑杂交后代的可育性。亲本间的差异过大,杂种染色体之间的配对和重组会受到抑制,导致连锁座位间的重组率偏低,并导致严重的偏分离现象,降低所建图谱的可信度和适用范围;严重的还会降低杂种后代的结实率,甚至导致不育,影响分离群体的构建。由于各种原因,仅用一对亲本的分离群体建立的遗传图谱往往不能完全满足基因组研究和各种育种目标的要求,应选用几个不同的亲本组合,分别进行连锁作图,以达到相互弥补的目的。第四,选配亲本时还应对亲本及其F1杂种进行细胞学鉴定。若双亲间存在相互易位,或多倍体材料(如小麦)存在单体或部分染色体缺失等问题,那末其后代就不宜用来构建连锁图谱。 二、分离群体类型的选择 根据其遗传稳定性可将分离群体分成两大类:一类称为暂时性分离群体,如F2、F3、F4、BC、三交群体等,这类群体中分离单位是个体,一经自交或近交其遗传组成就会发生变化,无法永久使用。另一类称为永久性分离群体,如RI、DH群体等,这类群体中分离单位是株系,不同株系之间存在基因型的差异,而株系内个体间的基因型是相同且纯合的,是自交不分离的。这类群体可通过自交或近交繁殖后代,而不会改变群体的遗传组成,可以永久使用。 构建DNA连锁图谱可以选用不同类型的分离群体,它们各有其优缺点,因此应结合具体情况选用。 (一)F2代群体 F2群体是常用的作图群体,迄今大多数植物的DNA标记连锁图谱都是用F2群体构建的。不论是自花授粉植物,还是异花授粉植物,建立F2群体都是容易的,这是使用F2群体进行遗传作图的最大优点。但F2群体的一个不足之处是存在杂合基因型。对于显性标记,将无法识别显性纯合基因型和杂合基因型。由于这种基因型信息简并现象的存在,会降低作图的精度。而为了提高精度,减小误差,则必须使用较大的群体,从而会增加DNA标记分析的费用。 F2群体的另一个缺点是不易长期保存,有性繁殖一代后,群体的遗传结构就会发生变化。为了延长F2群体的使用时间,一种方法是对其进行无性繁殖,如进行组织培养扩繁。但这种方法不是所有的植物都适用,且耗资费工。另一种方法是使用F2单株的衍生系(F3株系或F4家系)。将衍生系内多个单株混合提取DNA,则能代表原F2单株的DNA组成。为了保证这种代表性的真实可靠,衍生系中选取的单株必须是随机的,且数量要足够多。这种方法对于那些繁殖系数较大的自花授粉植物(如水稻、小麦等)特别适用。 (二)BC1群体 BC1(回交一代)也是一种常用的作图群体。BC1群体中每一分离的基因座只有两种基因型,它直接反映了F1代配子的分离比例,因而BC1群体的作图效率最高,这是它优于F2群体的地方。BC1群体还有一个用途,就是可以用来检验雌、雄配子在基因间的重组率上是否存在差异。其方法是比较正、反回交群体中基因的重组率是否不同。例如正回交群体为(A×B)×A,反回交群体为A×(A×B),则前者反映的是雌配子中的重组率,后者反映的是雄配子中的重组率。 虽然BC1群体是一种很好的作图群体,但它也与F2群体一样,存在不能长期保存的问题。可以用F2中使用的类似方法来延长BC1群体的使用时间。另外,对于一些人工杂交比较困难的植物,BC1群体也不太合适,因为一是难以建立较大的BC1群体,二是容易出现假杂种,造成作图的误差。 顺便一提,对于一些自交不亲和的材料,可以使用三交群体,即(A×B)×C。由于存在自交不亲和性,这样的三交群体中不存在假杂种现象。 (三)RI群体 RI(重组自交系)群体是杂种后代经过多代自交而产生的一种作图群体,通常从F2代开始,采用单粒传的方法来建立。由于自交的作用是使基因型纯合化,因此,RI群体中每个株系都是纯合的,因而RI群体是一种可以长期使用的永久性分离群体。理论上,建立一个无限大的RI群体,必须自交无穷多代才能达到完全纯合;建立一个有限大小的RI群体则只需自交有限代。然而,即使是建立一个通常使用的包含100~200个株系的RI群体,要达到完全纯合,所需的自交代数也是相当多的。据吴为人等(1997)从理论上推算,对一个拥有10条染色体的植物种,要建立完全纯合的RI作图群体,至少需要自交15代。可见,建立RI群体是非常费时的。在实际研究中,人们往往无法花费那么多时间来建立一个真正的RI群体,所以常常使用自交6~7代的“准”RI群体。从理论上推算,自交6代后,单个基因座的杂合率只有大约3%,已基本接近纯合。然而,由于构建连锁图谱时涉及到大量的DNA标记座位,因而虽然多数标记座位已达到或接近完全纯合,但仍有一些标记座位存在较高的杂合率,有的高达20%以上(李维明等2000)。尽管如此,实践证明,利用这样的“准”RI群体来构建分子标记连锁图谱仍是可行的。 在RI群体中,每一分离座位上只存在两种基因型,且比例为1:1。从这点看,RI群体的遗传结构与BC1相似,也反映了F1配子的分离比例。但值得注意的是,当分析RI群体中两个标记座位之间的连锁关系时,算得的重组率比例并不等于F1配子中的重组率,这是因为在建立RI群体的过程中,两标记座位间每一代都会发生重组,所以RI群体中得到的重组率比例是多代重组频率的积累。不过,从理论上可以推算出,RI群体中的重组比例(R)与F1配子中的重组率(r)之间的关系为:R=2r/(1+2r)。因此,用RI群体仍然可以估计重组率,亦即RI群体仍然可以用于遗传作图。 RI群体的优点是可以长期使用,可以进行重复试验。因此它除了可用于构建分子标记连锁图外,特别适合于数量性状基因座(QTL)的定位研究。但是,考虑到构建RI群体要花费很长时间,如果仅是为了构建分子标记连锁图的话,选用RI群体是不明智的。另外,异花授粉植物由于存在自交衰退和不结实现象,建立RI群体也比较困难。 (四)DH群体 高等植物的单倍体(Haploid)是含有配子染色体数的个体。单倍体经过染色体加倍形成的二倍体称为加倍单倍体或双单倍体(DH)。DH群体产生的途径很多,亦因物种不同而异,最常见的方法是通过花药培养,即取F1植株的花药进行离体培养,诱导产生单倍体植株,然后对染色体进行加倍产生DH植株。DH植株是纯合的,自交后即产生纯系,因此DH群体可以稳定繁殖,长期使用,是一种永久性群体。DH群体的遗传结构直接反映了F1配子中基因的分离和重组,因此DH群体与BC1群体一样,作图效率是最高的。另外,由于DH群体跟RI群体一样,可以反复使用,重复试验,因此也特别适合于QTL定位的研究。 DH群体直接从F1花粉经培养产生,因而建立DH群体所需时间不多。但是,产生DH植株有赖于花培技术。有些植物的花药培养非常困难,就无法通过花培来建立DH群体。另外,植物的花培能力跟基因型关系较大,因而花培过程会对不同基因型的花粉产生选择效应,从而破坏DH群体的遗传结构,造成较严重的偏分离现象,这会影响遗传作图的准确性。因此,如果是以构建分子标记连锁图为主要目的的话,DH群体不是一种理想的作图群体。 三、群体大小的确定 遗传图谱的分辨率和精度,很大程度上取决于群体大小。群体越大,则作图精度越高。但群体太大,不仅增大实验工作量,而且增加费用。因此确定合适的群体大小是十分必要的。合适群体大小的确定与作图的内容有关。大量的作图实践表明,构建DNA标记连锁图谱所需的群体远比构建形态性状特别是数量性状的遗传图谱要小,大部分已发表的分子标记连锁图谱所用的分离群体一般都不足100个单株或家系。而如果用这样大小的群体去定位那些控制农艺性状尤其是数量性状的基因,就会产生很大的试验误差。从作图效率考虑,作图群体所需样本容量的大小取决于以下两个方面:一是从随机分离结果可以辨别的最大图距,二是两个标记间可以检测到重组的最小图距。因此,作图群体的大小可根据研究的目标来确定。作图群体越大,则可以分辨的最小图距就越小,而可以确定的最大图距也越大。如果建图的目的是用于基因组的序列分析或基因分离等工作,则需用较大的群体,以保证所建连锁图谱的精确性。在实际工作中,构建分子标记骨架连锁图可基于大群体中的一个随机小群体(如150个单株或家系),当需要精细地研究某个连锁区域时,再有针对性地在骨架连锁图的基础上扩大群体。这种大小群体相结合的方法,既可达到研究的目的,又可减轻工作量。 作图群体大小还取决于所用群体的类型。如常用的F2和BC1两种群体,前者所需的群体就必须大些。这是因为,F2群体中存在更多种类的基因型,而为了保证每种基因型都有可能出现,就必须有较大的群体。一般而言,F2群体的大小必须比BC1群体大约大一倍,才能达到与BC1相当的作图精度。所以说,BC1的作图效率比F2高得多。在分子标记连锁图的构建中,DH群体的作图效率在统计上与BC1相当,而RI群体则稍差些。总的说来,在分子标记连锁图的构建方面,为了达到彼此相当的作图精度,所需的群体大小的顺序为F2>RI>BC1和DH。 第二节 图谱构建的理论基础 一、染色体遗传理论 1903年W. S. Sutton和T. Boveri分别提出了遗传因子位于染色体上的理论,他们将染色体看作是孟德尔基因的物理载体。该理论亦称为Sutton-Boveri染色体遗传理论,其基本要点如下:(1)体细胞核内的染色体成对存在,其中一条来自雌亲,一条来自雄亲,成对染色体的两个成员是同源的。(2)每条染色体在个体的生命周期中均能保持其结构上的恒定性和遗传上的连续性,因而在个体的发育过程中起着一定的作用。(3)在减数分裂中,同源染色体的两个成员相互配对,随后又发生分离,走向细胞的两极,从而形成两个单倍体性细胞。 二、基因重组和连锁理论 连锁图谱构建的理论基础是染色体的交换与重组。在细胞减数分裂时,非同源染色体上的基因相互独立、自由组合,同源染色体上的基因产生交换与重组,交换的频率随基因间距离的增加而增大。位于同一染色体上的基因在遗传过程中一般倾向于维系在一起,而表现为基因连锁。它们之间的重组是通过一对同源染色体的两个非姊妹染色单体之间的交换来实现的。 假设某一对同源染色体上存在A-a,B-b两对连锁基因,现有两个亲本P1 和P2,它们的基因型分别为AABB和aabb,两亲本杂交产生AaBb双杂合体。F1在减数分裂过程中应产生4种类型的配子,其中两种为亲型配子AB和ab,两种为重组型配子Ab和aB。由于A-a和B-b位于同一染色体上,要产生重组型配子必须在这两个基因的连锁区段上发生交换。重组型配子所占的比例取决于减数分裂细胞中发生交换的频率。交换频率越高,则重组型配子的比例越大。重组型配子最大可能的比例是50%,这时在所有减数分裂的细胞中,在两对基因的连锁区段上都发生交换,相当于这两对基因间无连锁,表现为独立遗传。 重组型配子占总配子的比例称为重组率,用r表示。重组率的高低取决于交换的频率,而两对基因之间的交换频率取决于它们之间的直线距离。重组率的值变化于完全连锁时的0%到完全独立时的50%之间。因此重组率可用来表示基因间的遗传图距,图距单位用厘摩(centi-Morgan,cM)表示,1cM的大小大致符合1%的重组率。 三、图谱制作的统计学原理 (一)两点测验 如果两个基因座位于同一染色体上且相距较近,则在分离后代中通常表现为连锁遗传。对两个基因座之间的连锁关系进行检测,称为两点测验。在进行连锁测验之前,必须了解各基因座位的等位基因分离是否符合孟德尔分离比例,这是连锁检验的前提。在共显性条件下,F2群体中一个座位上的基因型分离比例为1:2:1,而BC1和DH群体中分离比例均为1:1;在显性条件下,F2群体中分离比例为3:1,而BC1和DH群体中分离比例仍为1:1。检验DNA标记的分离是否偏离孟德尔比例,一般采用c2检验。 只有当待检验的两个基因座各自的分离比例正常时,才可进行这两个座位的连锁分析。在DNA标记连锁图谱的制作过程中,常常会遇到大量DNA标记偏离孟德尔分离比例的异常分离现象,这种异常分离在远缘杂交组合的分离群体及DH和RI群体中尤为明显。目前在水稻中已发现了十余个与异常分离有关的基因座位,这些基因座位可能影响配子生活力和竞争力,导致配子选择,从而产生异常分离。 异常分离会使连锁的检验受到影响,一些本来不存在连锁的标记由于各自的异常分离,可能误导得出连锁的结论,而另一些本来连锁着的标记也有可能由于异常分离而无法检测到连锁。发生严重异常分离的标记一般不应用于连锁作图。将分离比的检验与连锁检验相结合,是实际分析过程中解决异常分离的常用方法。 两个连锁座位不同基因型出现的频率是估算重组值的基础。在一般的遗传学教材中,重组值的估计是根据分离群体中重组型个体占总个体的比例来估计的。这种估计方法无法得到估计值的标准误,因而无法对估值进行显著性检验和置信区间估计。采用最大似然法进行重组率的估计可解决这一问题。最大似然法以满足其估计值在观察结果中出现的概率最大为条件。 在人类遗传学研究中,由于通常不知道父母的基因型或父母中标记基因的连锁相是相斥还是相引,因而无法简单地通过计算重组体出现的频率来进行连锁分析,而必须通过适当的统计模型来估算重组率,并采用似然比检验的方法来推断连锁是否存在,即比较假设两座位间存在连锁(r < 0.5)的概率与假设没有连锁(r = 0.5)的概率。这两种概率之比可以用似然比统计量来表示,即L(r)/L(0.5),其中L()为似然函数。为了计算方便,常将L(r)/L(0.5)取以10为底的对数,称为LOD值。为了确定两对基因之间存在连锁,一般要求似然比大于1000:1,即LOD>3;而要否定连锁的存在,则要求似然比小于100:1,即LOD<2。 在其它生物遗传图谱的构建中,似然比的概念也用来反映重组率估值的可靠性程度或作为连锁是否真实存在的一种判断尺度。 (二)多点测验 两点测验是最简单,也是最常用的连锁分析方法。然而,在构建分子标记连锁图中,每条染色体都涉及到许多标记座位。遗传作图的目的就是要确定这些标记座位在染色体上的正确排列顺序及彼此间的遗传图距。所以,这里涉及到一个同时分析多个基因座之间连锁关系的问题。这个问题看似简单,其实挺复杂,因为对于m个连锁座位,就有m!/2种可能的排列顺序。例如,若m = 10,则共有1,814,400种可能。要从这么多种可能中挑选出正确的顺序,确实没那么容易。这项工作用两点测验方法是难以完成的,因为它每次只能分析两个座位间的连锁关系。由于两点测验估得的重组率存在误差,因此,根据比较不同座位之间重组率大小来确定座位的排列顺序是不可靠的,很可能存在错误。 为了解决这个问题,就必须同时对多个座位进行联合分析,利用多个座位间的共分离信息来确定它们的排列顺序,也就是进行多点测验。在事先未知各基因座位于哪条染色体的情况下,可先进行两点测验,根据两点测验的结果,将那些基因座分成不同的连锁群,然后再对各连锁群(染色体)上的座位进行多点连锁分析。 与两点测验一样,多点测验通常也采用似然比检验法。先对各种可能的基因排列顺序进行最大似然估计,然后通过似然比检验确定出可能性最大的顺序。在每次多点测验中,不能包含太多的座位,否则可能的排列数会非常大,即使使用高速的计算机,也要花费很长的时间。在一条染色体上,经过多次多点测验,就能确定出最佳的基因排列顺序,并估计出相邻基因间的遗传图距,从而构建出相应的连锁图。 对于在两点测验中没能归类到某个连锁群(染色体)的基因座,可在各连锁群的连锁图初步建成之后,再尝试定位到某个连锁群上。但在构建分子标记连锁图的实际研究中,往往总有一些标记无法定位到染色体上。造成这种现象的原因,主要可能是在测定标记基因型时存在错误。 (三)交换干扰与作图函数 随着间距的增加,两个基因座之间便可能在两处同时发生遗传物质的交换,即双交换。在染色体某区段上发生的双交换,其实际频率往往少于由单交换概率相乘所估得的理论值。这是因为一个位置上所发生的交换会减少其周围另一个单交换的发生,这种现象称为交叉干扰。干扰的程度可用符合系数C表示,符合系数C为实际双交换值与理论双交换值的比值。理论双交换值是指两个相邻的单交换同时独立发生的概率。 C= = 实际双交换值 实际双交换值 理论双交换值 r1r2 其中r1和r2分别为两个相邻染色体区段发生单交换的概率。符合系数C的值变动于0~1之间。当C=0时,表示完全干扰,没有双交换发生;当C=1时,表示没有干扰,两单交换独立发生。一般而言,两单交换的位置相距越远,则彼此干扰的程度就越低,符合系数就越大。 要计算两个相距较远的基因座之间的图距时,如果中间没有其它基因座可利用,则两个基因座之间实际发生的双交换就不能被鉴别出来,因此,采用一些数学方法进行矫正是必要的,否则,从重组率估计出的图距就会比真实图距小。这种矫正可通过作图函数来实现。 在C=1的假定下,图距x与重组率r之间的关系服从Haldane作图函数: x=-(1/2)ln(1-2r) 其中x以M为单位。这里M读作Morgan(摩尔根),它是用著名遗传学家摩尔根的姓命名的,并取第一个字母表示。1M=100cM(厘摩),1cM为一个遗传单位,即1%的重组率。根据Haldane作图函数,20%的重组率相当于图距为-(1/2)ln(1-2×0.20)= 0.255M,即25.5cM。 Haldane作图函数的不合理之处在于假定了完全没有交叉干扰。为了将交叉干扰的因素考虑进去,一种比较合理的假设是,双交换符合系数与重组率之间存在线性关系,即C=2r。该式表示,C值随r的增加而增加,干扰相应减弱。当r=0.5(即没有连锁)时,C=1(即没有干扰)。根据这一假设推导出了如下作图函数(Kosambi作图函数): x=(1/4)ln 1+2r 1–2r 根据上式可以算出,当r=0.2时,x=21.2cM。可见Kosambi作图函数算出的图距比Haldane作图函数的小。由于Kosambi作图函数比Haldane作图函数更合理,因此它在遗传学研究中得到了更广泛的应用。 第三节 DNA标记分离数据的数学处理 一、分离数据的收集与数字化 从分离群体中收集分子标记的分离数据,获得不同个体的DNA多态性信息,是进行遗传连锁分析的第一步。通常各种DNA标记基因型的表现形式是电泳带型,将电泳带型数字化是DNA标记分离数据进行数学处理的关键。 下面以RFLP为例来说明将DNA标记带型数字化的方法。假设某个RFLP座位在两个亲本(P1,P2)中各显示一条带,由于RFLP是共显性的,则F1个体中将表现出两条带,而F2群体中不同个体的带型有三种,即P1型、P2型和F1(杂合体)型。可以根据习惯或研究人员的喜好,任意选择一组数字或符号,来记录F2个体的带型。例如,将P1带型记为1,P2带型记为3,F1带型记为2。如果带型模糊不清或由于其它原因使数据缺失,则可记为0。假设全部试验共有120个F2单株,检测了100个RFLP标记,这样可得到一个由100(行)×120(列)的、由简单数字组成的RFLP数据矩阵。 进行DNA标记带型数字化的基本原则是,必须区分所有可能的类型和情况,并赋与相应的数字或符号。比如在上例中,总共有4种类型,即P1型、F1型、P2型和缺失数据,故可用4个数字1、2、3和0分别表示之。如果存在显性标记,则F2中还会出现两种情况。一种是P1对P2显性,于是P1型和F1型无法区分,这时应将P1型和F1型作为一种类型,记为4。另一种情况正好相反,P2对P1显性,无法区分P2型和F1型,故应将它们合为一种类型,记为5。 对于BC1、DH和RI群体,每个分离的基因座都只有两种基因型,不论是共显性标记还是显性标记,两种基因型都可以识别,加上缺失数据的情况,总共只有3种类型。因而用3个数字就可以将标记全部带型数字化。 在分析质量性状基因与遗传标记之间的连锁关系时,也必须将有关的表型数字化,其方法与标记带型的数字化相似。例如,假设在DH群体中,有一个主基因控制株高,那么就可以将株系按植株的高度分为高秆和矮秆两大类,然后根据亲本的表现分别给高秆和矮秆株系赋值,如1和2。将质量性状经过这样的数字化处理,就可以与DNA标记数据放在一起进行连锁分析。 DNA标记数据的收集和处理应注意以下问题:(1)应避免利用没有把握的数据。由于分子多态性分析涉及许多实验步骤,很难避免出现错误,经常会遇到所得试验结果(如X-光片)不清楚等问题。如果硬性地利用这样没有把握的数据,不仅会严重影响该标记自身的定位,而且还会影响到其它标记的定位。因此,应删除没有把握的数据,宁可将其作为缺失数据处理,或重做试验。(2)应注意亲本基因型,对亲本基因型的赋值(如P1型为1,P2型为2),在所有的标记座位上必须统一,千万别混淆。如果已知某两个座位是连锁的,而所得结果表明二者是独立分配的,这就有可能是把亲本类型弄错引起的。(3)当两亲本出现多条带的差异时,应通过共分离分析鉴别这些带是属于同一座位还是分别属于不同座位。如属于不同座位,应逐带记录分离数据。 二、遗传图距与物理距离对应关系的估计 不同生物的1cM图距所对应的实际物理距离(碱基对数量)存在很大差异。一般而言,生物越低等或越简单,1cM图距平均对应的碱基对数量就越少(表3.1)。表3.1中给出的各种生物中遗传图距与物理距离之间的对应关系只是一个大约的平均值,实际上它变化很大。在一条染色体上,由于不同区域上发生交换的频率存在差异,因而遗传图距与物理距离之间的对应关系可以有很大的变化。例如,在着丝粒附近,染色体交换受到抑制,因而所估计的遗传图距小于平均对应的物理距离。在同一种生物中,两个特定基因座之间的遗传图距会因遗传背景的不同而改变,甚至有时由同一对亲本所产生的遗传背景相同的不同群体间也存在很大差异。 表3.1 不同生物中单位图距所相当的平均物理距离 物 种 基因组大小(kb) 遗传图距(cM) kb / cM 嗜菌体T4 1.6×102 800 0.2 大肠杆菌 4.2×103 1,750 2.4 酵 母 2.0×104 4,200 4.8 真 菌 2.7×104 1,000 27.0 线 虫 8.0×104 320 250.0 果 蝇 1.4×105 280 500.0 水 稻 4.5×105 1,500 300.0 小 鼠 3.0×106 1,700 1,800.0 人 类 3.3×106 3,300 1,000.0 玉 米 2.5×106 2,500 1,000.0 三、构建DNA标记图谱的计算机软件 遗传图谱的构建需要对大量标记之间的连锁关系进行统计分析。随着标记数目的增加,计算工作量常常呈指数形式增加,这是手工无法完成的。因此,必须借助计算机进行分析和处理。许多学者为构建遗传图谱设计了专用程序包,通过Internet网址http://linkage.rockefeller.edu/soft/list.html可以获得各种专用程序的相关信息,如软件的名称及简要介绍,源程序编码语言、支持的操作系统、执行程序的名称、参考文献以及获取软件的网址等。应用于植物遗传连锁分析和遗传图谱构建的常用软件有LINKAGE、MAPMAKER/EXP等。LINKAGE软件可通过ftp:// linkage.rockefeller.edu/software/linkage 获得,该软件是利用最大似然法估计两座位或多座位间的重组率和LOD值;MAPMAKER/EXP可通过ftp:// ftp-genome.wi.mit.edu/distri- bution/software/mapmaker3获得,该软件可以应用于各种类型的实验群体进行遗传作图,是目前应用最为广泛的作图软件之一。 第四节 DNA标记连锁图谱的完善 一、DNA标记连锁群的染色体定位 把分子标记所建立的连锁群与经典遗传图谱联系起来,并将其归属到相应的染色体上,是构建了一个比较饱和的分子图谱之后十分重要的工作。通常根据分子标记与已知染色体位置的形态标记的连锁关系来确定分子标记连锁群属于哪条染色体。还可以利用非整倍体或染色体结构变异材料,如水稻中利用三体、玉米中利用A/B易位系、小麦中利用缺体/四体染色体代换系等,将分子标记连锁群归属到相应的染色体上。 以水稻为例,目前已获得全套12条染色体的初级三体(2n+1)。在水稻某种三体中,由于三体染色体有一式3份,其DNA含量为其它11条染色体的1.5倍。在DNA定量相当准确的条件下,用已知能检测某一连锁群的探针分别与12种三体的总DNA杂交。根据剂量效应,杂交强弱与同源序列的含量成正比,杂交后对应三体的DNA滤膜放射自显影显带强度将明显高于其它11种,由此可以判定该标记所对应的序列就在该三体染色体上。 随着技术的进步,原位分子杂交的灵敏度已可以揭示单拷贝序列的杂交位点,因此采用原位分子杂交可以容易地将连锁群的分子标记定位到染色体上。 要得到一个完整的遗传图谱,必须知道染色体上的标记与着丝粒之间的距离。一个完整的染色体具有以下几个主要部分:着丝粒、缢痕、随体及端粒,这些基本结构在生物染色体的运动与复制等方面起着重要的作用,其结构也是遗传图谱制作中不可忽视的重要部分。 由于着丝粒并不是一个基因,不能从表型测知,因此采用常规的两点、三点乃至多点分析方法是无法确定标记与着丝粒之间的关系的。在经典遗传图谱的构建中,一般采用近端着丝粒染色体来对基因与着丝之间的距离进行定位。近端着丝粒染色体是正常染色体在着丝粒附近断裂形成的异常染色体。目前已获得小麦全部42条染色体的近端着丝粒染色体。利用染色体易位材料也可以判断着丝粒在染色体上的位置。一般易位点和着丝粒所在部分的交换被抑制,因而推算位于着丝粒两旁的易位点与标记基因间的重组率时一般都偏小。利用这个现象可以推算连锁图上着丝粒的位置。在细胞学上,利用已知易位点的易位系统进行基因分析也可知道着丝粒的位置。早在1945年,在玉米中就利用易位分析的结果推测了全部染色体的着丝粒位置。 染色体上的端粒是指染色体的自然末端。在遗传图谱的构建中,端粒位置的确定就意味着为染色体的全长设定界标。传统的凝胶电泳方法由于分辨能力有限,大多数情况下无法将具有多态性的端粒片段区分开来。一般要借助具有高分辨率的脉冲场凝胶电泳(PFGE)才能将有差异的端粒片段分离开来。利用PFGE与切割位点稀少的限制性酶相结合,Wu和Tanksley(1993)研究了水稻端粒结构的特征,采用来自拟南芥的端粒探针,将三个水稻的端粒DNA电泳条带分别定位在第8、9、11染色体上,并证实了多态性的端粒片段不仅在遗传上而且在物理上与遗传图谱上最远端的RFLP标记相连锁。 目前,在日本水稻基因组研究计划所构建的包含2275个标记的水稻分子连锁图中,除第9染色体之外,其余11条染色体的着丝粒(区)都已定位(Harushima et al. 1998)。另外,该图中的第5染色体短臂、第11染色体两臂以及第12染色体短臂的端粒也已定位。 二、饱和DNA标记连锁图的制作 遗传图谱饱和度是指单位长度染色体上已定位的标记数或标记在染色体上的密度。一个基本的染色体连锁框架图大概要求在染色体上的标记平均间隔不大于20cM。如果构建连锁图谱的目的是为了进行主基因的定位,其平均间隔要求在10~20cM或更小。用于QTL定位的连锁图,其标记的平均间隔要求在10cM以下。如果构建的连锁图谱是为了进行基因克隆,则要求目标区域标记的平均间隔在1cM以下。 不同生物基因组大小有极大差异,因此满足上述要求所需的标记数是不同的。以人类和水稻为例,它们的基因组全长分别为3.3×106kb和4.5×105kb,如果构建一个平均图距为0.5cM的分子图谱,则所要定位的标记数就要分别达到6600和3000个。几种生物不同图谱饱和度下所需定位的标记数如表3.2所示。 表3.2 遗传图谱达到特定饱和度所需的标记数 生物 人类 水稻 玉米 拟南芥 番茄 基因组大小 (kb) (cM) kb/cM 3.3×106 3300 1000 4.5×105 1500 300 2.5×106 2500 1000 7.0×104 500 140 7.1×105 1500 473 图 谱 饱 和 度 20cM 10cM 5cM 1cM 0.5cM 165 330 660 3300 6600 75 150 300 1500 3000 125 250 500 2500 5000 25 50 100 500 1000 75 150 300 1500 3000 Tanksley等(1988)以假设拥有12条染色体,每条长100cM,全长1200cM的生物为例,研究了所需标记数与图谱饱和度之间的关系,发现影响所需标记数的主要因素有两个。一个是标记间的平均距离,即图谱总长度除以定位的标记数,它反映了标记图谱的平均密度。对于染色体全长1200cM的生物,如果定位了120个标记,则标记间的平均距离为10cM。另一个因素是标记间的最大距离。标记在基因组上的分布是不均匀的。即使在一张平均密度很高的图谱上,仍然可能存在较大的间隙区。例如,据理论推算,如果用于作图的标记是随机选择的,则当标记平均距离为1cM时,仍有可能存在10cM的间距。而若要将最大可能间距从10cM减小到5cM,则需要另外增加1000个标记。因此,通过提高图谱平均密度的方法来缩小最大标记间距是很困难的。在实际研究中,为了填补间隙,应有针对性地在间隙区上寻找标记,或寻找该间隙所在区域上有差异的亲本构建作图群体。 没有一种标记在基因组中分布是完全随机的。如着丝粒区通常以重复序列为主,因而以单拷贝克隆为探针的RFLP标记就不可能不覆盖这些染色体区域。从这一点考虑,利用特性上互补的不同DNA标记进行遗传作图,将有助于提高遗传图谱的饱和度。 三、DNA标记连锁图与经典遗传连锁图的整合 从1987年报道玉米和番茄的RFLP遗传图谱以来,具有重要经济价值的栽培植物几乎都已构建了以RFLP为主的DNA标记遗传图谱,其中水稻分子图谱上所定位的RFLP标记数已超过2000个(Harushima et al. 1998)。为了充分利用现有的分子和遗传的信息,必须将分子遗传图谱与经典遗传图谱结合起来,成为一张综合的遗传图谱。将两类遗传标记综合到一张遗传图谱中去,不仅是重要经济性状准确定位的需要,也是以图位克隆方法分离目的基因的需要。但是,由于两类图谱的构建是相互独立的,使用的作图群体是不同的,且它们之间缺乏共有的遗传标记,因而整合起来并不容易。另外,经典遗传图谱本身就是一张依据许多由不同研究者利用不同作图群体在不同条件下完成的实验结果而绘制成的综合图谱,其中有的标记基因间的相对位置不一定十分精确,因此,在与分子图谱整合时,不能简单地根据标记间的相对图距进行推论。 鉴于上述原因,分子图谱与经典图谱的整合只能通过将传统的遗传标记基因一个一个地定位到分子图谱中去的策略来进行。为此,可以选择各种传统的遗传标记材料来建立作图群体,并用适当的方法快速地找到与传统的遗传标记紧密连锁的分子标记(参见第四章),再根据分子标记在分子图谱上的位置来确定传统遗传标记的位置。在栽培植物中,水稻的经典连锁图谱和分子连锁图谱的整合工作进展较快,这主要受益于水稻在经典连锁图谱上的长期累积性工作,目前至少已将47个形态标记和11个同工酶标记定位到了分子连锁图上(Causse等1994)。 第五节 比较作图 比较作图(Comparative Mapping)就是利用一种物种的DNA标记对另一物种进行遗传或物理作图。比较作图的分子基础就是物种间DNA序列尤其是编码序列的保守性。通过比较作图可揭示不同物种基因组或基因组区域同线性或共线性的存在,从而了解不同物种基因组结构的相似性及基因组进化的历程。所谓同线性是指定位在一个物种的染色体上的两个或多个标记又被定位于另一物种的同源染色体区域上,但这些标记间的相对排列顺序可变化;而共线性则指定位在同源染色体区域上的标记,其标记间的相对排列顺序是保守的。 比较作图始于人-鼠间的基因组同源性比较。至今许多植物之间也进行了比较作图研究,如番茄、马铃薯和辣椒(Tanksley et al. 1988;1992);水稻、小麦和玉米(Ahn et al. 1993;1994);小麦、大麦和黑麦(Devos et al. 1993);高粱和玉米(Pereira et al. 1994);拟南芥和芸苔属(Kowalski et al. 1994)以及大麦和水稻(Maroof et al. 1996)等。Moor等(1995)对水稻、小麦、玉米、谷子、甘蔗及高粱等6种主要禾本科物种的比较作图研究表明,这些禾本科植物基因组的保守性可归结到水稻基因组的19个连锁区段上,由这19个区段可实现对所研究的全部禾谷类作物进行染色体的重建,并可构成一个禾谷类作物祖先种的染色体骨架。可见,比较作图研究已使得传统的植物遗传学突破了物种的框架限制,发展成了新的统一遗传学。 通过比较作图的研究可显著增加各种物种中可供利用的遗传标记的数量,这对遗传研究较为滞后的物种来说显得十分重要。另外,利用比较作图法还可能根据已定位在某个物种中的新基因,在其它近缘物种的染色体同源区域定位相同的基因,这将大大提高基因定位的效率。随着某些物种的基因组全序列的测序完成,比较作图研究也将随之进入一个新的时代,即可直接在核苷酸序列水平上对不同物种的基因组进行比较分析,从而对生物的遗传本质达到更深刻的了解。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 应用文书 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服