1、DNA测序技术的测序技术的原理、发展及在医学中的应原理、发展及在医学中的应用用DNA测序技术DNA是一种长链聚合物,组成单位为四种脱氧核苷酸(dATP dTTP dCTP dGTP)。这些碱基沿着DNA长链所排列而成的序列,可组成遗传密码,指导蛋白质的合成。测序分析能够为基因DNA序列提供最真实可靠的信息,它可以比较全面地描述基因的复杂性和多样性。DNA测序技术测定未知序列研究基因组多样性确定重组DNA的方向与结构对突变进行定位和鉴定DNA测序的发展历程经典DNA测序技术70年代末,Maxam和Gilbert发明化学法、Sanger发明双脱氧终止法手动测序(同位素标记)80年代中期,出现自动测
2、序仪(应用Sanger双脱氧终止法原理)、荧光代替同位素,采用计算机图象识别90年代中期,测序仪重大改进、集束化的毛细管电泳代替凝胶电泳2001年完成人类基因组框架图,全部采用基于Sanger双脱氧原理的自动化毛细管测序。DNA测序的发展历程DNA测序的发展历程第二代测序技术DNA测序的发展历程454 的特点与主要应用读长较长,400600bp通量较低,400600Mb相对成本较高主要应用:de novo测序DNA测序的发展历程Solexa 的特点与主要应用读长较短,100150bp通量高主要应用:RNA测序、表观遗传学研究DNA测序的发展历程SOLiD 的特点与主要应用读长较短,50-75b
3、p精度高,通量高,主要应用:基因组重测序、SNP检测等DNA测序的发展历程三种第二代测序技术对比DNA测序的发展历程第三代测序技术第三代测序技术第二代测序技术在制备测序文库的时候都需要经过PCR扩增,而这一PCR过程可能引入突变或者改变样品中核酸分子的比例关系。另外,第二代测序的读长普遍偏短,在进行数据拼接时会遇到麻烦。为了克服这样的缺点,业界发展出了以单分子实时测序和纳米孔为标志的第三代测序技术。DNA测序的发展历程第三代测序技术第三代测序技术双脱氧链末端合成终止法1977年,英国人Frederick Sanger 创建了双脱氧链末端合成终止法(chain termination metho
4、d),简称Sanger法、双脱氧法或酶法。他发现如果在DNA复制过程中掺入ddNTP,就会产生一系列末端终止的DNA链,并能通过电泳按长度分辨。不同末端终止DNA链的长度是由掺入到新合成链上随机位置的ddNTP决定的。双脱氧链末端合成终止法双脱氧链末端合成终止法双脱氧链末端合成终止法双脱氧链末端合成终止法双脱氧链末端合成终止法基本原理是利用DNA聚合酶,以待测单链DNA为模板,以dNTP为底物,设立四种相互独立的测序反应体系,在每个反应体系中加入不同的双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP)作为链延伸终止剂。在测序引物引导下,按照碱基
5、配对原则,每个反应体系中合成一系列长短不一的引物延伸链,通过高分辨率的变性聚丙烯酰胺凝胶电泳分离,放射自显影检测后,从凝胶底部到顶部按53方向读出新合成链序列,由此推知待测模板链的序列。双脱氧链末端合成终止法测序序时分成四个反分成四个反应,每个反每个反应除上述成分外分除上述成分外分别加入加入2,3-双脱氧的双脱氧的A,C,G,T核苷三磷酸(称核苷三磷酸(称为ddATP,ddCTP,ddGTP,ddTTP),然后然后进行聚合行聚合反反应。在第一个反。在第一个反应中中,ddATP会随机地代替会随机地代替dATP参加反参加反应,一旦,一旦ddATP加入了新合成的加入了新合成的DNA链,由于其第,由于
6、其第3位的位的-OH变成了成了-H,所以不能所以不能继续延伸延伸,于是第一个反于是第一个反应中所中所产生的生的DNA链都是到都是到A就就终止了。止了。具体操作具体操作双脱氧链末端合成终止法双脱氧链末端合成终止法引物在DNA聚合酶催化的测序反应中需要测序引物。不论是单链DNA模板,还是双链DNA模板,都可通过使用克隆位点两侧的载体序列互补的“通用”引物。通用引物的长度一般为1530个核苷酸。如果是PCR产物直接测序,也可以用一端的PCR引物双脱氧链末端合成终止法测序酶(sequenase)测序酶是一种经过修饰的T7噬菌体DNA聚合酶,消除了35外切酶活性。该酶活性非常稳定,具有很高的链延伸能力和
7、极快的聚合反应速度,是测定较长DNA的首选酶。双脱氧链末端合成终止法测序产物的凝胶电泳及识读能否将测序反应中产生的各种不同长度的DNA片段进行有效分离是序列分析成败的关键。最早采用放射性标记引物,后来采用荧光剂标记。DNA序列分析的自动化激光测序法终止标记系统是用4种不同的荧光染料标记不同的ddNTP。测序反应可以在同一反应管内进行,不必分成4管,反应产物按终止位置的碱基不同其3末端带有不同的荧光基团,被激发后产生不同的荧光,将反应产物加样于凝胶的同一加样孔,电泳分离后,经过DNA测序仪分析系统识别,将检测将信号不断传送到计算机,通过软件分析,自动读出待测DNA的全部核苷酸序列。DNA序列分析
8、的自动化DNA序列分析的自动化毛细管电泳 毛细管电泳(Capillary electrophoresis,CE)是以高压直流电场为驱动力,在毛细管内使荷电粒子按淌度或分配系数进行分离的一种电泳技术。具有分辨率高、重现性好、灵敏度高、快速和易于实现自动化等优点Maxam-Gilbert DNA 化学降解法基本原理:直接或间接特异性识别4 种碱基特定化学试剂可对碱基进行特异性修饰在修饰碱基处(5或3)打断磷酸二酯键将一个DNA 片段的5 端磷酸基作放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基,从而产生一系列长度不一而5 端被标记的DNA 片段,这些以特定碱基结尾的片段群通过凝胶电泳分离,
9、再经放射线自显影,确定各片段末端碱基,从而得出目的DNA 的碱基序列。Maxam-Gilbert DNA 化学降解法操作步骤 先用限制性内切酶把DNA切成10200bp 的测序材料;用碱性磷酸化酶处理该片段,消除5末端上的磷酸;在5OH端标记 32P,用多核苷酸磷酸激酶催化;标记片段变性为单链;用特异的化学试剂作用于不同的碱基进行修饰,然后用哌啶甲酸切断反应碱基的多核苷酸链,紧接着用四组不同的特异反应可以使末端标记的DNA分子切成不同长度的片段,产生一组其末端都是该特异碱基的长度不等的DNA片段;经电泳和放射性自显影后,从4个反应系统统一阅读,待测DNA的全部核苷酸序列就可直接读出Maxam-
10、Gilbert DNA 化学降解法Maxam-Gilbert DNA 化学降解法该反应的关键在于使该反应的关键在于使DNA的的4种核苷酸中,只有种核苷酸中,只有1-2种发生特异性的化学切割反应:种发生特异性的化学切割反应:碱基的特异性修饰;修饰的碱基从核糖环上转移;失去碱基的糖环部位发生DNA链断裂。专门用来对核苷酸作化学修饰,并打断磷酸二酯键的化学试剂有硫酸二甲酯(dimethylsulphate)和肼(hydrazine)、哌啶甲酸等。Maxam-Gilbert DNA 化学降解法 肼,又称联氨 NH2.NH2 在碱性环境中作用于胞嘧啶C和胸腺嘧啶T的C4和C6位置导致糖苷键断裂。如果加入
11、高浓度的盐(1.5M NaCl),肼则主要作用于胞嘧啶C使之断裂。在高温强碱作用(90,1.2M NaOH)下可使腺嘌呤A位点发生剧烈的断裂反应,但对胞嘧啶C的反应较弱胸腺嘧啶胞嘧啶Maxam-Gilbert DNA 化学降解法硫酸二甲酯dimethyl sulphate,DMS,(CH3O)2SO2:一种碱性化学试剂,可以使DNA链上的腺嘌呤A的N2和鸟嘌呤G的N甲基化,但是鸟嘌呤G的N甲基化速度比腺嘌呤A的N2甲基化速度要快4-10倍,并且在中性pH环境中,DMS主要作用于鸟嘌呤G,使之甲基化,导致糖苷键断裂。哌啶甲酸(90,1mol/L)在修饰位点两端使DNA的糖-磷酸链断裂 在4种反应
12、体系中,化学试剂特异地断裂DNA的机制是:G+A反应-(哌啶)甲酸使嘌呤环上氮原子质子化,削弱了嘌呤脱氧核糖核苷酸和腺嘌呤脱氧核糖核苷酸的糖苷键,然后哌啶置换了嘌呤。G反应-硫酸二甲酯(DMS)使GN7甲基化,其后断开了C8-C9间的化学键,哌啶置换了被修饰鸟嘌呤与核糖的结合。T+C反应-肼断开了嘧啶环,产生碱基片段被哌啶置换。C反应-在NaCl存在时,只有C才能与肼发生反应,随后,被修饰的胞嘧啶被哌啶置换。Maxam-Gilbert DNA 化学降解法Maxam-Gilbert DNA 化学降解法5 GATCACTACTG 3 标记标记5*GATCACTACTG 3 G:DMSC:肼:肼(加
13、盐)(加盐)G+A:甲酸甲酸C+T:肼:肼5-*GATCACTACTG 5-*G 5-*GATCACTACTG 5-*GATCACTA 5-*GATCA5-*GA 5-*G 5-*GATCACTAC 5-*GATCACT 5-*GATCAC5-*GATC 5-*GAT 5-*GATCACTACT 5-*GATCACTACTG-5-*GATCACTAC 5-*GATCAC5-*GATC-*GATCACTACTG-Maxam-Gilbert DNA 化学降解法在在化化学学修修饰饰反反应应过过程程中中,通通过过控控制制反反应应温温度度和和反反应应时时间间,只只有有一一小小部部分分碱碱基基被被修修饰饰
14、(而而不不是是全全部部被被修修饰饰),随随后后进进行行的的断断裂裂反反应应也也是是定定量量反反应应。因因此此,DNA链链并并不不是是在在所所有有可可被被修修饰饰的的碱碱基基位位点点断断裂裂,而而是是随随机机断断裂裂。在在4个个反反应应中中,产产生生4套套带带相相同同标标记记末末端端、长长短短不不一一的的寡寡聚聚核核苷苷酸酸片片段段。只只有有带带标标记记末末端端的的片片段段可可被被识识别别,没没有有标标记记末末端端的的片片段段可可以忽略不计。以忽略不计。Maxam-Gilbert DNA 化学降解法Maxam-Gilbert DNA 化学降解法Maxam-Gilbert DNA 化学降解法如果如
15、果G+A中出中出现现1条带就看条带就看G列中是否有同列中是否有同样大小的带,样大小的带,若有即为若有即为G碱基,碱基,无则为无则为A碱基;碱基;同理,同理,C+T中中则检查则检查C列中有列中有无同样大小条无同样大小条带,有即为带,有即为C,无则为无则为T。Maxam-Gilbert DNA 化学降解法 化学法测序采用化学法测序采用32P标记标记DNA进行,条带会较末进行,条带会较末端法更模糊,更宽,由于分辨率不足,从单块凝端法更模糊,更宽,由于分辨率不足,从单块凝胶上能得到可靠序列数量约为胶上能得到可靠序列数量约为200-300bp以内。以内。Maxam-Gilbert DNA 化学降解法优点
16、:不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差;对未经克隆的DNA 片段可以直接测序;化学降解测序法特别适用于测定含有如5-甲基腺嘌呤A 或者G,C 含量较高的DNA 片段,以及短链的寡核苷酸片段的序列。化学降解测序法既可以标记5-末端,也可以标记3-末端。如果从两端分别测定同一条DNA 链的核苷酸序列,相互参照测定结果,可以得到准确的DNA 链序列。Maxam-Gilbert DNA 化学降解法缺点:没有改进,操作繁琐,化学试剂的毒性大,放射性同位素标记效率偏低以致需要较长的放射自显影曝光时间,人工读取数据费时费力.目前,仅在分析特殊DNA链的核苷酸序列和分析DNA和蛋白质相
17、互作用中的DNA一级结构时才使用DNA测序在医学中的应用在人类疾病基因研究的应用在人类疾病基因研究的应用对遗传病的预防和治疗对遗传病的预防和治疗基因诊断基因诊断基因治疗基因治疗DNA测序在医学中的应用1986年由美国学者提出的,目前正在实施的年由美国学者提出的,目前正在实施的人类人类基因组计划基因组计划(human genome project),则是要通,则是要通过对人类基因组全序列的序列分析和人类基因的过对人类基因组全序列的序列分析和人类基因的染色体图谱制定达到了解其结构,认识其功能,染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功即从分子遗传学水平来认
18、识人类自身的结构和功能特征的目的。能特征的目的。人类疾病相关的基因人类疾病相关的基因是人类基因组中结构和功能是人类基因组中结构和功能完整性至关重要的信息。完整性至关重要的信息。DNA测序在医学中的应用HGP对人类疾病基因研究的对人类疾病基因研究的贡献贡献对于单基因病,采用对于单基因病,采用“定位克定位克隆隆”和和“定位候选克隆定位候选克隆”的全新的全新思路,思路,利用利用DNADNA序列分析技术,序列分析技术,导致了亨廷顿舞蹈病、遗传导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发单基因遗传病致病基因的发现现。对于心血管疾病、肿瘤、糖对于心血管疾
19、病、肿瘤、糖尿病、神经精神类疾病(老尿病、神经精神类疾病(老年性痴呆、精神分裂症)、年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾自身免疫性疾病等多基因疾病是目前疾病基因研究的重病是目前疾病基因研究的重点。点。DNA测序在医学中的应用基因诊断治疗基因诊断治疗基因诊断是直接从基因诊断是直接从DNADNA水平检测水平检测人类疾病中的缺陷基因或相关基人类疾病中的缺陷基因或相关基因。基因诊断可用于对遗传性疾因。基因诊断可用于对遗传性疾病的诊断、传染性病原体的检测、病的诊断、传染性病原体的检测、产前检测以及确定亲缘关系等,产前检测以及确定亲缘关系等,如对如对地中海贫血症地中海贫血症、先天愚型、先天愚型
20、、血友病的诊断等。血友病的诊断等。基因治疗是以基因转移基因治疗是以基因转移为基础,将某种遗传物质导入患为基础,将某种遗传物质导入患者体内,使其在体内表达并发挥者体内,使其在体内表达并发挥作用,从而达到治疗疾病目的的作用,从而达到治疗疾病目的的一种方法。一种方法。DNA测序在医学中的应用基因治疗基因治疗将正常外源基因导入动物将正常外源基因导入动物体靶细胞内,用来弥补缺体靶细胞内,用来弥补缺陷基因,以达到治疗遗传陷基因,以达到治疗遗传病的目的。病的目的。相反,将显性疾病基相反,将显性疾病基因导入动物体或敲除某正因导入动物体或敲除某正常基因,使其发生临床症常基因,使其发生临床症状,制造动物模型。状,
21、制造动物模型。脊肌萎缩症的产前基因诊断脊肌萎缩症的产前基因诊断DNA测序在医学中的应用血友病的基因治疗血友病的基因治疗目前,血友病系单基因造成的凝目前,血友病系单基因造成的凝血紊乱,基因水平上的发病机制血紊乱,基因水平上的发病机制已较为清楚,如已较为清楚,如F 基因突变的基因突变的相关数据库已建立较之以前在血相关数据库已建立较之以前在血友病相关凝血因子基因、蛋白结友病相关凝血因子基因、蛋白结构及其功能上的研究。构及其功能上的研究。而且,对血友病的治疗科可通过而且,对血友病的治疗科可通过构造动物模型进行,选用体型较构造动物模型进行,选用体型较大的动物大的动物(如狗如狗)。DNA测序在医学中的应用Thanks