1、二代二代二代二代测测序技序技序技序技术术在医学在医学在医学在医学领领域中的域中的域中的域中的应应用用用用魏冬魏冬魏冬魏冬凯凯 概要概要二代测序技术简介常见医学领域NGS方案石蜡包埋样本解决方案CTC和ctDNA二代二代测序技序技术简介介人人类基因基因组Human GenomeHuman Genome30亿对碱基来自母亲30亿对碱基来自父亲线粒体基因组来自母亲与人类共生的微生物基因组DNADNA的构成的构成末端终止法测序ABI 3700(ABI 3730)人人类基因基因组计划划(HGP)(HGP)人类基因组计划(human genome project,HGP)是由美国科学家于1985年率先提出
2、,于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。按照这个计划的设想,最终要把人体内约4万个基因的密码全部解开,同时绘制出人类基因的谱图。换句话说,就是要揭开组成人体4万个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。被誉为生命科学的“登月计划”。Celera GenomicsCelera GenomicsCraig Venter成立第一个使用全基因组鸟枪法测序使用330台ABI 3700,购买当时世界排名第三的服务器进行运算,花费3个月时间对Venter的基因组进行测序,得到20GB
3、数据。VentorVentor基因基因组测序序基于分子克隆,必须将DNA片段克隆至大肠杆菌中,否则无法测序。每次末端终止反应体系10ul,其中含有1013个DNA分子,但每次只能测其中1条。预计花费2亿美金,最终花费30亿美金!怎样才能降低试剂消耗?降低消耗的降低消耗的办法法1.将分子克隆替换成聚合酶链式反应(PCR),先给DNA片段加上尾巴。桥式PCR2.降低反应体积把测序反应装到小的空间里去。10ul的试剂做更多的DNA测序反应。降低消耗的降低消耗的办法法1.将分子克隆替换成聚合酶链式反应(PCR),先给DNA片段加上尾巴。桥式PCR2.降低反应体积把测序反应装到小的空间里去。10ul的试
4、剂做更多的DNA测序反应。桥式式PCRPCR二代二代测序(序(NGSNGS)边合成合成边测序(序(SBSSBS)FlowcellSBSSBS技技术特点特点读长最初的时候只有31bp,现已能达到600bp。运行时间长,荧光信号会逐渐减弱。每次只能结合1个碱基,发出一种荧光信号。Hiseq 2500可同时运行2张8通道flowcell有高通量模式和快速模式2种模式。单次运行数据量高达500GB。快速模式最短运行时间17小时。常常见医学医学领域域NGSNGS方案方案二代二代测序序应用医用医疗的可行性的可行性NGSNGS的的优势相比于一代测序,NGS更加省时低成本,速度快,覆盖度深,准确度高;高通量测
5、序人类基因组有助于发现与疾病相关的未知基因;对于疾病引起的基因突变,高通量测序可以为患者医师提供更为准确的诊断依据;需求样本类型广泛,样本量需求少。常常见医学医学领域域NGSNGS方案方案全基因组重测序(WGRS)寻找个体突变,InDel,CNV,SV等等,需求数据量大,单个样本需求90G数据。全外显子组测序(WES)捕获基因组中的全外显子进行测序,测序数据量较WGRS少很多,并能获得高测序深度(50X-150X)常常见医学医学领域域NGSNGS方案方案靶向区域测序(Target Sequencing)捕获富集感兴趣的靶向区域进行测序,技术流程与全外显子捕获相似,测序需求量较WES少,能获得更
6、高测序深度(最高500X)转录组测序(RNA-Seq)研究转录水平上的测序,包括mRNA,lncRNA,microRNA等。全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。全基因全基因组重重测序序(WGRS/DNA-(WGRS/DNA-Seq)Seq)SNP(个体间差异)CNV(
7、大片段基因拷贝数变异)InDelSV(结构变异)全基因全基因组重重测序的序的应用用SNP(SNV)示例示例为何研究何研究SNPSNP?SNP目前已被公认为疾病发生的基因分子标记。SNP被认为是导致药物差异化的主要因素之一,因此可以根据SNP的变化来进行个性化用药。SNP分布广泛,且较为稳定。某些SNP会直接影响功能基因表达。大多数的大多数的SNPSNP都是无用的都是无用的大多数的SNP属于沉默突变。非编码区的错义突变也不会导致蛋白质发生改变。但但也也有有例例外外诊断断实例:例:Dr.James Gern和Joseph DeRisi合作,用MiSeqDx从一个病危的十几岁的男孩的脑脊液中抽提出核
8、酸样本,测了8百万条核酸序列,从中检出了475条钩端螺旋体的序列,从而判定这个男孩的病是因为钩端螺旋体感染。Dr.James Gern依据上述的判断,给男孩青霉素治疗,治好了这个男孩的病。脑脊液是较难取得的体液,只能是采集很少的量,这就限制了所能得到的核酸总量。钩端螺旋体,在病原体的常见程度排名中是较靠后的种类。在本案例中,如果用PCR方法,挨个排查病原体,可能还没排到钩端螺旋体,核酸就不够了。但高通量测序克服了核酸量不够的问题。在本案例中,钩端螺旋体DNA只占总DNA的万分之0.6,含量极微,但经过高通量测序,得到了475条钩端螺旋体的DNA,这让钩端螺旋体无处循形。2009年H1N1病毒爆
9、发感染时,有一名病人死于呼吸系统引起的多器官衰竭,然而并不知道具体的死因。科学家把病人的肺部穿刺组织的DNA拿来做高通量测序。最终在950万条序列中,含有0.85%的序列来自于H1N1病毒基因组,从而帮助科学家发现了该病人的真正死因。在这样高人类基因组干扰的背景下,目前其他技术都难以快速发现致病病毒序列、以及分子分型。Kuroda,M.,Katano,H.,Nakajima,N.,Tobiume,M.,Ainai,A.,Sekizuka,T.,Sata,T.(2010).PloS One,5(4),e10256.doi:10.1371/journal.pone.0010256Nimblegen
10、 (Roche)SureSelect(Agilent)RNA OligoTrusight (Illumina)全外全外显子子测序(序(WESWES)癌症相关(人)遗传性疾病(人)其它非传染性疾病(人)主要用于寻找罕见突变,遗传性突变及癌症相关的体细胞突变可以做SNP,InDel分析,但由于捕获区域较短,一般不用于CNV,SV分析。WES应用领域成本低(一般50-150X,也仅需要8-15G数据)降低分析背景,容易发现稀有突变。大约能测到50-80bp的片段缺失,由于外显子捕获芯片片段较短,很难判断是由捕获脱靶导致还是由缺失导致。同样因为捕获芯片片段较短,一般不做CNV,SV分析。WES特点WE
11、S方案流程包括mRNA-Seq,lncRNA-Seq,sRNA-Seq等。可以高通量分析转录本信息,发现未知的转录本和基因注释。寻找个体间,同一个体不同时期等感兴趣基因表达丰度变化。转录组测序(RNA-Seq)mRNA-Seq方案有关有关lncRNA的一些知的一些知识:长度大于200bp无法编码蛋白有内含子区和外显子区非编码RNA具有调节基因表达的作用,如对染色体结构的影响,对RNA加工修饰及稳定性的影响,对转录和翻译的影响,甚至对蛋白质的转运及稳定性都有一定的影响。所以近年来,许多通过RNA-seq进行测序分析的文章都包括对lncRNA的分析,并且发现了许多新的lncRNA。lncRNA-S
12、eqsRNA-SeqRNA-seq的优势不局限于已知的基因组序列信息,适用于未知基因组序列的物种的高通量转录组研究相对于芯片技术,背景信号值低,没有检测上限,对于基因表达谱有非常宽的检测范围。在有内参的情况下,在定量方面显示出了较高的准确度和可重复性。不需要克隆的步骤,操作简单,需要的样本量少,可在单细胞的水平上进行表达谱分析通量高,成本比Tilling array或者大规模的EST测序要低。RNA-seq的挑战文库构建过程中大片段的RNA必须经过片段化处理,会引入一定的偏倚。PCR会造成表达量的变化。海量短序列数据的比对或拼接情况复杂,对重复序列和多匹配序列的精确定位存在明显问题。高等真核生
13、物可变剪接和反式剪接的鉴定仍有相当的误差。测序深度的确定因物种、器官、组织、时期而变,很难有统一公式直接计算。石蜡包埋石蜡包埋样本解决方案本解决方案FFPEFFPE样本本(石蜡包埋切片石蜡包埋切片组织)石蜡包埋技术(Formalin-Fixed and Parrffin-Embedded,FFPE)是现今临床上最常见的保存DNA方法,全球医院的珍贵临床样本中超过80%都使用该技术保存,但由于该技术DNA经过福尔马林浸泡,使DNA分子发生交联和酶修饰,导致DNA存在不同幅度的降解。样本量巨大,80%以上的临床样本都使用石蜡包埋保存很多珍贵的临床样本已经做过组织学,病理学研究,很容易完成相关实验验
14、证为何要使用何要使用FFPEFFPE样本本难于抽提,福尔马林处理后的DNA容易产生交联,使提取出的DNA量偏低提取出的DNA质量低,通常降解200bp-5kb降解程度与石蜡包埋的时间相关FFPE-WESFFPE-WES的巨大挑的巨大挑战是否有相同突是否有相同突变?目前无法用于WGRS,样本降解严重,对DNA覆盖度有很大影响。DNA量过少,质量很差。石蜡包埋时间越长,福尔马林对DNA交联和损伤就越大。未使用保护缓冲液处理的福尔马林影响更大。FFPE样本仍存在问题CTCCTCS S和和CTDNA什么是什么是CTCsCTCs?CTCs(Circulating Tumor Cells)自发或因诊疗操作
15、由实体瘤或转移灶释放进入外周血循环的肿瘤细胞.CTCs是肿瘤转移过程中在血液循环系统中存活的肿瘤细胞,它的生成被认为是肿瘤发生转移的必要前提。CTCsCTCs研究研究意意义深入研究CTCs有助于对肿瘤转移机制进一步了解,为抗肿瘤转移的治疗提供新的依据 CTCs的检测有助于早期转移肿瘤患者的诊断、监测术后患者肿瘤的复发与转移有助于评估抗肿瘤药物的敏感性与患者预后以及选择个体化的治疗策略CTCsCTCs研究研究难点点CTCs并没有显著的特异性同其它血细胞明确区分且不同组织学类型和分子表型的肿瘤分别表达不同的标志物。CTCs在外周血中数量稀少,一般在106-107个白细胞中仅含有1个。无显著特异性数
16、量少CTCsCTCs的富集的富集非特异性富集方法特异性富集方法方法CTCs-芯片富集法纳米粒富集法免疫磁珠富集法密度梯度离心富集法细胞大小 富集法细胞变形性富集法细胞电学特征富集法Ficoll法和Oncoquick法上皮肿瘤细胞大小分离(ISET)和微滤芯片技术双向电泳-场流分离法(DEP-FFF)磁性活细胞分选法(MACS)、AdnaTest法、Cellsearch法通通过细胞形胞形态富集富集微流芯片微流芯片密度梯度离心密度梯度离心Plasma:血血浆Mononuclear cell:单核核细胞胞(包括(包括淋巴淋巴细胞、胞、单核核细胞、胞、上皮上皮细胞和胞和肿瘤瘤细胞)胞)Ficoll:密
17、度梯度液:密度梯度液RBCs:红细胞胞免疫免疫磁珠富集法磁珠富集法微流体微流体CTCsCTCs鉴定定流式细胞仪分析(flow cytometry FCM)免疫细胞化学技术 ICC(immunocytochemistry)鉴定标本中细胞抗原性和形态学特征,能使富集的目的细胞维持细胞形态并保持细胞活力 ICC是用能与显色剂结合的单抗与 CTCs特异性结合后,通过显色剂显色从而对CTCs进行鉴定的技术通过分析上皮细胞或肿瘤细胞的正常起源组织特异的候选基因的表达来检测 CTC,灵敏度非常高但是坏死的癌细胞、上皮细胞污染等都可以造成假阳性结果,此法无法检测CTCs细胞形态,在临床应用上有局限性。反转录-
18、聚合酶链反应RT-PCRCTCsCTCs与与NGSNGS的的结合合捕获CTCs鉴定CTCs单细胞扩增微量DNA建库WES或靶向区域捕获高通量测序生物信息分析ctDNActDNActDNA属于cfDNA中的一种。所谓cfDNA(cell freeDNA)血浆游离DNA,是细胞在代谢过程中释放到循环系统中的DNA,它们有的来自于正常细胞,有的来自于异常细胞(如肿瘤细胞),还有部分来自于我们外部(如病毒DNA)。ctDNActDNA与与NGSNGS的的结合合CTCsCTCs与与ctDNActDNA分析比分析比较CTCsCTCsctDNActDNA仪器需求需特殊仪器无需特殊仪器,只需全血样本分离需特殊仪器分离无需特殊仪器,只需提取cfDNAWGA分析可做不可做检测精度高高深度测序下才可达到较高精度有创/无创无创无创是否可做组织特异性可以不可,任何细胞都会代谢产生cfDNA谢谢!