1、基因编辑技术产生背景定义及原理分类及比较CRISPR的优点及在植物育种上的应用CRISPR基因编辑技术的一般操作程序全基因组测序技术的不断发展和完善大型基因组注释项目的实现基因革命(基础科学与个性化医疗之间进行转化)将大量数据转化为功能和临床相关知识解决这个问题最核心的是需要有高效、可靠的方法使研究者能够知道基因型如何影响表型利用同源重组机制对基因进行定向失活是为基因功能评估提供信息的有力手段。但是这一技术的应用有几个限制因素,包括遗传工程组件插入目标位点的效率低、筛选过程费时费力、有可能产生不利的突变效应等。RNAi基因靶向敲除技术给研究者提供了快捷、廉价而且可以开展高通量研究的新方法,但是
2、,RNAi的基因敲除效果还不够彻底,每次试验以及每个实验室的试验结果都会有差异,另外还存在不可预知的脱靶情况,所以只能够用于需要暂时抑制基因功能的试验当中。基因编辑技术(近十年出现):可以帮助科研人员对各种细胞和各种生物体内的几乎任意基因进行人工操作ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering一、基因编辑技术的产生背景一、基因编辑技术的产生背景2014年3月12日,宾夕法尼亚大学PabloTebas教授团队在新英格兰医学杂志撰文称,他们利用SangamoBioSciences开发的ZFNs基因编辑技术,显著提高了艾滋病患者对艾
3、滋病毒的抵抗能力。1、在不同人种之间,自由在不同人种之间,自由“切换切换”基因编辑技术首次应用于临床。目前SangamoBioSciences基于ZFNs技术治疗艾滋病的方法已经进入临床II期试验。免疫细胞表面的CCR5蛋白是HIV进入免疫细胞的“入口”。而少数北欧人由于CCR5基因“变异”(来源于原始高加索人),具备天然的HIV抵抗力。“要不把患者的CCR5基因都改成高加索人种那种类型吧”!2、“关闭关闭”一个基因,打开生命之门一个基因,打开生命之门2015年11月5日,WaseemQasim对外宣布,他们利用Cellectis公司经TALENs基因编辑技术改造的UCART19细胞株,成功缓
4、解了Layla的不治之症-急性淋巴细胞性白血病(ALL),造就了世界首例婴儿白血病治疗奇迹,是基因编辑技术有史以来第二次被运用在人体上技术。修改捐赠细胞使其抗癌:修改捐赠细胞使其抗癌:蕾拉的生命获救得益于基因工程修改过的血液细胞。捐赠的血液细胞来自美国,科学家总共对其进行了三次修改。科学家们首先在捐赠的血液细胞中添加抗白血病基因,这些基因可编码靶向并杀死癌细胞的蛋白质,其次科学家使用TALENs技术关闭两个基因,关闭第一个基因是为了确保捐赠的细胞不被蕾拉的身体排斥,关闭第二个基因是为了确保捐赠细胞不被治疗药物杀死。http:/ I融合形成的核酸内切酶,利用它可以在各种复杂基因组的特定位置制造D
5、NA的双链切口。第二代人工核酸内切酶:类转录激活因子效应物核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)的出现在很大程度上替代了ZFN。TALEN可以和ZFN一样对复杂的基因组进行精细的修饰,同时其构建较为简单,特异性更高,因此受到了科研工作者的青睐。2012年,TALEN被科学杂志评为十大科学突破之一。第三代人工核酸内切酶:规律间隔成簇短回文重复序列-Cas蛋白(clusteredregularlyinterspacedshortpalindromicrepeats(CRISPR)/CRISPR-associated(Cas)9)
6、,主要是基于细菌的一种获得性免疫系统改造而成,其特点是制作简单、成本低、作用高效。图B:锌指核酸酶二聚体与DNA结合示意图。锌指核酸酶的靶序列含有两个锌指蛋白结合位点,不过这两个位点之间还有一段57bp的间隔序列,锌指核酸酶里的FokI酶切结构域就能够切割这段间隔序列。当然,我们也可以设计出只能够识别左侧或者右侧结合位点的锌指蛋白。ZFN:Cys2His2锌指蛋白图A:一个锌指大约由30个氨基酸组成,形成了一种保守的结构。在锌指螺旋结构表面的那几个氨基酸能够与DNA大沟上的3个碱基结合,不过这种结合的选择性会有所差异。因为有了高度保守的链接序列,我们就可以设计出能够识别918个碱基长度的DNA
7、序列。在一段680亿个碱基组成的DNA序列里,18个碱基组成的序列就足以成为一段特异性的序列,所以如果能够设计出含有3种以上的锌指蛋白DNA识别结构域的蛋白,那么就意味着科学家们能够利用锌指蛋白识别出人类基因组里的任意一段DNA序列。TALE蛋白中的DNA结合结构域是由一连串3335个氨基酸组成的重复结构域组成的,其中每一个结构域都能够识别一对碱基。TALE核酸酶的DNA结合特异性主要由两个高度可变的氨基酸决定,科学家们将这两个关键的氨基酸称作重复可变双氨基酸残基位点(repeat-variabledi-residues,RVD)。与锌指结构域一样,这种TALE重复模块也能够串联起来,识别一长
8、串的DNA序列。TALEN分子比ZFN大得多,因此很难高效导入,科学家们也想出了不少的办法,如金门分子克隆技术(GoldenGatemolecularcloning)。TALENCRISPR/Cas系统系统CRISPR/Cas系统的作用特性与限制性核酸内切酶相似,它对序列的特异性切割主要依赖于crRNA与Cas蛋白形成的核糖核蛋白复合物识别靶序列上的PAM以及protospacer根据CRISPR/Cas系统这一特性,将其用于设计人工的核酸内切酶(engineeredendonuclease,EEN),用来对我们感兴趣的基因位点进行修饰 三类CRISPR/Cas系统中Type型系统的核糖核蛋白
9、复合物相对简单,除crRNA和tracrRNA外,只有Cas9一个蛋白目前,产脓链球菌(StreptococcuspyogenesSF370)的Type型系统是被改造的最为成功的人工核酸内切酶。其基因座结构可分为三部分三部分:5端为tracrRNA基因,中间为一系列Cas蛋白编码基因,包括Cas9、Cas1、Cas2和Csn2,3端为CRISPR基因座,由启动子区域和众多的间隔序列(spacers)和重复序列(directrepeats)顺序排列组成。CRISPR/Cas的基因座结构的基因座结构CRISPR/Cas的作用机理的作用机理(分为三个阶段来理解):PhasePhasePhase噬菌体
10、或是质粒上与间隔序列对应的序列被称为protospacer,通常protospacer的5或是3端延伸几个碱基序列很保守,被称为PAM(protospaceradjacentmotifs),它的长度一般为25碱基,一般与protospacer相隔14碱基新间隔序列的获得可能分为三步:首先识别入侵的核酸和扫描外源DNA潜在的PAM,将临近PAM的序列作为候选protospacer;然后在CRISPR基因座的5端合成重复序列;最后新的间隔序列整合到两个重复序列之间(图2)。目前只有第一个步骤被证实。第一,CRISPR的高度可变间隔区的获得第二,CRIPSR基因座的表达(包括转录和转录后的成熟加工)
11、:多个研究表明CRISPR基因座首先被转录成前体CRISPRRNA(pre-crRNA),然后在Cas蛋白或是核酸内切酶的作用下被剪切成一些小的RNA单元,这些小RNA即为成熟crRNA,由一个间隔序列和部分重复序列组成,Type型CRISPR/Cas系统crRNA的成熟除了需要Cas9和RNase参与以外,还需要tracrRNA的指导;第三,是CRISPR/Cas系统活性的发挥或者是对外源遗传物质的干扰:成熟的crRNA与特异的Cas蛋白形成核糖核蛋白复合物,再与外源DNA结合并扫描到外源DNA,寻找其上的靶序列,crRNA的间隔序列与靶序列互补配对,外源DNA在配对的特定位置被核糖核蛋白复
12、合物切割早期研究认为crRNA的间隔序列(spacer)与外源DNA的靶位点完全互补配对对于切割是必需的,但是后来的研究证明spacer与protospacer部分互补配对时切割也可以发生。2013年ThomasGaj,CharlesA.Gersbach,CarlosF.Barbas.ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering.TrendsinBiotechnology,09May2013;DOI:10.1016/j.tibtech.2013.04.004CRISPR/Cas9、ZFNs、TALENs的比较功能结构功能结构:
13、ZFNs、TALENs人工核酸酶的原理是一样的,都是由DNA结合蛋白与核酸内切酶Fok I融合而成,以二聚体形式发挥功能且只需要蛋白质元件。序列特异性由每条多肽的DNA结合域决定,剪切由FokI酶结构域决定。而CRISPR/Cas9系统由一个单体蛋白和一个嵌合的RNA构成,序列特异性由gRNA中20个碱基序列决定,剪切由Cas9蛋白执行。设计难度:设计难度:由于锌指蛋白与DNA互作的复杂性以及序列特异性的进一步限制,一般认为ZFNs的设计比较困难,成本昂贵,而且其专利被少数几家商业公司控制。商业化的ZFNs较使用公共资源设计的ZFNs效果好,但是贵得多(比如美国的SangamoBioscien
14、ces(Richmond,CA,USA)公司和美国SigmaAldrich(St.Louis,MO,USA)公司合作,开发出的一套名为CompoZr的锌指蛋白构建系统)。TALENs要更容易设计一些,因为在蛋白质重复与DNA序列间有一对一的识别规则,而且高效的DNA组装技术,如GoldenGate克隆,简化了TALENs元件的组装,然而TALENs基于的高度重复序列会促使体内发生同源重组。目前也出现了商业化的人工TALEN文库,比如法国巴黎的CellectisBioresearch公司(一个未经验证的定制TALEN的价格是3360美元,验证过的是5000美元)、美国的TransposagenB
15、iopharmaceuticals公司(Lexington,KY,USA)和生命科技公司(LifeTechnologies,GrandIsland,NY,USA)都提供这类服务。相较而言,gRNA引导的剪切只依赖于与目标DNA序列进行简单的Watson-Crick碱基配对,因此不需要对每个目标位点进行复杂的蛋白质工程改造,而仅需修改gRNA中20个碱基序列来识别不同的目标位点。靶标:靶标:ZFNs理论上可以靶定任何序列,但实际上,目标的选择受限于模块的可行性(基于序列依赖的组装平台合成)。利用公共数据库,基因组DNA序列上平均每100bp就可制备1个功能性ZFNs。TALENs靶标受限于需要第
16、一个碱基是胸腺嘧啶,另外,不是所有的TALENs都能在体外有效工作,而且一些还不能产生预期的突变,这就意味着每个TALEN对都需要进行实验验证。比较而言,CRISPR/Cas9系统理论上仅需在目标位点上游含有NGG(或NAG)PAM模体,但是,不能完好匹配的间隔序列可能会引起脱靶剪切,因此gRNA的序列必须仔细设计,以避免脱靶发生,因此实际上能剪切的目标位点会有所减少。Xieetal.利用哺乳动物的CRISPR/Cas9系统进行计算机模拟分析表明,在8个代表性植物(拟南芥、蒺藜状苜蓿、大豆、番茄、短柄草、水稻、高粱、玉米)的基因组中,每100bp可鉴定到5-12个NGG-PAM,PAMs的数量
17、与基因组大小相关,相同基因组大小的单子叶植物较双子叶植物含有更多的特异gRNA。除玉米外,可以设计特异gRNA编辑85%-99%的已注释转录单元,其中68%-96%的转录单元含有至少10个不同的可定位NGG-PAM位点;玉米是8个物种中基因组最大、被注释的基因数最多的物种,仅30%的转录单元可以设计特异的gRNA进行编辑,这与基因组的复杂性和序列结构相关。可以预测,小麦、大麦等基因组比玉米更大的物种可能会面临相同的问题。但是,将来通过使用与有不同PAM要求的Cas9同源蛋白,可以拓展CRISPR/Cas系统在植物基因组中的应用范围。CRISPR/Cas9、ZFNs、TALENs的比较剪切特点剪
18、切特点:ZFNs和TALENs均携带限制性内切酶FokI的活性域,能够产生带有粘性末端的一个DSB,其依据连接子和间隔子的差异而有不同的长度。Cas9有两个剪切域RuvC和HNH,在目标DNA序列PAM上游3个碱基处进行剪切,产生平齐末端(在体外,Cas9偶尔也能产生1-2个碱基的粘性末端)。特定的粘性末端对于DNA分子的精细插入十分有益,它由NHEJ介导相容末端连接完成。利用好双切口酶方法,CRISPR/Cas9系统也能产生这样的结构。效率效率:CRISPR/Cas9系统在植物中可实现高突变率,效率与ZFNs和TALENs相当或更高。突变的效率受目标序列差异、gRNA的序列或结构、Cas9的
19、版本(不同物种的密码子优化)和gRNA的表达策略等影响。而且报道的突变率与分析方法的灵敏性有关,所以并不奇怪对于相同物种不同人报道的突变率差异较大。CRISPR/Cas9、ZFNs、TALENs的比较四、四、CRISPR/Cas9系统的优势系统的优势简单(Simplicity)、易获取Accessibility 低成本(Cost)、用途广(versatility)区别于ZFNs和TALENs,不需要蛋白质工程,因此针对每个目标基因可检测多个gRNA,更加直接;不需要克隆,针对不同的目标特异性仅需改变gRNA的20个碱基;任意数量的gRNA都可以通过体外转录法,利用两条互补的退火寡核苷酸链制备而
20、成;大型gRNA库的组装因此并不昂贵,从而使CRISPR/Cas9系统能够应用于高通量功能基因组学研究,而且任何分子生物学实验室都承担得起基因组编辑的预算费用。区别于ZFNs和TALENs,CRISPR/Cas9系统能剪切人类细胞中的甲基化DNA,从而进行遗传修饰,这是其它核酸酶无法实现的。植物中,这一方面还没有进行专门研究,但是有理由相信剪切甲基化DNA是CRISPR/Cas9系统所特有的,并且与目标基因组无关。植物中大约70%的CpG/CpNpG都是甲基化的,尤其是在启动子区及第一个外显子区的CpG岛。因此,总体来说,CRISPR/Cas9系统对于植物的基因组编辑更具通用性,尤其适合于GC
21、含量高的单子叶植物基因组,如水稻。CRISPR/Cas9系统的优势CRISPR/Cas9系统较ZFNs和TALENs,最主要的应用优势是易于多位点编辑,即同时在多个位点引入DSBs,从而同时编辑多个基因。尤其有利于对冗余基因或代谢路径进行敲除。相同的策略还可用于在同一染色体的两个相距较远的剪切位点间引入大片段缺失或遗传转换。利用CRISPR/Cas9系统进行多位点编辑仅需要单个Cas9蛋白和多个不同序列特异性的gRNA,相反,使用ZFNs或TALENs进行多位点编辑需要针对每个位点特异性的不同二聚体蛋白。CRISPR/Cas9系统的优势CRISPR研究界实施的开放获取政策也促进了这一技术的快速
22、传播和应用。与ZFN平台的所有权性质不同,CRISPR研究界提供开放性的质粒、网络工具(用于筛选gRNA序列以及预测特异性),同时主持活跃的讨论组。这些设施机构鼓励更多人利用这一技术,进而促进了对其更深的了解与应用。CRISPR/Cas9系统的优势CRISPR/Cas9的特异性(relaxedspecificity)CRISPR/Cas9系统存在的一个争议是早期报道的相对较高的脱靶突变,随后研发出了一些策略来减少脱靶编辑发生最重要的是谨慎设计gRNA(gRNA的脱靶效应可以快速、便宜的检测出来)优化核酸酶的表达(高浓度的Cas9和gRNA可以提高脱靶效应)采用突变的Cas9蛋白版本,将其转化为
23、切口酶,使用两个Cas9切口酶可以引入偏移的单链缺口,产生一个交错的DSB,这个策略提高了识别碱基的特异性失活的Cas9与FOKI融合改变gRNA的长度脱靶效应在相同物种的不同细胞类型中差异较大CRISPR-Cas9基因编辑技术的研究及应用历史基因编辑技术的研究及应用历史1987年,发现串联间隔重复序列(CRISPR)2005年,推测CRISPR的生物功能(与细菌抵抗外源遗传物质入侵的免疫系统有关)2007年,证实CRISPR序列与Cas基因结合抵抗病毒入侵,由此揭开了研究CRISPR作用机制的序幕(2008-2011年)2012年,CRISPR/Cas系统开始由生物现象发展为基因组编辑工具-
24、只要改变crRNA的20个核苷酸就可以简单地对目标DNA序列进行重新编程,而且crRNA的定位特异性与tracrRNA的结构性能可以相结合组成一个嵌合的单条引导RNA(gRNA),从而将三元系统三元系统简化为二元系统二元系统。五、五、CRISPR-Cas9基因编辑技术的应用基因编辑技术的应用2013年至今,CRISPR/Cas系统逐渐被广泛应用:(CRISPR/Cas热潮)在植物中,2013年,5个独立的研究小组证实二元件系统在真核生物(人、鼠、斑马鱼)中具备功能性,而且携带不同序列的多个gRNA能够同时在不同位点实现高效的多重基因组编辑-说明CRISPR/Cas9系统是一个简单、成本低、作用
25、广的基因编辑工具。2013年8月,5篇报道首次讨论了CRISPR/Cas9基因编辑在拟南芥、烟草、水稻中的应用,随后的研究(2013-2014年)也报道了其在大豆、小麦、玉米、西红柿等植物中的应用。其中,4个独立的小组发现,CRISPR/Cas9系统能在水稻和西红柿转化体的第一代就直接引入等位或同源突变,说明其在这两个物种中尤其高效。此外,在拟南芥、水稻、西红柿中,Cas9/gRNA系统诱导的遗传变化出现在生殖细胞系,在随后的世代中会正常分离而不会进一步被修饰。植物育种中的应用和建议传统的育种依赖于既有的自然遗传变异,而且需要进一步的回交才能将选择的目标性状导入优良背景里。因此,自然界中可用的
26、有利变异限制了育种能达到的效果。新的变异可以通过随机突变获得,但是需要对大量群体,花费大量时间进行筛选才能鉴定出具有期望表型的突变。基因编辑可以对优良遗传背景直接进行精准、可预期的修饰,从而加快育种程序,由于可以同时对多性状进行修饰,CRISPR/Cas9系统尤其有效。NHEJ介导的基因敲除是定点修饰最简单的应用。如用于剔除降低粮食品质的基因、给予致病菌敏感性、转换代谢流以获得有价值的众产品等.利用寡核苷酸供体序列进行特定核苷酸的精准替换能用于修饰调控农艺性状基因的DNA序列,进而提高作物产量有NHEJ或HR介导的大片段插入,能够在特定位点引入提高转录水平的转基因,而不影响内源基因的活性。植物
27、育种中的应用和建议位点特异的核酸酶还可进行定向分子性状叠加。实现将多个目标性状导入作物中,同时分离的风险较低,这是传统育种,甚至是转基因育种都难以做到的。一旦叠加完成,整个的分子序列能通过杂交的方式转移到其它种质中,因为它是以单位点方式遗传的。虽然使用位点特异性重组(sitespecificrecombination)也能达到这一目的,但是使用可编程的核酸酶结合精准的NHEJ或HR进行定向整合不会留下与整合方式相关的任何痕迹,如loxP或attB序列。植物育种中的应用和建议虽然欧洲管理机构判定转基因作物的焦点是产生过程而非产品本身,由基因编辑技术如CRISPR/Cas9系统,切除几个核苷酸而产
28、生变化的植物仍有希望和信心不被划定为转基因作物使用可编程的核酸酶有几种方法可以产生不含转基因成分的突变植物。包括使用农杆菌渗入法或病毒载体瞬时表达核酸酶组件以功能性gRNA和Cas9蛋白形式,或者将在不同染色体上的gRNA和Cas9基因合并在一起的形式,直接运送到目标位点,这样就可以通过遗传分离被移除。虽然如CRISPR/Cas9系统的特异性需要进一步研究,但是已经确定其脱靶效应远远低于化学或物理诱导突变。当然,位点特异性核酸酶的应用解决了转基因的一个主要关注的问题,即随机整合及其带来的非预期效应,如扰乱宿主代谢或/和产生毒性或过敏性产物,从而减少了大量 管控负担。复杂的管理过程、耗时和昂贵的
29、安全评价事实上停止了转基因植物的发展和商业化应用(有资源承担长期开发过程的大型公司除外)。利用位点特异性核酸酶在特定和预定的染色体位点引入转基因的潜力应该能消除这些非预期事件带来的风险。植物育种中的应用和建议CRISPR/Cas9系统在未来可能会进一步拓展的应用是在代谢工程和分子农场领域的转基因定点插入-植物或植物细胞用作生产特定代谢物或蛋白的工厂。目前,这两个应用均主要依赖于随机的转基因插入,因此必须从大量初级转化群体中筛选出表现好的克隆。这体现了基因组位置效应(转基因插入位点周围的调控元件及染色质结构影响转基因表达)的影响和转基因位点的其它特征(如,转基因拷贝数、反向重复序列和截位序列的存
30、在等),这些影响沉默的可能性。构建一个通用受体系(genericrecipientline)-含有一个预知的、特定的安全存在位点(safeharborlocus),可增强任何转基因的表达并带来相应产品的高产,将加快新的植物生产线的发展和准入。植物育种中的应用和建议六、六、CRISPR-Cas9基因编辑技术的一般操作程序基因编辑技术的一般操作程序Cas9核酸酶和gRNA表达质粒的构建遗传转化:瞬时转染、稳定转化测算突变频率Cas9核酸酶和gRNA表达质粒的构建水稻原生质体转化(Riceprotoplasttransformation)-瞬时转染(transienttransfection)水稻原生质体转化(Riceprotoplasttransformation)-瞬时转染(transienttransfection)农杆菌转化和基因枪转化-稳定转化(stabletransformation)测算突变频率主要参考文献TheCRISPR/Cas9systemforplantgenomeeditingandbeyondCRISPR/Cas9介导的基因组定点编辑技术TheCRISPR/Cas9systemproducesspecificandhomozygoustargetedgeneeditinginriceinonegeneration