资源描述
染色质结构之美一一染色质可及性 摘要染色质可及性(chromosome accessibility)作为一种衡量染色质结合因子与染色质 DNA结合能力高低的染色质属性,是评价染色质结构稳态的重要指标之一,在多种细胞核 进程中扮演重要角色,包括基因转录调控以及DNA损伤修复等。该属性的异常调控与多 种疾病的发生发展密切相关,包括肿瘤以及神经退行性疾病等。对于该属性探究已经成为 生命科学与疾病领域的热点。伴随越来越多的新技术应运而生,例如染色质构象捕获技 术、高通量测序技术以及两种技术的结合等。随着技术的进步,多种参与调控染色质可及 性的因素被发现和总结,包括核小体占位、组蛋白修饰以及非编码RNA等。多项大规模 的染色质组学数据绘制了多种疾病的染色质可及性图谱,为揭示疾病的发生发展与染色质 可及性之间的关系提供了数据支持。同时一,随着单细胞染色质可及性测序技术的发展,实 现了对细胞类型染色质层面的划分,弥补了单纯依赖基因表达划分细胞类型的不足。本文 将从染色质的组成与可及性、影响染色质可及性的因素、染色质可及性的检测方法,以及 染色质可及性与癌症的关系等方面简要阐述染色质可及性的研究进展。关键词 染色质可及性,癌症,组蛋白修饰,染色质结构,检测方法 中图分类号Q343.2Chromosome Accessibility:Research Development and ProspectPENG Jian,ZHANG Hong-Quan*(Department of Human Anatomy,Histology and Embryology,Key Laboratory of Carcinogenesis and Translational Research(Ministry of Education)and State Key Laboratory of Natural and Biomimetic Drugs,Peking University Health Science Center,Beijing 100191,China)Abstract Chromosome accessibility is one of the important indicators to evaluate the stability of chromosome structure,which is used to evaluate the binding ability of chromosome binding factors to chromosome DNA.It plays an important role in different nuclear processes,including gene transcription regulation and DNA damage repair.Abnormal regulation of chromosome accessibility is closely related to the occurrence and development of a variety of diseases,including tumors and 1neurodegenerative diseases.Therefore,exploration of this attribute has become a hot spot in the field of life science and disease.More and more new technologies came into being,such as chromosome conformation capture,high-throughput sequencing,and the combination of these two technologies.With the progress of technology,more and more factors involved in the regulation of chromosome accessibility have been found and summarized,including nucleosome occupation,histone modification and non-coding RNA.A number of large-scale genomic data have drawn the chromosome accessibility map of a variety of diseases,which provides data support fbr revealing the relationship between the occurrence and development of diseases and chromosome accessibility.Meanwhile,with the development of single-cell chromosome accessibility sequencing technology,the investigation fbr division of cell types at chromosome level was achieved,which makes up fbr the deficiency of solely relying on gene expression fbr cell type division.This review will explain the development and prospect of the research about chromosome accessibility from the aspects of chromosome composition and accessibility,factors affecting chromosome accessibility,detection methods of chromosome accessibility,and its roles in cancer,briefly.Key words chromosome accessibility,cancer,histone modification,chromosome structure,detection methods收稿日期:2022-03-22;修回日期:2022-06-10;接受日期:2022-06-13国家自然科学基金资助项目(No.81972616;81730071)资助*通讯作者 Tel:(010)82802424;E-mail:Hongquan.ZReceived:March 22,2022;Revised:June 10,2022;Accepted:June 13,2022Supported by National Natural Science Foundation of China(No.81972616;81730071)*Corresponding author E-mail:Hongquan.Z;Tel:(010)82802424真核生物正常生命功能的维持受到多种自身与环境因素的调控,基因表达的精密调控 是其中重要的环,通过参与调控细胞增殖、分化和死亡,进而维持机体生长发育的正常 运转山2。在真核生物中,遗传物质DNA并不是裸露存在,而是通过其所带负电荷与带正 电荷组蛋白及多种组蛋白分子伴侣相结合,之后经过逐级压缩,形成最终的染色质。例 如,人体细胞基因组DNA长度可达2米,而储存DNA的细胞核仅有几微米。由此可见,2基因组DNA受到了极大程度的压缩4】。即便如此,细胞依旧能够在短时间内迅速完成对每 一个基因表达的精确调控。这也提示,染色质处于高度动态变化中,同时染色质的组装遵 循特定的规律。另外,在细胞中存在一种高效的染色质调控机制,参与协助细胞完成基因 表达的精确调控。而该调控过程的异常或紊乱可能会导致机体的正常功能受损,甚至导 致疾病的发生叵7因此,解析染色质的组成以及结构的动态变化对于揭示生命体的奥秘显 得尤为重要。1染色质的组成与可及性真核生物DNA通常与组蛋白相互作用,形成核小体结构。基因组DNA(147 bp)通 过与组蛋白8聚体缠绕(约1.65圈)形成紧密结合的核小体。其中,每1个核小体中包含 14个DNA小沟网。另外,多个核小体之间通过相互作用形成“串珠”状结构,经过反复折 叠后形成线性染色质纤维,线性的染色质纤维之间相互作用形成最终的染色质三维结构 9 O研究显示,真核生物染色质的高度压缩,导致大部分区域并不表现出转录活性,但是 仍然存在一部分开放的染色质区域,通常称之为顺式调控元件(包括:启动子、增强子、绝缘子等),该区域通常伴随多种反式作用子的富集,包括:转录因子、组蛋白修饰 酶、转录起始复合物等,上述染色质中开放或可接近的区域,被称之为“开放/可接近染色 质(open chromosome,accessible chromosome)区域”,而染色质的这一属性即所谓染色质 可及性(chromosome accessibility)2参与染色质可及性调控的因素在真核生物基因组中,染色质可及性在不同的空间尺度受到多种因子的调控,并且很 大程度取决于核小体以及DNA相关大分子(包括转录因子和结构蛋白质)在染色质上的 组织与占位。由于大部分染色质DNA被组蛋白或其他DNA相关大分子蛋白质所占据,因 此通过改变上述蛋白质与染色质DNA的结合能力,可以增加染色质的可及性皿。首先,染色质中核小体的分布与周转率影响染色质可及性;其次,多种组蛋白翻译后修饰参与调 控染色质可及性;连接组蛋白、LncRNA以及DNA甲基化,同样参与染色质可及性的调 控(见 Fig.l)。3Chromosome accessibility regulationFig.l Overview of chromosome accessibility regulation Various regulation aspects of chromosome accessibility were demonstrated in this schematic.H3K9me3,tri-methylation of lysine 9 on histone H3;H2AK121ub,mono-ubiquitination of lysine 121 on histone 2A;H3K27me3,trimethylation of lysine 27 on histone H3;H3K27ac,acetylation of lysine 27 on histone H3;H4K44ac,acetylation of lysine 44 on histone H4;H3Y41ph,phosphorylation of tyrosine 41 on histone H3;RNA poly II,RNA polymerase II;TFs,transcription factors2.1 核小体分布与周转对染色质可及性的影响染色质可及性不仅与结合因子分布的密度有关,同时与这些因子停留时间相关,即结 合因子的周转率同样影响染色质可及性口3,】久例如,在染色质中,与转录因子CTCF(CCCTC binding factor)所结合的绝缘子以及处于活化状态的转录起始位点,表现出不同的 染色质开放程度以及较高的染色质可及性。并且两者的核小体分布情况呈两极分化,CTCF 结合的绝缘子分布在核小体排布密集的染色质区域,而转录起始位点区域的核小体分布密 度与稳定性均较低。增强子上核小体的分布密度与周转率表现则较为中等口叫核小体分布 密度与稳定性可能参与调控染色质的开放程度,进而影响转录因子与染色质DNA的结合 能力。核小体在染色质上的分布情况是动态变化的,其中活化的启动子与增强子区域表现出 较强的核小体周转率口句。核小体的周转率受到多种因素调控,包括DNA序列,组蛋白变 体,组蛋白分子伴侣的可及性,局部染色质的环境(包括:组蛋白密度、染色质重塑因子 的活性等),连接体组蛋白以及组蛋白富集情况等。例如:非经典组蛋白变体H2A.zU7.M 以及H3.3U同样影响核小体的周转情况,并且通常富集在基因组转录调控区域,包括转录 起始位点以及增强子区域。该区域的核小体表现出较低的稳定性,并且通常富集多种增强 4核小体周转的组蛋白翻译后修饰,例如组蛋白乙酰化以及H3K4甲基化2。此外,组蛋白 变体H2A.W通过增强染色质与组蛋白H1紧密结合,进而维持异染色质的低可及性。在多细胞真核生物中,核小体分布多样性较高,可能的原因是多细胞真核生物的每一 个细胞所包含的遗传物质相同,为了实现遗传物质的选择性表达,因此需要多样的核小体 分布。在体外和酵母细胞中已经明确了核小体对特定DNA序列的偏好;但是,这种偏差 在多细胞系统中并不明显,并且它对人类核小体定位的预测参考价值有限,仍需要进一步 的探究,进而解读核小体周转的奥秘。2.2 组蛋白翻译后修饰与染色质可及性核小体的结构与性质受到多种因素的调控,包括特殊组蛋白变异体的替换,ATP依赖 的染色质重塑酶对其定位的调控22,以及组蛋白的翻译后修饰等23。在过去的半个世纪,研究人员已经发现了多种不同的组蛋白修饰,包括众所周知的赖氨酸甲基化、赖氨酸乙酰 化和丝氨酸/苏氨酸磷酸化,以及近期发现的新修饰,例如巴豆酰化24、异烟酰化25、乳酸 化闿等。2.2.1 组蛋白乙酰化修饰增强染色质可及性早在1961年,研究人员就已经发现了组蛋白 乙酰化,同时也是最早发现的组蛋白修饰凹。组蛋白高乙酰化修饰与基因转录活化相关网(见Fig.2)。事实上,组蛋白乙酰化的化学性质也提示,其是一种促进基因表达的组蛋白修饰,由于乙酰化修饰可以中和赖氨酸残基的正电荷,进而降低组蛋白与核小体DNA、连 接体DNA或相邻组蛋白之间的电荷依赖性相互作用,从而降低染色质的压缩程度,增强 染色质DNA与转录机器的可接近性,促进该区域基因的转录ha。例如,早期的体外研 究表明,组蛋白H4尾部的乙酰化显著降低了其对DNA的亲和力,并且这一现象在细胞中 同样得到了验证RI。组蛋白乙酰化不仅参与调控基因转录,在其他需要访问染色质的细胞过程中也发挥着 类似的作用,在DNA复制以及DNA损伤修复过程中,同样存在组蛋白乙酰化RI。例如,在减数分裂期间DNA损伤修复过程中,组蛋白H4第44位点赖氨酸的乙酰化在染色质 DNA损伤区域的富集增加,并进一步增强该区域的可及性Ml。5Inaccessible ChromosomeAccessible ChromosomeFig.2 Schematic diagram of chromosome accessibility regulation by histone acetylation Ac,histone acetylation.Mostly,chromosome accessibility could be increased by histone acetylation2.2.2 组蛋白其他类型的酰基化修饰:与乙酰化类似,另有许多其他类型的组蛋白赖氨酸 酰基化修饰,包括:巴豆酰化、甲酰化闷、琥珀酰化3句、丙二酰化Hl、丙酰化网和丁酰化 阳等。这些酰化修饰同样可以中和赖氨酸的正电荷,削弱组蛋白与DNA的结合能力。虽 然还需要进一步的工作来确定这些组蛋白赖氨酸酰化的生物学功能,但总的来说赖氨酸酰 化可能是促进转录、复制和修复等过程中,增强染色质DNA访问性的常见修饰。2.2.3 组蛋白甲基化与染色质可及性 除了酰基化修饰之外,组蛋白甲基化修饰同样影响染 色质可及性4叫H3K9me3和H3K27me3分别与异染色质形成以及多疏抑制复合物沉默有 关,甲基化增加了特定蛋白质模块对组蛋白残基的亲和力,进一步增强核小体的稳定性 4lo在体外,Swi6分子通过其染色质结构域,识别单个核小体中成对的H3K9me3尾部,随后桥接相邻的H3K9me3修饰的组蛋白尾部,稳定核小体结构的同时促进异染色质形成 42。组蛋白H3的另一位点的甲基化修饰H3K36me3也具有稳定核小体的功能。目前 已知的H3K36me3增强核小体稳定性有两种可能的机制调控组蛋白去乙酰化和染色质 重塑:(1)H3K36me3调节Rpd3s复合物的活性,Rpd3s复合物通过去乙酰化组蛋白阻止 核小体周转阳;(2)H3K36me3还增强抑制性Iswlb染色质重塑复合物对核小体亲和力 44。因此,H3K36me3促进组蛋白去乙酰化和抑制染色质重塑,共同抑制核小体转换,维 持染色质的紧缩状态,降低其可及性4习。但是,组蛋白甲基化并不总是降低染色质的可及性,例如,组蛋白H3第4位赖氨酸 的三甲基化(H3K4me3)修饰是公认的转录活化标志之一Ml,主要通过为转录因子提供附着 位点,进一步招募RNA聚合酶,实现染色质的进一步开放。H3K4me3主要富集在启动子/转录起始位点处,并且即便是无活化的启动子同样存在H3K4me3的富集,而这些位点通 6常是潜在或即将被活化的启动子/转录起始位点,提示H3K4me3参与增强染色质的可及性47总之,目前的研究显示,H3K27me3,H3K27me248,H3K9me349,H3K9me250,H4K20me35通常被认为参与抑制染色质的开放,而H4K20me 152,H3K27mel53,H3K9mel54,H3K36me355,H3K79me256,H3K79me356,H2BK5mel57,H3K79mel57,H3K36mel58,H3K4mel59,H3K4me3,H3K4me2146】通常与染色质可及性 增强相关(见Fig.3)4刀。Chromosome accessibility and histone lysine methylationInactive geneH3K27me3 H3K27me2 H3K9me3 H3K9me2 H4K20me3H4K20me1 H3K27me1 H3K9me1 H3K36me3 H3K79me2 H3K79me3H4K20me1 H2BK5me1 H3K79me1 H3K36me1 H3K36me3 H3K4me1 H3K4me3H3K4me1H3K4me2H3K4me3Gene bodyExons/lntronsPromoterLowerHigherChromosome accessibilityFig.3 Schematic diagram of chromosome accessibility and histone lysine methylation H3K27me3,tri-methylation of lysine 27 on histone H3;H3K27me2,di-methylation of lysine 27 on histone H3;H3K9me3,tri-methylation of lysine 9 on histone H3;H3K9me2,di-methylation of lysine 9 on histone H3;H4K20me3,di-methylation of lysine 20 on histone H4;H4K20mel,mono-methylation of lysine 20 on histone H4;H3K27mel,mono-methylation of lysine 27 on histone H3;H3K9mel,mono-methylation of lysine 9 on histone H3;H3K36me3,tri-methylation of lysine 36 on histone H3;H3K79me2,di-methylation of lysine 79 on histone H3;H3K79me3,tri-methylation of lysine 79 on histone H3;H2BK5mel,mono-methylation of lysine 5 on histone H2B;H3K79mel,mono-methylation of lysine 79 on histone H3;H3K36mel,mono-methylation of lysine 36 on histone H3;H3K4mel,mono-methylation of lysine 4 on histone H3;H3K4me3,tri-methylation of lysine 4 on histone H32.2.4 组蛋白磷酸化与染色质可及性磷酸化是参与调控细胞中多种信号转导的化学修饰之 一。磷酸化可以增加靶蛋白质的负电荷6。,提示组蛋白磷酸化在调节染色质可及性方面可 能具有与乙酰化相似的作用。由于DNA骨架的磷酸盐带负电,因此,组蛋白磷酸化会导 致组蛋白与DNA之间产生电荷排斥,可能会使DNA与组蛋白的结合松动,导致核小体稳 定性下降,增加染色质DNA暴露的几率,染色质的可及性增强。例如,在DNA损伤修 7复过程中,作为细胞应对DNA双链断裂反应的关键组分yH2A.X(人体组蛋白H2A变 体)的第139位丝氨酸的磷酸化(由ATM或ATR激酶完成),可以招募DNA修复机器到 修复双链断裂位点处,而这一过程可能是由于磷酸化的组蛋白yH2A.X通过电荷排斥,进 而增加染色质DNA对修复因子的可及性62。组蛋白H3第41位酪氨酸的磷酸化(H3Y41ph)可以显著促进核小体的展开,这也使得该区域染色质的开放程度提高了近3 倍的。2.2.5 组蛋白泛素化与染色质可及性组蛋白泛素化同样参与染色质压缩与可及性调控 64o组蛋白H2B第123位赖氨酸的单泛素化修饰与染色质重组以及抑制性染色质形成相 关,并且在体内H2BK123ubl可增强核小体的稳定性3,6习。同样地,组蛋白H2B泛素化也 出现在DNA损伤修复过程中,并且对于修复蛋白质的正确募集是必需的,这提示组蛋白 泛素化可能有助于增强DNA损伤部位染色质的可及性We。拟南芥H2AK121ub常与染色质 的低可及性相关。有趣的是,H2AK121ub富集程度降低可以增强该区域染色质可及性,而 该区域基因的转录激活并不明显,这也提示染色质可及性并不能准确预测基因表达ML与 此类似,在卵巢癌中,早期组蛋白H2B单泛素化的缺失会改变染色质可及性并激活免疫相 关因子白介素6(IL-6)的表达,最终促进卵巢癌的进展(见Fig.4)68。Fig.4 Loss of H2Bubl enhances chromosome accessibilityf681 H2Bubl,mono-ubiquitination on histone H2B.Loss of H2Bubl could enhance chromosome accessibility and upregulate the8expression of IL6(interleukin 6),which could promote tumor cell migration in high-grade serous ovarian carcinomas(HGSOC)2.3连接组蛋白参与调控染色质可及性另一种参与调控染色质可及性的因素是连接组蛋白(linkerhistone)。连接组蛋白包括 组蛋白H1及其变体,在核小体占位以及异染色质的形成中发挥重要作用a1。连接组蛋白 主要是通过改变DNA的电荷,进而实现对染色质的进一步压缩,降低其可及性El。研究 显示,组蛋白H1的缺失可以增强局部染色质的开放程度,促进该区域基因的转录活化 7lo不仅如此,组蛋白H1在染色质上的占位与富集情况受到多种因子的调控,例如,肿 瘤抑制因子 PTEN(phosphatase and tensin homolog deleted on chromosome ten)可与组蛋白 Hl相互作用,进一步维持染色质的压缩状态(见Fig.5)mi。Fig.5 PTEN regulates chromosome accessibility through H1172J PTEN,phosphatase and tensin homolog;NPM1,Nucleophosmin 1;HP 1,Heterochromatin Protein 1;H4,histone H4;PTEN could increase the chromosome accessibility and influence genes expression through interacting with histone Hl2.4长链非编码RNA与染色质可及性长非编码RNA(long noncoding RNA,IncRNA)是一类长度大于200 nt的非编码 RNA,作为一种无处不在的转录本,IncRNAs可以参与调控多种生命过程,包括发育、分 化以及代谢等阳。越来越多的证据表明,IncRNA广泛地与染色质结合,并参与调控转录 与染色质状态的变化网。其中,核IncRNAs通常会通过结合染色质修饰因子或转录因子参 与调控染色质的高级结构与可及性75。在小鼠胚胎干细胞的染色质蛋白组学分析中发现,9一半以上染色质蛋白是RNA结合蛋白质R6,这也暗示RNA在染色质结构调控中扮演重要 角色。在肌肉干细胞肌源性谱系的进展过程中,LncMyoD参与调节染色质可及性。LncMyoD的缺失阻止含有肌源性E盒的区域开放的染色质环境的建立口刀。不仅如此,在 红细胞分化过程中,LncRNAPCEDlB-ASl通过调控转录因子GATA1(GATA binding protein 1)与染色质的动态结合,进而调节红细胞的终末分化肉1。同理,LncRNADANCR 作为一种在巨核红系祖细胞中高表达的IncRNA,亦可以通过调控染色质可及性影响红细 胞分化明。2.5 DNA甲基化与染色质可及性基因组CpG甲基化与基因调控密切相关,并且主要与转录沉默相关79。目前,用于治 疗骨髓增生异常综合征的DNA甲基化抑制剂,例如5-az a2-脱氧胞昔(5-aza-CdR)显著 降低细胞DNA整体甲基化水平,但甲基化与染色质开放程度之间的关系尚不清楚。作者 通过比较5-aza-CdR处理前后结直肠癌细胞系HCT116的染色质开放程度发现,只有少数 启动子DNA的去甲基化与核小体重塑以及染色质可及性相关,并且这些位点与组蛋白去 乙酰化酶抑制剂诱导的开放位点存在显著不同18叫在人体脑组织表观遗传修饰研究中,通过全基因组亚硫酸氢盐测序,检测了来自4个 大脑区域(扣带回前部、海马、前额叶皮质和伏隔核)的神经元和非神经元群体的DNA 甲基化,以及后2个区域的染色质可及性。结果发现,CpG岛甲基化区域(CG-DMRs)常与 染色质高可及性相关。同样,研究者只是观察到两者之间存在一定的相关性,并未进行深 入探究。在近期的研究中,通过分析ENCODE数据库发现,DNA甲基化水平与染色质可及性 之间存在较强的负相关性。但是,目前对于DNA甲基化与染色质结构以及可及性之间的 关系仍无定论,仍需深入的探究82。为了进一步揭示DNA甲基化与染色质可及性之间的关联,近期开发了通过捕获动态 染色质可及性变化的DNA甲基化的ATAC-Me技术。作者发现,在单核细胞到巨噬细胞的 命运模型中,数千个髓系增强子迅速出现可及性波,但是上述大多数位点中都存在较高水 平的DNA甲基化,同时与附近基因的转录活性密切相关83。10综上研究提示,DNA甲基化与染色质可及性之间存在关联,但是上述关联的性质以及 具体的分子机制仍不明确,需要进一步的探究。3染色质高级结构的检测方法随着研究的深入,越来越多的新兴技术已经应用到染色质可及性检测中,从最初的只 能观察染色质整体结构变化的荧光成像方法,到后来用于检测特定位点之间相互作用的染色 质构象捕获技术(chromosomeconfbrmationcapture,3C)以及相应的扩展技术(4C、5C、Hi-C)。随着高通量测序法的快速发展,目前,已经开发出多种精确描述整个染色质所有顺式调 控元件开放程度的高通量检测技术,例如:DNA酶I超敏位点测序(DNase I hypersensitive sites sequencing,DNase-seq)、甲醛辅助分离调控元件技术(fbrmaldehyde-assisted isolation of regulatory elements sequencing,FAIRE-seq)微球菌核酸酶消化结合深度测序(micrococcal nuclease digestion with deep sequencing,MNase-seq),染色质转座酶可及性测序法(Assay fbr Transposase-Accessible Chromosome using sequencing,ATAC-seq)以及 HiCAR(Hi-C on accessible regulatory DNA)等。3.1 DNase-seq脱氧核糖核酸酶I(DNase I)能消化染色质中裸露的DNA(不与核小体或转录因子 结合),但与核小体结合或高阶染色质纤维中的DNA不易被核酸酶消化El。因此,可以用 于检测染色质开放区域,包括启动子和增强子等31,以及大规模基因组学研究(例如:ENCODE Project等),具体实验流程正如Fig.6所示。DNase-seqDNase cleavage;Sequence、CCAMxATaFig.6 Schematic diagram of DNase-seq technology Firstly,naked DNA was digested by DNase and purified.Then,data of chromosome accessibility was sequenced by high throughput sequencing113.2微球菌核酸酶消化结合深度测序(MNase-seq)MNase-seq技术利用来自金黄色葡萄球菌的非特异性核酸内外切酶-微球菌核酸酶结合并切割染色质裸露的DNA区域,纯化未切割的DNA,并通过测序检测染色质开放区 域,测序流程正如Fig.7所示。该技术主要应用于检测基因组中与组蛋白或其他染色质 结合蛋白结合的染色质区域。通过MNase-seq绘制了人类基因组核小体定位的动态变化,并发现,在转录起始位点处,核小体的位移与RNA聚合酶H(Pol II)结合直接相关88】。此外,近期在 MNase-seq 基础上开发了 MNase hypersensitivity sequencing(MH-seq)技术,进一步提高了该技术在染色质开放图谱绘制中的分辨率8叫MNase-seqSequence 4口 口 口 口 I I I 口 1 口 口 ITTFig.7 Schematic diagram of MNase-seq technology Firstly,naked DNA was digested by MNase and purified.Then,data of chromosome accessibility was sequenced by high throughput sequencing3.3甲醛辅助分离调控元件技术(FAIRE-seq)FAIRE-seq是一种基于酚-氯仿DNA提取的染色质开放区域检测手段。与DNase-seq 类似,首先需要甲醛固定DNA-蛋白质之间的结合,之后通过超声切割未结合蛋白质的 DNA序列,之后通过酚-氯仿纯化DNA,最后通过测序得到染色质开放区域信息wo】(见 Fig.8)o例如,在利用FAIRE-seq对细胞类型特异性开放染色质图谱进行绘制,同时发现 NFI(Nuclear family I)家族在脂肪细胞分化中的调节作用网】。虽然方法操作较为简单,但 是存在较为明显的缺陷:超声对染色质的机械破坏难以控制,降低检测的精确度,因此,不利于检测较为敏感的染色质区域的开放程度。12FAIRE-seq/Shear by I-sonicationt t t t t t t t|Sequence 二.CGAkAaAU.i“i i 口 i i 口 i 11 i i 口 i i 口 i iFig.8 Schematic diagram of FAIRE-seq technology Firstly,interaction between DNA and other molecule was fixed by formaldehyde.Then,DNA fragmentation was performed by sonication and purified by phenol/chlorofbrm.Finally,information of chromosome accessibility was obtained by high throughput sequencing3.4染色质转座酶可及性测序法(ATAC-seq)利用突变型Tn5转座酶对DNA的高亲和性特性,将扩增引物或者测序接头插入到开 放的染色质区域中,之后通过对上述区域扩增与测序,进而确定整个染色质不同区域的开 放程度与可及性92。相比于DNase-seq、FAIRE-seq和MNase-seq,ATAC-seq具有灵敏度 高、实验重复性好、样品需求量小等优势,目前已经成为检测染色质可及性的首选方法。ATCA-seq具体实验流程见Fig.9:(1)转座酶Tn5利用测序接头标记双链DNA;(2)纯化并扩增标记的DNA片段;(3)通过二代测序对标记的DNA片段进行测序;(4)将测 序读取到的DNA片段进行基因组注释,并分析不同片段的丰度,进而反映对应位点的染 色质可及性水平阴。与其他方法相比,ATAC-seq具有较为明显的优势:与FAIRE-seq相 比,ATAC-seq不需要对样品超声处理或苯酚-氯仿提纯,极大地保护了样品的完整性;与 MNase-seq或DNase-seq相比,ATAC-seq不需要对样品进行酶消化处理,同样降低了对样 品的破坏;并且ATAC-seq实验操作更为简单,耗时较短,目前已经有较为广泛地应用。利用ATAC-seq技术对人体诱导多能干细胞细胞来源的三维类器官的染色质可及性动态变 化图谱进行绘制,建立在人脑皮层神经发生过程中的染色质可及性的模型变化过程9久此 外,还包括:人类胚胎发育和胚胎干细胞多能性的研究用、原发性人类癌症的染色质可及 性图谱绘制96、人体胎儿细胞染色质可及性图谱绘制97、人类基因组单细胞染色质可及性 图谱绘制网、系统性红斑狼疮患者免疫细胞染色质可及性变化研究99等。13早先的研究对于细胞的注释主要依赖细胞中编码以及非编码基因的高低表达谱。例 如,目前经典的单细胞转录组测序可以对细胞进行分群与注释。但随着研究的深入发现,由于基因的表达调控受到多个层次的调控,而单纯的转录组学信息并不能较好地反映细胞 的真实状态,因此不能较为准确地进行细胞注释口时。随着单细胞测序技术的发展,开发了单细胞ATAC-seq技术(sc-ATAC-seq),通过该 技术绘制了胶质母细胞瘤的单细胞染色质可及性图谱,并进一步确定了与较低生存率相关 的侵袭性癌症干细胞群口2020年华盛顿大学Jay Shendure等人在妊娠中期获得的人类 胚胎器官组织样本,之后利用sc-ATAC-seq技术分析了约80万个人体胎儿单细胞的染色质 可及性,并绘制了人类胚胎单细胞可及性图谱,建立了目前已经发表的世界上最大规模的 单细胞染色质可及性数据库,为揭示人体发育与疾病提供了表观遗传层面的理论基础9
展开阅读全文