资源描述
1. 原核基因组与真核基因组(prokaryotic genomes and eukaryotic genomes)
■ 大小(size):原核生物的一般都比较小,且变化范围也不大(最大/最小约为20)。
真核生物的一般要比原核生物的大很多,且变化范围也很大(最大/最小可达8万)
n 基因结构(gene structure: continuous coding sequences, split genes)
原核基因组:环状,较小;通常由单拷贝或低拷贝(low-copy)的DNA序列组成;基因排列紧密,较少非编码序列 —— “streamlined”
真核基因组:多线状;大小一般要比类核基因组大好几个数量级,且变化范围很大;有大量的非编码序列(重复序列、内含子等)
n 非编码序列(non-coding sequences: repeated sequences, introns)
局部分布的重复序列(localized repeated sequences):串联式(tandem)的高度重复序列(highly repeated sequences):重复单位的长度从几bp到几百bp,可重复几十万次或更多,常见于着丝粒、端粒和异染色质区域
散布的重复序列(dispersed repeated sequences):
短的散布式重复序列(short interspersed elements, SINEs):500 bp以下,可重复10^5次或更多,很多SINEs都是反转录转座子(retroposon);长的散布式重复序列(long interspersed elements, LINEs):5 kb以上,可重复10^4次或更多,很多LINEs也是与反转录转座子相关的序列
内含子(intron):I 类(group I intron)、II 类(group II intron)、III 类(group III intron)、核mRNA内含子(nuclear mRNA intron),即剪接体内含子(spliceosomal intron)、核tRNA内含子(nuclear tRNA intron)、古细菌内含子(archaebacterial intron)
n 细胞器基因组(organelle genomes: mitochondrial genomes, chloroplast genomes)
线粒体基因组:在不同类型的生物中变化很大
多细胞动物:细小、致密,没有或很少非编码序列
高等植物:复杂、不均一,比动物的大得多
原生动物、藻类、真菌:或偏向于动物型,或偏向于植物型,但又有其各自的独特之处
叶绿体基因组:
比较均一,85 ~ 292 kb(大部分都在120 ~ 160 kb之内)
2. 转录(transcription)
(1)RNA聚合酶(RNA polymerase)
原核生物:1种,全酶(holoenzyme)由核心酶与s亚基组成,s亚基的作用
真核生物:3种,由多个亚基组成
cis- 顺式、同一分子 trans- 反式、不同分子
in vivo 体内、细胞内 in vitro 体外、无细胞体系
in situ 原位 in silico 基于生物信息学的研究体系
sense strand有义链)= nontemplate strand
antisense strand(反义链)= template strand
(2)顺式作用元件与反式作用因子(cis-acting elements and trans-acting factors)
启动子(promoters)、增强子(enhancers)为顺式作用元件
原核启动子:-10 box (Pribnow box), -35 box
真核启动子:I类, II类,III类
RNA聚合酶I识别的启动子(I类启动子,class I promoters)
RNA聚合酶II识别的启动子(II类启动子,class II promoters)
RNA聚合酶III识别的启动子(III类启动子,class III promoters)
增强子:较多在真核生物中存在;能增强转录的元件,但又不是启动子的一部分(无位置、方向的限制),增强子常在启动子的上游,但也可以在基因内部(如内含子中)
转录因子(transcription factors)为反式作用因子,真核基因的转录需反式作用因子
通用转录因子能使聚合酶结合到启动子上,形成预起始复合物(preinitiation complex),包括形成开启的启动子复合物(open promoter complex),但只能导致基础水平的转录
通用转录因子: I类, II类,III类
II类因子:Polymerase II 转录所需的通用转录因子
II类预起始复合物:包含有RNA聚合酶II及6种通用转录因子:TFIIA、TFIIB、TFIID、TFIIE、TFIIF、TFIIH。TFIID在TFIIA的协助下,首先结合到TATA box,形成DA复合物,然后TFIIB再结合上去。
TFIIF协助Polymerase II结合到DNA链上(-34至+17区域)
TFIIHE、TFIIH结合到复合物体中,形成DABPolFEH预起始复合物
TFIID的结构及功能:TFIID本身是一个复合物,含1个TATA box结合蛋白(TATA box-binding protein, TBP)和8 ~ 10个TBP相联因子(TBP-associated factors, TAFs, or TAFIIs)TATA box结合蛋白(TBP):序列非常保守的一种蛋白质(约38 kD),包含180个氨基酸的羧基末端,该末端是TATA box结合域(binding domain)、TBP 是马鞍形的,结合到DNA双螺旋的小沟上,能使TATA box弯曲80°
TBP相联因子(TAFIIs ):至少有8种,序列上也相当保守
主要功能:促进转录、与启动子的元件相互作用(起始子、下游元件)、与基因特异转录因子相互作用、TAFIIs中的TAFII250还有酶的功能,如作为组蛋白乙酰转移酶
TFIIA:在酵母中有2个亚基,在果蝇和人中有3个亚基;TFIIA可以看成是一种TAFII(与TBP结合,能稳定TFIID与启动子之间的结合);在体外体系中,TFIIA并非必不可少
TFIIB:单亚基的因子(35 kD);能把TFIID与TFIIF/Pol II相连在一起,即是聚合酶II结合到预起始复合物所必需的;能与一些基因特异转录因子相互作用,促进转录
TFIIF的结构及功能:由2条多肽构成:RAP30与RAP70(RAP stands for RNA polymerase II-associated protein);RAP30与E. coli的s因子有一定的同源性,能使TFIIF结合到Pol II;FIIF与Pol II结合后,能减少聚合酶与DNA之间非特异的相互作用,引导聚合酶到已结合有TFIID、TFIIA和TFIIB的启动子上
TFIIE:有2个亚基(56 kD, 34 kD),每个亚基在TFIIE中都有2个拷贝(总分子量约为200 kD);能结合到DABPolF的复合体上,对转录有促进作用
TFIIH:最后一个结合到预起始复合物的通用转录因子,结构、功能均复杂
功能之一是使Pol II最大一个亚基的羧基末端域(CTD)磷酸化,即使Pol IIA变为Pol IIO,从而导致转录起始到转录延伸过渡;具有DNA解螺旋酶(helicase)的活性,这是聚合酶离开启动子往前转录(promoter clearance)所需的
I类因子(class I factors):Polymerase I 转录所需的通用转录因子
I类预起始复合物:RNA聚合酶I和2种通用转录因子(I类因子):SL1、UBF(上游结合因子,upstream-binding factor)
SL1
由TBP(TATA box结合蛋白)与3种TAFs(TAFIs,TBP相联因子)组成的复杂蛋白质
SL1并不直接与启动子结合,但它能加强UBF与启动子的结合,促进预起始复合物的形成
SL1还是rRNA基因转录的物种特异性的决定因素之一
UBF
由2条多肽构成(97 kD和94 kD),而97 kD的多肽即具UBF的活性
能与I类启动子的核心元件及UCE(上游控制元件)的位点结合,再与SL1一起,促进转录
III类因子(class III factors):Polymerase III 转录所需的通用转录因子,有TFIIIA、TFIIIB、TFIIIC
TFIIIB和TFIIIC是所有在基因内部有III类启动子的基因的转录所需的,5S rRNA基因的转录还需要TFIIIA
TFIIIA
一类含“锌指”(zinc finger)的DNA结合蛋白的成员;锌指是4个氨基酸与1个Zn离子结合,再加上其他的氨基酸,构成手指状;在TFIIIA中, 4个氨基酸是cys-cys-----his-his,一连9个锌指;锌指能使蛋白质与DNA紧密结合
TFIIIB和TFIIIC:两者是一起共同起作用的
TFIIIC结合到基因内部的启动子中(如果是5S rRNA基因,则先有TFIIIA结合到启动子区),再帮助TFIIIB结合到启动子上游区(转录起始位点上游),而TFIIIB则帮助Pol III结合在起始位点周围;转录开始后,TFIIIC(或TFIIIA和C)被除去,而TFIIIB留在原位,可促进另一轮的转录
具外部启动子的基因的转录因子
TFIIIB含有TBP(TATA box结合蛋白)及一些TAFIIIs,可结合到启动子的TATA box,从而促进转录,可能还需要其他一些通用转录因子
TBP在3类转录因子中的作用
与TATA box结合,组织预起始复合物(特别是对于没有TATA box 的启动子),促进转录
基因特异转录因子(激活子)
(1)基本结构:一般有2个功能域即DNA结合域(DNA-binding domain)和转录激活域(transcription-activating domain);许多激活子还有二聚体化域(dimerization domain)
DNA结合域的结构
锌指(zinc fingers):不少激活子(如Sp1)都有该结构,锌指结构一般连续出现多次,由1个a-螺旋与1反向平行的b层片构成, a-螺旋上的2个AA和b层片上的2个AA与1个Zn离子结合,“指”上(a-螺旋上)的某些AA就决定了其与DNA结合的特异性
GAL4 蛋白质(the GAL4 protein):酵母中的一种激活子,DNA结合域与锌指相似,但含有6个半胱氨酸和2个锌离子,有一个与DNA进行识别的区域(a-螺旋),决定其与DNA结合的特异性
核受体(the nuclear receptors):与甾体激素相互作用,组成激素-受体复合物,起激活子的作用,核受体的DNA结合域含有2个锌离子,每一个锌离子分别与4个半胱氨酸结合,参与形成一指状结构,其中一“指”(氨基末端的“指” )上有专门用于识别DNA特异序列的a-螺旋
同源异形域(homeodomains):在很多激活子中都存在,由基因中的同源异形框(homeobox)编码,而同源异形框一般是基因中的一个外显子,约180 nt,编码60AA,十分保守; 同源异形框最初在果蝇的发育调节基因中发现,这些基因的突变称为同源异形突变(homeotic mutation),会引起躯体结构的重大改变;含同源异形框的基因又称为同源异形基因(homeotic genes, homeobox-containing genes)
每个同源异形域含3个a-螺旋,第二、第三个形成一种“螺旋-转折-螺旋”(helix-turn-helix)结构,而第三个螺旋起到识别DNA特异序列的作用;另外,同源异形域的氨基末端也插入到DNA的小沟中
bZIP和bHLH域:又称碱性域(the basic domain),能与DNA结合及形成二聚体;b表示碱性区;ZIP表示亮氨酸拉链(leucine zipper);HLH表示“螺旋-环-螺旋”(helix-loop-helix)
bZIP:每个单体构成亮氨酸拉链的一半:在一条a-螺旋中,每7个AA就有1个leucine,因而leucine都在螺旋的一面;2个单体相互作用,就可构成一条“拉链”;与DNA结合的部分是“拉链”下的碱性区,它们必须在bZIP形成二聚体后,才能与DNA特异识别、结合
bHLH:与DNA的复合体结构和bZIP-DNA复合体相似;helix-loop-helix为二聚体化域;较长的螺旋有碱性区,能与DNA特异结合
转录激活域似乎无特定且明显的结构,但可分3类:
酸性域(acidic domains):富含酸性氨基酸,如酵母GAL4的激活域
富含谷氨酰胺域(glutamine-rich domains):富含谷氨酰胺,如Sp1中的2个激活域
富含脯氨酸域(proline-rich domains):富含脯氨酸,如CTF中的激活域
(2)激活子的功能
1、促进通用转录因子结合到启动子上(促进TFIID结合到启动子(预起始复合物)、促进TFIIB结合到预起始复合物、促进TFIIF/Pol II、TFIIE结合到预起始复合物)
2、促进RNA聚合酶II的全酶(holoenzyme)结合到启动子,形成完整的预起始复合物
3、至少在一些基因中,激活子通过促进整个全酶结合到启动子区域而激活转录
4、激活子是使增强子能远距离作用的原因
4种可能性(第三、四种可能性较符合实际情况):Coiling (change in topology)、Sliding、Looping、Facilitated tracking (looping and tracking)
(3)多顺反子转录与单顺反子转录
多顺反子转录是原核生物的转录方式:操纵子(operons)Operon: A group of contiguous, coordinately controlled genes
经典模型:乳糖操纵子(the lac operon)有:lacZ: b-半乳糖苷酶( b- galactosidase)基因、lacY: 半乳糖苷透过酶(galactoside permease)基因、lacA: 半乳糖苷乙酰基转移酶( galactoside transacetylase)基因、lacI: 调节基因(regulatory gene)、Operator: 操纵区、Repressor: 阻遏子(阻遏物)、Inducer: 诱导物(异构乳糖,allolactose)
通过阻遏基因(阻遏物)与操纵区,lacZ、lacY、lacA这3个结构基因是一起被调控的,它们组成了一个操纵子(the lac operon)
阻遏的机制(两种假说)
聚合酶与阻遏物可一起结合在lac operon的启动子区,阻遏物的作用只是阻止转录从起始状态进入延伸状态
阻遏物的作用是不让RNA聚合酶进入lac operon的启动子(得到最新实验数据的支持)
阻遏物的调控是负调控(代谢物阻遏效应(catabolite repression))
乳糖操纵子的调控还需正调控因子
cAMP在细胞中的浓度与葡萄糖的含量成反比,它与一种称为代谢物激活蛋白(catabolite activator protein,又称CAP)一起,起到正调控作用。CAP-cAMP的结合位点在启动子的上游(与启动子紧密相邻),该位点称为激活物位点。CAP-cAMP结合到激活物位点后,就会促进RNA聚合酶与DNA形成open promoter complex( CAP-cAMP 能加快closed promoter complex的形成,从而提供了更多形成open promoter complex 的机会),结果是促进转录。
乳糖操纵子的正调控
乳糖操纵子的启动子实际上是一种弱启动子,其 -35 box与原核启动子相应的共同序列相差甚大,因此才需要CAP-cAMP进行正调控;如果是强启动子(与共同序列十分相近),则不需要正调控,但这种情况会使得即使葡萄糖存在,乳糖操纵子也一样运作。
弱化作用的调控:色氨酸操纵子(the trp operon)
合成代谢的操纵子,所编码的酶能把色氨酸前体分枝酸(chorismic acid)转化为色氨酸。色氨酸浓度高,则关闭;色氨酸浓度低,则开启;具弱化子(attenuator),无CAP-cAMP调控
色氨酸操纵子有5个结构基因(EDCBA)及1个调节基因(R);启动子(trpP)与操纵区(trpO)在结构基因的上游,且操纵区完全在启动子里面;在调控中,色氨酸的作用是帮助阻遏物结合到操纵区,从而使操纵子关闭
弱化作用(attenuation)
在阻遏作用的基础上(色氨酸操纵子的阻遏作用较弱),能再降低转录水平10 倍
前导区与弱化子转录物的第一种较稳定的结构有一终止子(r-independent terminator),能使弱化作用发生,转录终止
转录物的第二种较不稳定的结构没有终止子,转录能继续
色氨酸的多寡决定形成哪一种结构(在转录与翻译偶联的情况下)
在细菌中,当色氨酸操纵子的前导区转录后,翻译就开始
核糖体到达色氨酸密码子时,若色氨酸缺乏,核糖体不能前进,翻译受阻,前导区与弱化子转录物只能形成第二种结构;结构基因能转录;若色氨酸充足,前导肽的翻译能顺利完成,前导区与弱化子转录物能形成第一种较稳定的结构,导致弱化作用发生
调控能达成的必要条件
转录与翻译偶联,且速率大致相等
每个结构基因的转录产物都有其起始密码子,核糖体从各个基因的mRNA的起始信号(密码子)开始翻译,即结构基因的翻译与前导序列的翻译无关
细菌能符合这样的要求,说明其体系中各组分的协调性
单顺反子转录是真核生物的主要转录方式
(4)转录起始、延伸及终止
起始所需条件
原核生物:RNA聚合酶全酶,启动子
RNA聚合酶(RNA polymerase):a(40 kD)、b(150 kD), b‘(160 kD)、s(70 kD):specificity factor
核心酶(core enzyme):b, b‘,2 a,全酶(holoenzyme): b, b‘,2 a,s
s: specificity factor
全酶(holoenzyme)由核心酶与s亚基组成
启动子(promoter):聚合酶的结合位点(binding site),一般位于转录起始位点上游
Promoter structure
共同序列(consensus sequence):Pribnow box (-10 box, David Pribnow发现)、-35 box(-10 box与-35 box的最佳距离为17 ± 1 bp)
下调突变(down mutation) 上调突变(up mutation)
强启动子还有一些额外的元件,如E. coli编码rRNA的rrn gene中的UP element(上游元件),可提高表达数十倍
转录起始(transcription initiation)Four steps:
Formation of a closed promoter complex
Conversion of the closed promoter complex to an open promoter complex
Polymerizing the first few nucleotides (up to 10) while the polymerase remain at the promoter
Promoter clearance
真核生物:RNA聚合酶,启动子,转录因子,染色质的合适结构(启动子区无核小体)
RNA聚合酶I (Polymerase I): large rRNA precursor,位于核仁
RNA聚合酶II (Polymerase II): mRNA precursors, snRNAs,位于核质
RNA聚合酶III(Polymerase III):tRNA precursors, 5S rRNA precursor, U6, etc位于核质
Polymerase I、II、III都由多个亚基组成:均有两个较大的亚基(> 100 kD)、另有多个较小的亚基(大部分 < 50 kD),三种聚合酶都有一些共有亚基(common subunit)
RNA聚合酶II的结构:研究得比较清楚的一种,有12个亚基(Saccharomyces cerevisiae中)即Rpb1、 Rpb2、 Rpb3、 Rpb4、 Rpb5、 Rpb6、 Rpb7、 Rpb8、 Rpb9、 Rpb10、 Rpb11、 Rpb12
核心亚基(core subunits):Rpb1, Rpb2, Rpb3,对聚合酶的活性必不可少,分别与原核RNA聚合酶的b’, b和a亚基同源,且功能也基本相同(Rpb3在聚合酶中也是有2个拷贝)
核心亚基Rpb1的特殊之处-------不均一性(heterogeneity):在细胞内,有210 kD和240 kD两种形式(IIa和IIo);在体外,还有180 kD这种形式(IIb)
共有亚基(common subunits):与Rpb5, Rpb6, Rpb8, Rpb10, Rpb12相应的亚基,在3种 RNA聚合酶中都存在,在3种聚合酶中都存在,说明它们是起着十分重要的作用,但具体的功能不很清楚
非必需亚基(nonessential subunits):Rpb4, Rpb9,其基因的突变体在正常温度下仍有活力,但在较高或较低温度下则失去活力;Rpb4和Rpb7(必需的亚基)与启动子的识别有关(有点像s因子)、Rpb9的功能不甚清楚
Rpb7和Rpb11:另类亚基(不属于上述3类)、RNA聚合酶的活性所需(Rpb7与启动子的识别有关)
RNA聚合酶II的全酶(the polymerase II holoenzyme):RNA聚合酶II的所有亚基 + 部分通用转录因子 + 其他一些蛋白质因子
真核生物的启动子:
II类启动子:与原核基因的启动子最相似,可含有四类元件(TATA区(TATA box)、起始子(initiator)、下游元件(downstream element)、上游元件(upstream element)),前三类是核心启动子(core promoter)的元件
TATA区(the TATA box):位于转录起始位点上游约25 bp(以中部计,在酵母中可达50 ~ 70 bp),共同序列为TATAAAA(in the nontemplate strand, similar to prokaryotic -10 box)
功能:确定转录起始位点(一般是TATA区的第一个核苷酸后30 bp);有时甚至是决定整个启动子是否有作用
有些基因的TATA区序列与其共同序列相差较大,而只在某些类型的细胞中才表达的基因则有明显的TATA区
有些基因甚至没有TATA区(看家基因(housekeeping genes)、控制发育的基因)
起始子(initiator):转录起始位点前后的保守序列,共同序列为:PyPyANT/APyPy(Py: pyrimidine、N: any nucleotide、A: transcription start point)
有些基因仅有起始子序列作为其启动子
下游元件(downstream element):某些基因的启动子中存在、位于转录起始位点下游,无共同序列
上游元件(upstream element):在TATA区的上游:GC boxes:富含G和C,如GGGCGG(-47 ~ -61 region, in the coding strand)和CCGCCC(-80 ~ -105 region),可有2个或更多的拷贝、CCAAT box:共同序列为CCAAT
I类启动子:变化较II类启动子大,无甚保守序列(即随物种而异);有一定的结构特征(核心元件(core element),转录必不可少、上游控制元件(upstream control element, UCE),高效转录所需,核心元件与上游控制元件之间的距离很重要)
III类启动子:位于基因内部(5S rRNA基因(+50 ~ +83)、tRNA基因);位于基因外部,类似RNA聚合酶II识别的启动子(含TATA box)(U6 snRNA基因\7SL RNA基因\7SK RNA基因)
延伸
原核生物: RNA聚合酶核心酶
核心酶起极其重要的作用,b亚基参与转录出的RNA的磷酸二酯键的形成
转录的拓扑学:两种假说
RNA polymerase 及新合成的RNA都围绕DNA旋转
RNA polymerase前后的DNA反向旋转(有较多的依据:拓扑异构酶topoisomerase的存在)
真核生物:RNA聚合酶,延伸因子等
延伸因子:TFIIS,能促进转录延伸,阻止聚合酶在转录过程中较长时间的暂停;TFIIF,也有阻止聚合酶短暂停止的功能,
RNA聚合酶II的全酶:RNA聚合酶II所有亚基+部分通用转录因子+其他一些蛋白质因子
终止
原核生物:依赖于r因子的终止(r-dependent terminator (termination))和不依赖于r因子的终止(intrinsic (r-independent) terminator )
聚合酶到达终止子(terminator)就会从模板上脱落
r-independent termination:较为简单,一段反向重复序列(inverted repeat)与一富含T的区域(T-rich region in the nontemplate strand)即为终止信号
r-dependent termination:终止子只有一段反向重复序列(能形成hairpin结构);r是一种蛋白质(6聚体),可使RNA聚合酶的转录能力大大下降(具RNA-DNA解螺旋酶的作用,能解开转录复合体中RNA-DNA双链)
真核生物:比较复杂,且不如原核生物清楚
polymerase I与polymerase III的转录终止与原核生物有一定的相似性
polymerase II的转录在聚腺苷酸化位点后至少几百bp才终止
染色质结构对真核基因转录的影响:
若启动子区上有核小体结构,则基因不转录;若没有核小体结构,则可转录
核小体结构只由核心组蛋白(H2A, H2B, H3, H4)与DNA构成时,即能起到抑制基因转录的作用,且一般的转录激活子不能解除这种抑制;若核小体结构还含有组蛋白H1,那么其抑制基因转录的能力更强,但H1的这种作用可被转录激活子抵消
核小体定位(nucleosome positioning):转录激活子能使核小体结构不在启动子区内形成,而只在启动子周围形成;核小体定位使得启动子区成为无核小体区(nucleosome-free zones),对DNase高度敏感
组蛋白有2种形式:乙酰化、无乙酰化
组蛋白乙酰化(histone deacetylation)
乙酰化的形式是在赖氨酸侧链的氨基上加上乙酰基,组蛋白的乙酰化与否是与基因的活性有关的,乙酰化的组蛋白对转录的抑制作用较弱,因为它使染色质结构(核小体结构)发生变化,使组蛋白易从DNA上脱落;起乙酰化作用的酶是组蛋白乙酰基转移酶(histon acetyltransferase, HAT);酵母中的组蛋白乙酰基转移酶还是一种转录激活子的辅助因子,其他一些转录激活子的辅助因子也是组蛋白乙酰基转移酶
细胞核中能促进转录的组蛋白乙酰基转移酶(HAT A)与细胞质中的(HAT B)是不同的
HAT A能结合到染色质上,使核小体中的核心组蛋白乙酰化
HAT B是使细胞质中新合成出来的H3和H4乙酰化,从而使它们能正确地组装到核小体中(它们的乙酰基在组装后就会被组蛋白去乙酰化酶除去)
组蛋白去乙酰化(histone deacetylation)能抑制转录,由组蛋白去乙酰化酶(histone deacetylases)催化,组蛋白去乙酰化酶要与其他转录抑制因子相互作用,才能在合适的区域使组蛋白去乙酰化
必须对染色质进行“改造”,才能除去核小体,使基因可转录
染色质改造需要2类蛋白质:Swi/Snf (pronounced “switch-sniff”)和ISwi (initiation switch)
Swi/Snf能改变核小体核心的结构,ISwi能移走核小体
核小体与转录延伸
聚合酶前进时,能把遇到的核小体移动位置,因而转录后,所有核小体的位置都发生了改变;且在转录后,核小体一般是被后移了(移到聚合酶后)
3. 转录后的加工
(1)剪接(splicing)
核mRNA前体的剪接(剪接体):Step 1:内含子内的一个腺苷酸的2’ 羟基进攻连接内含子 5’ 端与外显子的磷酸二酯键,产生一个游离的外显子(5’ 外显子)与一个套环(lariat)结构(内含子 + 3’ 端外显子)的中间产物;Step 2: 5’ 端外显子的 3’ 羟基进攻连接内含子3’ 端与外显子的磷酸二酯键,使两外显子连接起来,并产生套环状的内含子
剪接信号:剪接信号发生变化,则剪接就会受到影响(改变)
高等真核生物:5’-AG/GUAAGU——YNCURAC—YnNAG/G- 3’
Y:嘧啶(U or C)Yn:约由9个嘧啶组成 R:嘌呤(A or G)A:形成套环结构的分枝点
酵母:5’-AG/GUAUGU——UACUAAC—YAG/G(UU)- 3’
剪接体(spliceosomes):核mRNA前体、snRNAs (snuRNAs)与蛋白质的复合体,能进行核mRNA前体的剪接;snRNAs (snuRNAs): small nuclear RNAs,即核小分子RNA,有U1, U2, U4, U5, U6;snRNAs是用于识别剪接信号的,它们与蛋白质一起,组成核小分子核糖核蛋白(small nuclear ribonuclear proteins, snRNPs);与snRNAs相应,有U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNP
U1 snRNP:能与 5’ 剪接位点的保守序列配对,这种配对(结合)是剪接所必需的,但光有配对还不足以促成剪接
U6 snRNP:能与内含子的5’ 端配对,在剪接过程中还与U2配对,这些结合都是剪接所必需的
U2 snRNP:能与分枝位点周围的序列配对,且能与U6相互作用(通过碱基配对),对确定分枝位点及剪接都是必不可少的
U5 snRNP:能与 5’ 端外显子的最后一个核苷酸和 3’ 端外显子的第一个核苷酸结合,即能通过分子间相互作用把相邻的两个外显子靠在一起,是剪接的第二步所必需的
U4 snRNP:能与U6的部分序列配对,从而与U6结合在一起,使U6处于不活动状态;当U6需要发挥作用时,U4便与U6分离,使U6能参与剪接过程
实际上,剪接除了需要U1,U2,U4,U5,U6这几种snRNPs外,还需要一些称为剪接因子的蛋白质
选择性剪接(alternative splicing):非特异的、默认的、唯一的剪接方式是组成型剪接(constitutive splicing);一个基因转录出来的RNA前体,通过不同的剪接方式(选择不同的外显子)而形成不同的成熟mRNA,产生不同的蛋白质
选择性剪接往往与发育时期、细胞类型等有关,在20个真核mRNA前体中,约有1个可进行选择性剪接,在人类中,选择性剪接的比例更高,选择性剪接最初在小鼠免疫球蛋白 m重链基因中发现,该基因通过选择性剪接,可产生分泌形式(ms)与膜结合形式(mm)的2种蛋白质
通过选择性剪接,可对基因的表达起一定的调控作用,因此选择性剪接常用于在不同的组织或发育时期产生组织特异或调控发育的蛋白质
选择性剪接还可有重要的生物学效应,如在果蝇的性决定体系中起重要的作用
n 自剪接的内含子(self-splicing introns)
最初由Thomas Cech等人在四膜虫(Tetrahymena) 的26S rRNA基因中发现;该基因转录的rRNA前体有1个内含子,而其剪接不需要剪接体,也不需要任何蛋白质的帮助,因此是一种自剪接;自剪接的内含子在核rRNA基因、细胞器基因和原核基因中都存在
I 类内含子(Group I introns):一般都是核rRNA基因的内含子(主要在纤毛虫中),还有一些是线粒体基因、叶绿体基因及细菌基因的内含子,在体内也进行自剪接
I 类内含子的剪接机制:Step 1:外源鸟苷酸(GTP)的羟基进攻内含子 5’端的A(连结UA的磷酸二酯键),释放出5’外显子(外显子1),并形成一中间产物 Step 2:5’外显子3’端的羟基进攻3’外显子(外显子2)5’端的磷酸二酯键,使5’外显子与3’外显子连结起来,并释放出内含子
II 类内含子(Group II introns):主要存于线粒体基因、叶绿体基因及细菌基因中,在体外条件下可自剪接,在体内往往有蛋白质参与剪接;剪接机制与核mRNA内含子的有很大的相似性(形成套环中间产物等)
总体上,剪接过程与剪接体的很相似:内含子本身的序列代替了U1、U2、U4、U5、U6
实际上,核mRNA内含子(包括参与剪接的snRNA)与II 类内含子是有进化关系的
n 核tRNA内含子的剪接
核tRNA内含子:内含子较小(10 bp左右),且只有1个,一般在相应于反密码子的碱基附近(与反密码子的 3’端隔1个核苷酸)
tRNA剪接(tRNA splicing):分2步进行,需要tRNA内切酶及RNA连接酶的参与
Step 1:由剪接内切酶把内含子切除Step 2:由RNA连接酶把两个外显子连接起来
(2) 加帽与聚腺苷酸化(capping and polyadenylation):真核生物mRNA特有
加帽(capping):
帽子结构:含7-甲基鸟苷(m7G),主要有3种形式
第一种(Cap 0):只在一些病毒mRNA中存在,无2’-O-甲基核苷酸
第二种(Cap 1):在真核细胞及病毒mRNA中存在,有1个2’-O-甲基核苷酸
第三种(Cap 2):只在真核细胞中存在,有连续2个2’-O-甲基核苷酸
帽子的合成:需要3种酶;核苷酸磷酸水解酶(nucleotide phosphohydrolase;又称RNA三磷酸酯酶,RNA triphosphatase);鸟苷酸转移酶(guanylyl transferase);甲基转移酶(methyl transferase)
加上帽子的时间:在一些病毒中,转录起始后就马上加帽;有些病毒的转录与加帽并不偶联;在真核细胞中,加帽在转录早期进行(在RNA前体的长度达到30个核苷酸之前)
帽子的功能:保护mRNA:一般的RNase不能切割含有3个磷酸基的帽子;提高翻译能力(效率):通过与帽子结合蛋白结合,mRNA能更好地进入核糖体;有利于mRNA在细胞内的运输(运出细胞核):若没有帽子,则mRNA基本上留在细胞核;使mRNA前体的能正确剪接:第一个内含子的剪接所需
帽子对剪接的影响:缺乏帽子会抑制第一个内含子的剪接,无甲基化的帽子(Gppp)对第一个内含子的剪接也有负效应
原因是由于帽子结合复合体(cap-binding complex,
展开阅读全文