资源描述
原核生物和真核生物中基因的转录、翻译和后修饰
摘要:原核生物和真核生物中基因的转录、翻译和后修饰,是各种功能蛋白质生物合成的一系列程序。本文通过介绍了原核生物和真核生物中基因的转录、翻译和后修饰的机制、原理、过程,从而了解真核生物和原核生物的基因表达和功能蛋白质合成上的差异。
关键词: 原核生物 真核生物 基因 转录 翻译 后修饰
0引言:
21世纪,基因水平上的研究受到人们广泛的关注。原核生物和真核生物中基因的转录、翻译和后修饰是基础研究,人们也只有在此基础不断扩散深入研究其它基因水平问题。本文只简单介绍了一些关于基因转录、翻译和后修饰的一部分相关研究成果。
1 原核生物和真核生物中基因的转录:
基因转录是在由RNA聚合酶和辅助因子组成的转录复合物的催化下,从双链DNA分子中拷贝生物信息生成一条RNA链的过程。转录中,一个基因会被读取被复制为mRNA,就是说一特定的DNA片断作为模板,以DNA依赖的RNA合成酶作为催化剂的合成前体mRNA的过程。转录产物主要有三类RNA,即信使RNA(mRNA)、核糖体RNA(rRNA)和转移RNA(tRNA)。在基因转录过程中,RNA聚合酶起着非常重要的作用。RNA聚合酶可以催化所有四种核苷- 5′-三磷酸(ATP、GTP、UTP和CTP)聚合成与模板DNA互补的RNA。此反应需要Mg2+,反应中释放焦磷酸。[1]该酶在转录的各个过程中发挥了不同的作用。
1.1 基因转录的启动
RNA聚合酶正确识别DNA模板上的启动子并形成由酶、DNA和核苷三磷酸构成的三元起始复合物,转录便开始进行。启动子是DNA分子上可与RNA聚合酶特异结合,而使转录开始的一段DNA序列而本身不被转录。DNA模板上的启动区域常含有TATAATG顺序,称P盒。复合物中的核苷三磷酸一般为GTP,少数为ATP,因而原始转录产物的5′端通常为三磷酸鸟苷(pppG)或腺苷三磷酸(pppA)。真核 DNA上的转录启动区域也有类似原核DNA的启动区结构,和在-30bp(即在酶和 DNA结合点的上游30核苷酸处)附近也含有TATA结构,称TATA盒。[3]第一个核苷三磷酸与第二个核苷三磷酸缩合生成3′-5′磷酸二酯键后,则启动阶段结束,进入延伸阶段。
1. 2 基因转录的延伸
σ亚基脱离酶分子,留下的核心酶与 DNA的结合变松,因而较容易继续往前移动。核心酶无模板专一性,能转录模板上的任何顺序,包括在转录后加工时待切除的居间顺序。脱离核心酶的σ亚基还可与另外的核心酶结合,参与另一转录过程。随着转录不断延伸,DNA双链顺次地被打开,并接受新来的碱基配对,合成新的磷酸二酯键后,核心酶向前移去,已使用过的模板重新关闭起来,恢复原来的双链结构。一般合成的 RNA链对DNA模板具有高度的忠实性。
1 .3 基因转录的终止
转录的终止包括停止延伸及释放 RNA聚合酶和合成的 RNA。在原核生物基因或操纵子的末端通常有一段终止序列即终止子; RNA合成就在这里终止。原核细胞转录终止大多数需要一种终止因子ρ的帮助。真核生物 DNA上也可能有转录终止的信号。已知真核DNA转录单元的3′端均含富有AT的序列〔如AATAA(A)或ATTAA(A)等〕,在相隔 0~30bp之后又出现TTTT顺序(通常是3~5个T),这些结构可能与转录终止或者与3′端添加多聚A顺序有关。
1. 4 原核生物和真核生物基因转录的差异
真核生物与原核生物基因的转录过程基本上是相同的,但仍有一些区别,主要有以下几点:
1.原核生物的转录和翻译几乎同时进行,而真核生物的转录在胞核,翻译在胞浆。
2.原核生物中只有一种RNA聚合酶催化RNA的合成,而在真核生物中则有RNA聚合酶Ⅰ、RNA聚合酶Ⅱ和RNA聚合酶Ⅲ三种不同酶,分别催化不同种类型RNA的合成。三种RNA聚合酶都是由10个以上亚基组成的复合酶。RNA聚合酶Ⅰ存在于细胞核仁内,催化合成除5SrRNA以外的所有rRNA的合成;RNA聚合酶Ⅱ和RNA聚合酶Ⅲ均存在于细胞核质内,RNA聚合酶Ⅱ催化合成mRNA前体,即不均一核RNA(hnRNA)的合成,而RNA聚合酶Ⅲ催化tRNA和小核RNA的合成。[1]
3.真核和原核生物的在起始点识别和转录终止的方式也有所不同,在前面基因过程中有所介绍。
2 原核生物和真核生物的翻译
基因的遗传信息在转录过程中从DNA转移到mRNA,再由mRNA将这种遗传信息表达为蛋白质中氨基酸顺序的过程叫做翻译,即蛋白质的生物合成。现研究证明:mRNA的翻译是从mRNA的5′端向3′进行的。所有蛋白质的翻译开始于甲硫氨酸的参与,一个特殊的起始tRNA对所有蛋白质合成中起始氨基酸-甲硫氨酸的掺入负责,这个tRNA可简写为tRNAiMet,它也对选择在mRNA上在什么位置开始翻译起重要作用。[2]翻译即蛋白质的生物合成的过程大致为:(1)氨基酸的激活;(2)肽链合成的起始;(3)肽链的延长;(4)肽链合成的终止和释放。
2.1 氨基酸的激活
tRNA在氨基酰-tRNA 合成酶的帮助下,能够识别相应的氨基酸,并通过tRNA氨基酸臂的 3'-OH 与氨基酸的羧基形成活化酯-氨基酰-tRNA。氨基酰-tRNA的形成是一个两步反应过程:第一步是氨基酸与 ATP 作用, 形成氨基酰腺嘌呤核苷酸; 第二步是氨基酰基转移到 tRNA 的 3'-OH 端上, 形成氨基酰-tRNA。一般说来,各种氨基酸需要各自专一的合成酶来激活,原核细胞大体如此,真核细胞则每种氨基酸有一个以上专一的合成酶。在合成酶的作用下,氨基酸被激活且转移到tRNA分子上。
2.2肽链合成的起始
在蛋白质生物合成的起始阶段,核糖体的大、小亚基,mRNA与甲酰甲硫氨酰tRNAimet共同构成70S起始复合体。这一过程需要一些称为起始因子(initiation factor,简称IF)的蛋白质以及GTP与镁离子的参与。已知原核生物中的起始因子有3种。IF3可使核糖体30S亚基不与50S亚基结合,而与mRNA结合,IF1起辅助作用。IF2特异识别甲酰甲硫氨酰tRNAiMet,可促进30S亚基与甲酰甲硫氨酰tRNAiMet结合,在核糖体存在时有GTP酶活性。起始阶段可分两步:先形成30S起始复合体,再形成70S起始复合体。
(一)30S起始复合体的形成:
原核生物mRNA的5′端与起始信号之间,相距约25个核苷酸,此处存在富含嘌呤区(如AGGA或GAGG),称为Shine-Dalgarno(SD)序列。核糖体30S亚基的16S rRNA有一相应的富含嘧啶区可与SD序列互补。由此,30S亚基在IF3与IF1的促进下,与mRNA的起始部位结合。IF2在GTP参与下可特异与甲酰甲硫氨酰tRNAiMet结合,形成三元复合物,并使此三元复合物中tRNA的反密码子与上述30S亚基上mRNA的起始密码子互补结合,形成30S起始复合体。所以,30S起始复合体是由30S亚基、mRNA、甲酰甲硫氨酰tRNAiMet及IF1、IF2、IF3与GTP共同构成。
(二)70S起始复合体的形成:
30S起始复合体一旦形成,IF3也就脱落,50S亚基随即与其结合。此时复合体中的GTP水解释出GDP与无机磷酸,使IF2与IF1也都脱落,形成了70S起始复合体。70S起始复合体的形成,表明蛋白质生物合成的起始阶段已经完成,已可进入肽链延长阶段。70S起始复合体由大、小亚基,mRNA与甲酰甲硫氨酰tRNAiMet共同构成。
2.3 肽链的延长
这一阶段,与mRNA上的密码子相适应,新的氨基酸不断被相应特异的tRNA运至核糖体的受位,形成肽链。同时,核糖体从mRNA的5’端向3’端不断移位以推进翻译过程。一般有以下过程:(1)进位(氨酰tRNA进入A位点),此过程参与因子有:延长因子EFTu(Tu)、EFTs(Ts)、GTP、氨酰tRNA。(2)肽链的形成:肽酰基从P位点转移到A位点,形成新的肽链。(3):移位:在移位因子(移位酶)EF-G的作用下,核糖体沿mRNA(5’-3’)作相对移动,使原来在A位点的肽酰-tRNA回到P位点。
2.4肽链合成的终止和释放
终止阶段包括已合成完毕的肽链被水解释放,以及核糖体与tRNA从mRNA上脱落的过程。这一阶段需要GTP与一种起终止作用的蛋白质因子—释放因子(release factor,RF)的参与。原核生物的RF有3种。RF1识别终止信号UAA或UAG,RF2识别UAA或UGA,RF3可与GTP结合,水解GTP为GDP与磷酸,协助RF1与RF2。RF使大亚基“给位”的转肽酶不起转肽作用,而起水解作用。转肽酶水解“给位”上tRNA与多肽链之间的酯键,使多肽链脱落。RF、核糖体及tRNA亦渐次脱离。从mRNA上脱落的核糖体,分解为大小两亚基,重新进入核糖体循环。核糖体大小亚基解离状态的维持需要IF3。
2.5原核生物和真核生物翻译的差异[1]
真核生物和原核生物的翻译机制非常相似,但并不相同。真核生物翻译过程涉及因子多,起始复合物形成较复杂。以下简要说明几个主要区别:
1.真核生物的蛋白质合成与mRNA的转录生成不偶联,mRNA在细胞核内以前体形式合成,合成后需经加工修饰才成熟为mRNA,从细胞核内输往胞浆,投入蛋白质合成过程,而原核生物的转录与翻译几乎同时进行;
2.原核生物起始因子主要有IF1, IF2和 IF3三种,而真核生物的起始因子就有9种左右,其中elF2由3个亚基组成(2α,2β和2γ),而elF4按其参与复合物的作用不同区分为4A,4B,4C,4E,4F。而形成的复合物4F称为帽子结构结合蛋白复合物(CBPC)。
3.起始复合物形成过程的次序差异:真核生物蛋白质合成的起始过程分为三步:
43S起始复合体的形成;48S起始复合体的形成和80S起始复合体的形成。真核生物与原核生物蛋白质合成的起始阶段中,真核细胞起始的Met-tRNAi只选择mRNA起始密码AUG,而原核细胞起始密码除AUG外,还有GUG,UUG,甚至AUU也可利用;40S亚基与mRNA5′-末端接触并沿着mRNA寻找起始密码AUG,开始翻译的过程需要ATP供能。真核mRNA中AUG前的附加信号是不需要的。
3 原核生物和真核生物的后修饰
蛋白质生物合成完成后,必然要对新生蛋白质的进行加工修饰,才能转变为具有不同功能的蛋白。把某些从mRNA翻译出来的蛋白质修饰加工成能被生物体细胞利用的成熟蛋白质就叫做翻译后修饰。[6]加工修饰的类型很多,以下简单介绍四种。
3.1 N-端f-Met或Met的切除
原核生物的肽链,其N-端不保留fMet,大约半数蛋白由脱甲酰酶除去甲酰基,留下Met作为第一个氨基酸;在原核及真核细胞中fMet或者Met一般都要被除去,此是由氨肽酶水解来完成的。水解的过程有时发生肽链合成的过程中,有时在肽链从核糖体上释放以后。至于是脱甲酰还是除去fMet,这常与邻接的氨基酸有关。如第二氨基酸是Arg,Asn,Asp,Glu,Ily或Lys以脱甲酰基为主,如邻接的氨基酸是Gly,Pro,Thr或Val则常除去fMet。
3.2 二硫键的形成
两个半胱氨酸相距较远硫氢基可以氧化成二硫键,产生mRNA中没有相应密码子的胱氨酸。很多细胞外蛋白质中二硫键的形成,例如胰岛素,免疫球蛋白。
3.3 化学修饰
化学修饰是蛋白质修饰的主要方式,其修饰的类型也很多,包括磷酸化(如核糖体蛋白的Ser,Tyr和Trp残基常被磷酸化);糖基化(如各种糖蛋白);甲基化(如组蛋白,肌蛋白),乙基化(如组蛋白),羟基化(如胶原蛋白)。其中,糖基化是真核生物细胞中特有的加工,这些蛋白常和细胞信号的识别有关,如受体蛋白等。
(一)折叠:
在ER腔中折叠和修饰是有关的,糖的连接对于正确的折叠是十分必要的。蛋白二硫异构酶(protein disulfide isomerase,PDI)可以改变二硫键,影响到折叠,它和特殊的ER蛋白的结合是必须的,此酶的某些活性或全部的活性可能是酶作为ER中的一种复合体的形式来实现的。即在越膜位点和蛋白结合才能发挥它的功能。通过对折叠和寡聚物产物的计算表明折叠需要一种酶来催化,使其在细胞中迅速发生。
一个与折叠功能有关的蛋白是BiP,它是分子伴侣Hsp70家族的一个成员。BiP促使寡聚物的形成ER腔中蛋白的折叠。ER可能含有各种辅助蛋白,它们的功能是识别蛋白折叠的形态,以帮助这些蛋白产生一种构象,使其可迅速地转运到下一个目标。
大部分膜上的糖蛋白,都是寡聚物,一般在ER中寡聚,然后迅速地从ER转到高尔基体,但不装配亚基或者防止蛋白锚装配。错误折叠的蛋白常和BiP相联,在这种情况下他们会被降解掉,若折叠正确,那么就可以转运到高尔基体或继续转运。
(二)在ER中的糖基化及修整
几乎所有的分泌蛋白和膜蛋白几乎都是被糖基化的蛋白。糖基化有两种类型:(1)糖蛋白是由寡糖连接在Asp的氨基的形成的,连接的链叫N-糖苷键。(2)寡糖连接在Ser、Thr或羟基-lys的羟基上(O-糖苷键)。N-糖苷键是在ER开始,而在高尔基体中进一步完成;O-糖苷键的形成仅发生在高尔基体中。
(三)在高尔基表的进一步加工
复合寡聚糖是在高尔基体中进一步修整和加上糖的残基。第一步是通过高尔基体的甘露糖苷酶Ⅰ修整甘露糖残基。然后单个的糖基由N-乙酰-葡萄糖胺转移加上,按着由高尔基体苷露糖苷酶Ⅱ继续切除苷露糖残基。在这一位置上寡糖通过内-糖苷酶H使寡变成对降解产生抗生。
在高尔基体的修饰中都会产生内部核心,它是由NAc-Glc·NAc-GLc.Man3构成,最后要被剥去。末端区域加在内部核心下。末端区域的残基包括NAc-GLc,Gal和唾液酸(N-乙酰-神经氨[糖]酸。此加工的路径和糖基化是高度有序的。
3.4剪切
很多的前体蛋白要经过剪切后方可成为成熟的蛋白。在原核生物中常常产生一种多蛋白的前体要经剪切后才能成为成熟的蛋白,如反转录病毒中有3个基因gag,pol和env,其中pol基因长约2900NT,其产物经剪切后产生反转录酶,内切酶和蛋白酶三种蛋白。其它两个基因的产物也要经过加工才能产生核心蛋白和外壳蛋白。
在真核生物中有些蛋白要经过切除才能成为有活性的成熟蛋白,最有名的例子是高等生物的胰岛素,它是一种分泌蛋白,具有信号肽。新合成的前胰岛素原(preproinsulin),在ER中切除信号肽变成了胰岛素原(proinsulin),它是单链的多肽,由3个二硫键将主键连在一起,弯曲成复杂的环形结构。分子由A链(21aa)B链(31aa)和C链(33aa)三个连续的片段构成。当转运到胰岛细胞的囊胞中,C链被切除,成为由A,B两条分开的链由3个二硫键连结成成熟的胰岛素。
蛋白内含子又称为内蛋白子是近年发现的一种新的翻译后加工的产物。它是1994年由Perler等首先提出的。蛋白外显子又称为外蛋白子。内蛋白子的基因不是单独的开放阅读框(ORF)它是插入在外蛋白子的基因中和内含子的区别在于它可以和外蛋白子的基因一道表达,而不是其mRNA被切除,产生前体蛋白以后再从前体中被切除掉,余下的外蛋白了连接在一起成为成熟的蛋白,这也不同于胰岛素,胰岛素的A键和B键本身是不相连接的,仅仅通过二硫键将两个片段连在一起。
现发现的内蛋白子有7种,多分布于酵母和微生物中,内蛋白子的分子量为40-60KDa,有高度保守的末端氨基酸:N-端常为Cys或Ser,C-端总是His-Asn。内蛋白子未剪切前称融合内蛋白子,可催化前体的自我剪接反应;剪切后的内蛋白子称游离内蛋白子,可作为归巢内切酶参与内蛋白子的归巢。它可识别dDNA上内蛋白子基因在外蛋白子基因子的插入位点。[5]
4 结语
对于原核生物和真核生物中基因的转录、翻译和后修饰的研究,人们已日益成熟,但仍有一部分问题需深入研究。如:怎样更有效率地完成基因转录翻译,在转录翻译过程中是否还有其它未发现的有效因子,等问题还值得人们探讨。只有不断深入研究这些,才会促进人类基因研究的发展。
参考资料:
[1].聂剑初,吴国利等合编.生物化学简明教程(第三版).高等教育出版社,1999,260-264,278-289
[2]. 王镜岩,朱圣庚,徐长法主编.生物化学(第三版下册).高等教育出版社,2002,517-536
[3]. 章 成, 史冬燕, 曾黎琼, 程在全.真核生物转录调控的研究进展.云南农业大学学报,2007,22(2):164-171
[4]. 郑光宇.真核生物表达系统研究进展. 喀什师范学院学报,2004,25(6):33-36
[5]. 孙柏欣,刘长远,陈彦等.基因表达系统研究进展.现代农业科技,2008,(2):205-207
[6]. 百度知道及其它网络资源
展开阅读全文