1、第3章基因的本质第4节基因是有遗传效应的DNA片段【学问扩展】基因概念之演化基因(gene)是遗传学家约翰逊(WJohannsen)在1909年提出来的。他用基因这一名词来表示遗传的独立单位,相当于孟德尔在豌豆试验中提出的遗传因子。 在遗传学进展的早期阶段,基因仅仅是1个规律推理的概念,而不是一种已经证明白的物质和结构。由于科学争辩水平的不断提高,从浅入深,由宏观到微观,基因的概念也在不断的修正和进展。从遗传学史的角度看,基因概念大致分以下几个阶段:孟德尔的遗传因子阶段;摩尔根的基因阶段;顺反子阶段和现代基因阶段。一、孟德尔的遗传因子阶段19世纪60年月初,孟德尔对具有不同形态的豌豆作杂交试验
2、,在解释试验中每种性状的遗传行为时,用A代表红花,a代表白花,表明生物的某种性状是由遗传因子负责传递的,遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟德尔所说的“遗传因子”是代表打算某共性状遗传的抽象符号。孟德尔在阐明遗传因子在世代中传递规律时,就已经生疏到了基因的两个基本属性:基因是世代相传的,基因是打算遗传性表达的。现在所说的“基因是生物体传递遗传信息和表达遗传信息的基本物质单位”,实际上就是孟德尔所阐明的基因观。二、摩尔根的基因阶段1909年,丹麦遗传学家约翰逊制造了“基因”这一术语,用来表达孟德尔的遗传因子,但还只是提出了遗传因
3、子的符号,没有提出基因的物质概念。摩尔根对果蝇的争辩结果表明,1条染色体上有很多基因,一些性状的遗传行为之所以不符合孟德尔的独立安排定律,就是由于代表这些性状的基因位于同一条染色体上,彼此连锁而不易分别。这样,代表特定性状的特定基因与某一条特定染色体上的特定位置联系起来。基因不再是抽象的符号,而是在染色体上占有肯定空间的实体,从而赐予基因以物质的内涵。三、顺反子阶段早期的基因概念是把基因作为打算性状的最小单位、突变的最小单位和重组的最小单位,后来,这种“三位一体”的概念不断受到新发觉的挑战。20世纪50年月以后,随着分子遗传学的进展,1953年在沃森和克里克提出DNA的双螺旋结构以后,人们普遍
4、认为基因是DNA的片段,确定了基因的化学本质。1957年,本泽尔(Seymour Benzer)以T4噬菌体为材料,在DNA分子水平上争辩基因内部的精细结构,提出了顺反子(cistron)概念。顺反子是1个遗传功能单位,1个顺反子打算1条多肽链。能产生1条多肽链的是1个顺反子,顺反子也就是基因的同义词。1个顺反子可以包含一系列突变单位突变子。突变子是DNA中构成1个或若干个核苷酸。由于基因内的各个突变子之间有肯定距离,所以彼此之间能发生重组,重组频率与突变子之间的距离成正比。重组子代表1个空间单位,有起点和终点,可以是若干个密码子的重组,也可以是单个核苷酸的互换。假如是后者,重组子也就是突变子
5、。四、现代基因阶段1操纵子 从分子水平来看,基因就是DNA分子上的一个个片段,经过转录和翻译能合成1条完整的多肽链。可是,通过近年来的争辩,认为这个结论并不全面,由于有些基因,如rRNA和tRNA基因只有转录功能而没有翻译功能。另外,还有一类基因,其本身并不进行转录,但可以对邻近的结构基因的表达起把握作用,如启动基因和操纵基因。从功能上讲,能编码多肽链的基因称为结构基因;启动基因、操纵基因和编码阻遏蛋白、激活蛋白的调整基因属于调控基因。操纵基因与其把握下的一系列结构基因组成1个功能单位,称为操纵子。2移动基因 移动基因指DNA能在有机体的染色体组内从1个地方跳到另一个地方,它们能从1个位点切除
6、,然后插入同一或不同染色体上的另一个位置。移动基因机构简洁,由几个促进移位的基因组成。基因的跳动能够产生突变和染色体重排,进而影响其他基因的表达。 业已证明,相当一部分已知的自发突变是移动基因所致,而且,移动基因不仅能在个体的染色体组内移动,并能在个体间甚至种间移动,因此是1个重要的进化因素。移动基因的发觉动摇了基因在染色体上有一固定位置的传统观念。3断裂基因 过去人们始终认为,基因的遗传密码子是连续不断地并列在一起,形成1条没有间隔的完整基因实体。但后来通过对真核蛋白质编码基因结构的分析发觉,在它们的核苷酸序列中间插入有与编码无关的DNA间隔区,使1个基因分隔成不连续的若干区段。这种编码序列
7、不连续的间断基因被称为断裂基因。不连续的断裂基因的表达程序是:先转录为初级转录物,即核内不均一RNA,又叫前体RNA;然后经过删除和连接,除去无关的DNA间隔序列的转录物,便形成了成熟的mRNA分子,它从细胞核中输送到细胞质,再转译为相应的多肽链。4假基因 1977年,GJacp依据对非洲爪蟾5S rRNA基因簇的争辩,提出了假基因的概念,现已在大多数真核生物中发觉了假基因。这是一种核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。5重叠基因 长期以来,在人们的观念中始终认为同一段DNA序列内,是不行能存在重叠的读码结构的。但是,随着DNA核着酸序列测定技术的进展,
8、人们已经在一些噬菌体和动物病毒中发觉,不同基因的核苷酸序列有时是可以共用的。也就是说,它们的核苷酸序列是彼此重叠的,这样的2个基因被称为重叠基因。它修正了关于各个基因的多核苷酸链是彼此分立、互不重叠的传统观念。由此可见,随着生物科学的不断进展,人们对基因概念的理解也不断深化。在世界科学技术日新月异的今日,生物科学将会有更多新的突破性进展,基因的概念不行避开的将会被赐予新的内容。对基因生疏的进一步深化(1)基因的顺反子概念(黑方块表示变位点)1955年,美国分子生物学家本泽(Benzer)通过对大肠杆菌的噬菌体 的 区基因的深化争辩,揭示了基因内部的精细结构。提出了基因的顺反子(Cistron)
9、概念。他发觉,在一个基因内部,可以发生若干不同位点的突变,如果在一个基因内部发生两个以上位点的突变,其顺式和反式结构的表型效应是不同的。如上图所示,顺式是野生型,反式却是突变型。所以,基因就是一个顺反子。基因内部这些不同位点之间还可以发生交换和重组。所以,一个基因不是一个突变单位,也不是一个重组单位。本泽分别把它们称为突变子(muton)和重组子(recon)。明显,一个突变子或重组子可小到一个核苷酸对。基因的顺反子概念冲破了传统的“功能、交换、突变”三位一体的基因概念,订正了长期以来认为基因是不能再分的最小单位的错误看法,使人们对基因的生疏有了显著的提高。(2)有结构基因与调控基因的划分,还
10、有重造基因和断裂基因的发觉过去人们曾经认为,基因像念珠一样,一个接一个地排列在染色体上,是互不重迭的;基因是一个连续的核苷酸序列,是不能间断的。重迭基因和断裂基因的发觉,刷新了这些陈旧的看法,使人们对基因的结构与功能的生疏又提高到一个新高度。什么是基因现在,基因已经成为一个家喻户晓的名词,但是,你是否能精确地说出什么是基因呢?本义从基因争辩的进展历史谈谈对基因的理解。一、基因概念的进展1909年, WL约翰逊首次提出了基因(gene)这一名词,用来表示GJ孟德尔在豌豆杂交试验中所证明的遗传因子。1910年,美国遗传学家TH摩尔根通过果蝇杂文试验证明基因在染色体上呈线性排列,并确立了遗传的连锁和
11、互换规律,进而在1926年发表了其代表作基因论。这时,人们认为“基因是染色体上的遗传功能单位”。1928年F格里菲斯的肺炎双球菌转化试验,以及1944年() T艾弗里的DNA转化试验,首次证明DNA是遗传物质,从而揭开了基因的化学本质。1941年,GW比德尔和EL塔图姆依据脉孢霉生化突变型的争辩提出了“一个基因一种酶”的假说,认为基因与酶蛋白之间存在一一对应的关系。到1957年,S本泽尔进一步提出了“一个顺反子一条多肽链”的论断。顺反子是基因的同义语,所以也说“一个基因一条多肽链”。这比“一个基因一种酶”的假说更为精确,由于有些蛋白质并不具有酶的性质,而且酶和蛋白质分子既可由一条肽链构成,也可
12、由两种以上的肽链构成。1966年,“一个基因一条多肽链”的生物学过程得到充分证明,并于1967年发表了全套的遗传密码表,初步揭开了基因表达之谜。原来,生物的遗传信息以核苷酸碱基(ATG C)的不同排列贮存干DNA分子中,每3个碱基编码一条多肽链中的一个氨基酸。在基因表达时,DNA中的遗传信息先被转录成mRNA(信使RNA),mRNA中每3个碱基组成一个密码子,打算一种氨基酸。然后由mRNA中的核苷碱酸基(AUGC)的排列挨次指导多肽链的合成。遗传信息的这种“DNARNA蛋白质”表达方式称为中心法则。一个基因的DNA双链中,只有一条链可以用做转录的模板。关于这两条链的称呼有点混乱。以前的文献称模
13、板链为编码或有意义链。非模板链为无意义链,近年来则反过来称模板链为反意义链(因其碱基序列与mRNA互补)而非模板链为有意义链(因其碱基序列与mRNA相同),又称编码链。一般所说的DNA碱基序列是指有意义链,即编码链,方向为5 3。遗传密码和密码子一般是指mRNA中的碱基序列,有时也指DNA中编码链的碱基序列。1953年JD沃森和FHC克里克提出了有名的DNA分子结构的双螺旋模型。1973年诞生了重组DNA技术,即基因工程。此后,随着分子生物学的快速进展,人们对基因的生疏不断深化。其中最重要的发觉是:1重叠基因 1977年F桑格等在噬菌体 X174中发觉重叠基因,即某一段核苷酸序列同时为两个基因
14、编码。后来在其它病毒以及细菌和果蝇等生物中也发觉了重叠基因,一段DNA序列为两个或三个基因所共用,或者一个小基因位于一个大基因之内。重叠基因是生物体合理而又经济地利用自身DNA的一种绝妙方式,它的发觉打破了基因是彼此分别的传统观念。2断裂基因 1977年MT道尔等首次发觉卵清蛋白基因是不连续的,在基因内部插入了7个没有编码意义的DNA片段。现已查明,原核生物的基因一般是连续的,在一个基因的内部没有不编码的DNA序列。而真核生物的绝大多数基因都是不连续的断裂基因,无编码意义的插入片段称为内含子,有编码意义的基因片段称为外显子。在基因表达时,内含子与外显子被一起转录成mRNA前体,然后通过加工除掉
15、与内含子对应的序列,再把与外显子对应的序列拼接起来,形成成熟的mRNA分子,最终翻译成多肽链。内含子把一个基因分成几个部分,打破了基因是一个不容分割的功能单位的传统观念。3移动基因 50年月初B麦克林托克在玉米的染色体中发觉了可以转变自身位置的基因,她称之为“解离因子”。解离因子可以在同一个杂色体内或不同的染色体间移动,当它移动到新的位置以后,可以引起染色体断裂,使玉米籽粒消灭色斑。后来,在其它生物中也发觉了可以转变自身位置的移动基因,其中最常见的是细菌转座子。转座子除了含有与转变自身位过有关的基因以外,还携带与插入功能无关的基因,如耐药基因、毒素基因和代谢基因等。4多个基因编码一条多肽链 1
16、979年S那卡尼施等发觉并非一条肽链都由一个基因编码,例如有些病毒可以由一段DNA序列转录出一条mRNA分子,然后翻译出一条多肽链,最终这条多肽链被切割成多个有生物功能的肽链。有多少个功能肽链产生,对应的DNA序列就应当含有多少个基因。这种多个基因编码一条多肽链的现象,不符合“一个基因打算一条多肽链”的普遍原则,使基因的定义更加简单化。5隐蔽基因 一般来说,用做翻译模板的mRNA分子应当与其编码基因有对应关系,也就是说它的核苷酸碱基应与基因的核苷酸碱基互补,而且数量相等,对真核基因来说应与外显子序列相对应。但是,自1985年以来,在某些病毒、植物和动物中发觉,mRNA前体在成熟过程中发生了碱基
17、的增加、缺失或智换,mRNA与基因之间失去了一一对应的关系。这一现象首先在原生动物锥虫中发觉,并称之为RNA编辑。这种需要编辑才能正常表达的基因称为隐蔽基因。隐蔽基因的发觉使对基因的精确定义更加困难。6不编码蛋白质的基因在蛋白质合成过程中需要两类RNA分子的参与,一类是核糖体RNA简称rRNA,它是核糖体的组成部分。另一类是转运RNA简称tRNA其功能是把氨基酸搬运到核糖体会成多肽链的位点上。原核生物的rRNA有3种,真核生物的rRNA有4种。tRNA有几十种。编码这两类RNA分子的DNA序列称为RNA基因,或者分别称为rRNA基因和tRNA基因。这样看来,把基因定义为编码一条多肽链的DNA序
18、列明显不够全面。二、基因的分子生物学定义在学校生物学课本中,把基因定义为“染色体遗传物质中打算生物性状的小单位”。高中生物学课本则把基因定义为“有遗传效应的DNA片段”。在最具权威的2000年版中国大百科全书中,基因的定义是“含特定遗传信息的核苷酸序列,是遗传信息的最小功能单位”。在最近几年出版的外文版和部分中文版的分子生物学和分子遗传学书籍中又给出了新的答案。从上述基因争辩的最新进展可以看出,基因不仅在功能上多种多样,在结构上也是五花八门,因此,给它下一个格外精确和永久适用的定义是相当困难的。依据目前所把握的学问,从分子生物学的角度,可以把基因定义为“能够表达出一个有功能的多肽链或功能RNA
19、分子的核酸序列”。这里,“RNA分子”是指rRNA和tRNA。“核酸序列”主要指DNA,对于RNA病毒来说则指染色体RNA。这个定义较精确地表述了基因的本质和功能,已经被绝大多数学者所接受。笔者认为,这个定义能够为中同学所理解,特殊是高中同学。依据上述定义不转录的DNA序列就不应称其为基因。实际上应称它们为启动区和操纵区。前者是基因转录时RNA聚合酶与基因上游区结合并起始转录的DNA区段,后者是与阻遏蛋白或激活蛋白结合从而调整基因转录活性的DNA区段,它们都不编码任何多肽或RNA产物,常被称为“顺吸式作用元件”。依据基因产物的分子性质,可以把基因分为蛋白质基因和RNA基因两大类。依据基因产物的功能,又可分为结构基因和调整基因两大类。结构基因的产物是酶和不直接影响其它基因表达的蛋白质,以及rRNA和tRNA分子。调整基因的产物是阻遏蛋白或激活蛋白,它们对基因的转录分别进行项调控和正调控。上述关于基因的分子生物学定义,大体上符合几十年来基因争辩的各种发觉。但是随着时间的推移,今后还可能有新的突破,消灭新的基因概念。总的趋势是基因概念正经受着从稳定到动态的变化。基因概念的演化必将促进遗传学的进展,深化人们对生命规律的生疏,使遗传学更好地为人类服务。