收藏 分销(赏)

第三章--基因与基因组的结构PPT课件.ppt

上传人:胜**** 文档编号:752992 上传时间:2024-03-04 格式:PPT 页数:177 大小:933.50KB
下载 相关 举报
第三章--基因与基因组的结构PPT课件.ppt_第1页
第1页 / 共177页
第三章--基因与基因组的结构PPT课件.ppt_第2页
第2页 / 共177页
第三章--基因与基因组的结构PPT课件.ppt_第3页
第3页 / 共177页
第三章--基因与基因组的结构PPT课件.ppt_第4页
第4页 / 共177页
第三章--基因与基因组的结构PPT课件.ppt_第5页
第5页 / 共177页
点击查看更多>>
资源描述

1、第三章第三章 基因与基因基因与基因组的的结构构1 1-3.1 基因的概念基因的概念基因基因(gene):是原核、真核生物以及病毒是原核、真核生物以及病毒的的DNA和和RNA分子中具有分子中具有遗传效效应的核苷的核苷酸序列,是酸序列,是遗传的基本的基本单位。位。结构基因构基因包括:包括:(编码蛋白蛋白质、tRNA、rRNA)调控基因控基因 (编码调控蛋白控蛋白)2 2-基因通基因通过对复制、复制、转录和翻和翻译过程程进行行调控来控来实现对遗传性状性状发育的控制。育的控制。基基因因还可可以以发生生突突变和和重重组,导致致产生生有有利、中性、有害或致死的利、中性、有害或致死的变异异。3 3-根据不同

2、根据不同历史史时期的研究水平,基因研究期的研究水平,基因研究大体上分大体上分为三个三个发展展阶段:段:在在20世世纪50年代以前,主要从年代以前,主要从细胞的染胞的染色体水平上色体水平上进行研究,属于行研究,属于基因的染色体基因的染色体遗传学学阶段段;20世世纪50年代之后,主要从年代之后,主要从DNA大分子大分子水平上水平上进行研究,属于行研究,属于基因的分子生物学基因的分子生物学阶段段;4 4-近近20年来,由于重年来,由于重组DNA技技术的完善和的完善和应用,人用,人们已已经改改变了从表型到基因型的了从表型到基因型的传统研究基因的途径,而能研究基因的途径,而能够直接从克隆目的基直接从克隆

3、目的基因出因出发,研究基因的功能及其与表型之,研究基因的功能及其与表型之间的的关系,使基因的研究关系,使基因的研究进入了入了反向生物学反向生物学阶段段。5 5-反向生物学:反向生物学:指利用重指利用重组DNA技技术和离体和离体定向定向诱变的方法研究已知的方法研究已知结构的基因相构的基因相应的的功能,在体外使基因突功能,在体外使基因突变,再,再导入体内,入体内,检测突突变的的遗传效效应即表型的即表型的过程。程。6 6-DNA分子上不同的区域功能不同,并不是分子上不同的区域功能不同,并不是所有的序列都具有所有的序列都具有编码功能。功能。在在原核生物原核生物中中结构基因占整个基因构基因占整个基因组D

4、NA的大部分。的大部分。在在真核生物真核生物中中结构基因占整个基因构基因占整个基因组DNA一小部分。一小部分。在在结构基因之构基因之间还含有大量没有含有大量没有编码功能功能的的间隔区隔区。7 7-个基因是否表达是受到个基因是否表达是受到邻近近编码区域的区域的DNA序列(序列(调节基因)以及基因)以及结合于其上的蛋合于其上的蛋白白质因子(比如因子(比如转录因子)控制的。因子)控制的。当与蛋白因子当与蛋白因子结合的合的DNA序列序列发生突生突变时,蛋白蛋白质不能不能识别DNA,结果是被它果是被它调控的控的结构基因不能表达。构基因不能表达。8 8-9 9-1010-所有所有这些些DNA序列,包括表达

5、蛋白序列,包括表达蛋白质的的结构构基因和基因和调控序列都构成了生物界复控序列都构成了生物界复杂的的遗传信信息。息。从从这个意个意义上上讲,我,我们可以把可以把遗传单位的概念位的概念从从基因基因扩展展为转录单位位,转录单位位包括包括转录的的启启动子及其上游的其他子及其上游的其他调控区域、基因本身和控区域、基因本身和转录的的终止序列等。止序列等。1111-基因主要位于染色体上,除了染色体基因主要位于染色体上,除了染色体DNA外,外,细菌的菌的质粒、真核生物的叶粒、真核生物的叶绿体、体、线粒体等粒体等细胞器都含有一定的胞器都含有一定的DNA序列,其上大部分序列,其上大部分是具有是具有遗传功能的基因,

6、功能的基因,这些染色体外的些染色体外的DNA称称为染色体外染色体外遗传物物质。1212-3.1.1 基因与基因与DNA分子分子基因是基因是DNA分子上的功能分子上的功能单位,在染色体位,在染色体或或DNA分子上,基因成串排列。分子上,基因成串排列。1313-T4噬噬菌菌体体(T4-phage)为材材料料的的研研究究发现,遗传信信息息的的交交换并并非非完完全全发生生在在基基因因之之间,在在基因内部基因内部也也发生着交生着交换与重与重组。研研究究发现基基因因之之间不不同同位位点点发生生突突变可可以以互互补,而而基基因因内内不不同同位位点点发生生突突变则不不能能互互补,说明基因是一个整体明基因是一个

7、整体单位。位。结论:基基因因既既是是遗传的的功功能能单位位,同同时也也是交是交换单位和突位和突变单位。位。1414-T4噬菌体是感染大噬菌体是感染大肠杆菌杆菌(E.coli)的一种病的一种病毒,在它感染之后不到毒,在它感染之后不到 30 min,寄主,寄主细胞就胞就会裂解死亡,并会裂解死亡,并释放出放出约100个左右的子代噬个左右的子代噬菌体菌体颗粒,粒,这种控制寄主种控制寄主细胞致死效胞致死效应(快速溶快速溶菌菌)的功能,是由的功能,是由该噬菌体的噬菌体的r区区编码的。的。1515-深深入入研研究究发现r分分为两两个个亚区区:rA和和rB,它它们各各产生生一一种种特特殊殊的的物物质,只只有有

8、这两两种种物物质同同时存存在在时,才才能能使使寄寄主主菌菌大大肠杆菌杆菌K株的株的细胞溶菌裂解。胞溶菌裂解。1616-用用rA或或rB的突的突变型分型分别单独感染大独感染大肠杆菌杆菌K株株细胞,胞,两种两种T4噬菌体噬菌体都不能正常生都不能正常生长;而用两种突而用两种突变型混合感染型混合感染K株株细胞胞时,才溶菌,才溶菌裂解,裂解,噬菌体噬菌体正常生正常生长;由此由此认为:rA和和rB是互是互补的突的突变型。型。1717-单突突变体体 单突突变体体有互有互补作用作用 野生型野生型野生型野生型 野生型野生型 反式构型反式构型 两个突两个突变发生在基因生在基因间(内内)互互补起情况分析起情况分析r

9、 rA A亚亚区区区区r rB B亚亚区区区区无互无互补作用作用 突突变型型1818-在在rA亚区区内内发生生了了突突变的的T4噬噬菌菌体体,能能与在与在B亚区区发生了突生了突变的的T4噬菌体互噬菌体互补;所以所以rA和和rB是两个不同的功能是两个不同的功能单位。位。1919-1955年,年,Benzer用用顺反子反子(cistron)一一词,将将这两个两个亚区分区分别称称为rA顺反子和反子和rB顺反子,即反子,即rA基因和基因和rB基因。基因。可可见一个一个顺反子就是一段核苷酸序列,能反子就是一段核苷酸序列,能编码一条完整的多一条完整的多肽链。这种多种多肽链既可以是既可以是一种具有生物活性的

10、蛋白一种具有生物活性的蛋白质,又可以与其他,又可以与其他多多肽链聚合形成复聚合形成复杂的蛋白的蛋白质。脱氧核糖脱氧核糖2020-顺反互反互补测验(cis-trans test)可精确定)可精确定位两个突位两个突变间的关系。的关系。两个两个纯合的合的亲本突本突变体体杂交交时,产生的生的杂合体后代将合体后代将遗传两个两个亲本的突本的突变。两个突两个突变位于同一个基因上,位于同一个基因上,杂合子中就合子中就不存在野生型的基因,具有突不存在野生型的基因,具有突变的表型的表型(不不能互能互补)。突突变位于不同的基因上,位于不同的基因上,杂合子表合子表现为野野生型的表型,生型的表型,这种关系称种关系称为互

11、互补(可以互可以互补)。2121-杂合子有两种构型合子有两种构型顺式构型式构型,两个突,两个突变位于同一条染色体上位于同一条染色体上反式构型反式构型,两个突,两个突变位于同源的两条染色位于同源的两条染色体上体上上面的互上面的互补实验中的中的杂合子合子为反式构型。反式构型。(见下下图)2222-单突突变体体 单突突变体体有互有互补作用作用 野生型野生型野生型野生型 野生型野生型 反式构型反式构型 两个突两个突变发生在基因生在基因间可以互可以互补r rA A亚亚区区区区r rB B亚亚区区区区2323-根根据据Benzer的的计算算:在在功功能能DNA中中,最最小小交交换单位位约为l3个个核核苷苷

12、酸酸。这与与DNA单链结构构中中核核苷苷酸酸是是最最小小的的结构构单位位的的理理论极极为接接近近。因因此此,顺反反子子中中的的最最小小交交换单位位(交交换子子)和和最最小小突突变单位位(突突变子子),都都应该是是DNA分分子中的一个核苷酸子中的一个核苷酸对。2424-现代分子生物学文献中,代分子生物学文献中,顺反子和基因反子和基因这两两个个术语是互相通用的。一般而言,是互相通用的。一般而言,个个顺反反子就是子就是个基因,大个基因,大约1500个核苷酸。它个核苷酸。它是由一群突是由一群突变单位和重位和重组单位位组成的成的线性性结构。构。因此,因此,顺反子的概念表明了基因不是最小反子的概念表明了基

13、因不是最小单位位,它仍然是可分的,但确,它仍然是可分的,但确实是功能是功能单位位。生物体内存在的游离核苷酸多是生物体内存在的游离核苷酸多是5-核苷酸核苷酸2525-在分子水平上,由于所有生物在分子水平上,由于所有生物DNA基本基本结构都构都一致一致,这是它是它们作作为生物体的生物体的共性共性,又由于它,又由于它们DNA序列上的不同序列上的不同,就形成了,就形成了千差万千差万别的生的生物界;物界;因此,来自两种生命形因此,来自两种生命形态(比如原核和真核)(比如原核和真核)的基因的基因(DNA)可以相互融合重可以相互融合重组;基因的基因的DNA共性是共性是实现基因工程基因工程(DNA重重组)的的

14、重要理重要理论基基础之一。之一。2626-3.1.2 基因与多基因与多肽链基因的主要基因的主要编码产物:多物:多肽链、rRNA、tRNA以及小分子以及小分子RNA 2727-1908年,年,Garrod在研究人在研究人类黑尿病黑尿病(alkap tonurea)时认为,该病是由于病是由于缺乏某种缺乏某种酶催催化化的代的代谢所引起的。所引起的。Beale等等应用用X-射射线诱导处理理红色面包霉,色面包霉,获取了大量的取了大量的营养缺陷突养缺陷突变体,体,进一步分析一步分析发现,这些突些突变的每一种都是由于的每一种都是由于单基因缺基因缺陷陷所致。所致。2828-由此,由此,Beade和和Tatum

15、在在1941年提出了年提出了“一一种基因一种种基因一种酶”假假说。认为生物体内生物体内发生的每生的每步代步代谢反反应都由一种都由一种特殊的特殊的酶催化,而催化,而这种种酶又是其特定基因的又是其特定基因的编码产物。一旦基因物。一旦基因发生突生突变,由它指,由它指导合合成的蛋白成的蛋白质也随之也随之发生生变化,一般化,一般为改性或改性或失活。失活。2929-当一种蛋白当一种蛋白质是由多是由多亚基构成的聚合体基构成的聚合体时(异源多聚体蛋白(异源多聚体蛋白质),),“一个基因一条一个基因一条多多肽链”。“一种基因一种一种基因一种酶”的假的假说在在20世世纪中期中期得到了得到了许多学者的多学者的认同。

16、同。3030-1957年,英国年,英国剑桥Ingrain在在对镰形形红细胞胞贫血症的血血症的血红蛋白和正常血蛋白和正常血红蛋白的氨蛋白的氨基酸序列基酸序列进行的行的对比研究中,比研究中,第一次用第一次用实验证实了基因与蛋白了基因与蛋白质之之间的直接关系的直接关系。3131-在在O2分分压较低低环境中,境中,镰形形红细胞容易溶胞容易溶血破裂而使血血破裂而使血红蛋白蛋白计数减少,造成数减少,造成贫血。血。其本其本质是其血是其血红蛋白的蛋白的-链与正常野生型与正常野生型-链之之间的第的第6位氨基酸,由位氨基酸,由Val取代了取代了Glu所致。所致。3232-这种种贫血病是由基因突血病是由基因突变造成

17、的一种分子病,造成的一种分子病,除溶血后除溶血后发生生贫血外,血外,还会堵塞血管形成栓塞,会堵塞血管形成栓塞,从而从而伤及多种器官。及多种器官。它的它的纯合子合子(通通过单倍体形成的倍体形成的纯系双倍体系双倍体)患患者在童年就夭折。者在童年就夭折。现已已证实绝大多数大多数异常血异常血红蛋白都是在蛋白都是在-链或或-链上上发生一个氨基酸的取代替生一个氨基酸的取代替换所引起的。所引起的。3333-基因的碱基序列与蛋白基因的碱基序列与蛋白质分子中氨基酸的分子中氨基酸的序列之序列之间的的对应关系是通关系是通过遗传密密码实现的。的。3434-3.2 基因的命名基因的命名有关基因的命名方法有关基因的命名方

18、法现在并没有在并没有严格的格的统一。一。随着分子生物学的随着分子生物学的飞速速发展。展。许许多多的基多多的基因因组都已大都已大规模被模被测序,更多的基因也不断序,更多的基因也不断的被的被鉴定。因而十分需要一个定。因而十分需要一个统一的命名方一的命名方法。法。3535-为便于学便于学习理解,根据理解,根据现代分子生物学中目代分子生物学中目前使用最多的方法前使用最多的方法暂归纳如下:如下:1用三个小写英文斜体字母表示基因的用三个小写英文斜体字母表示基因的名称名称,例如涉及乳糖代,例如涉及乳糖代谢相关的相关的酶基因:基因:lac;涉及亮氨酸代;涉及亮氨酸代谢相关的相关的酶基因:基因:leu。3636

19、-2在三个小写英文斜体字母后面加上一个斜在三个小写英文斜体字母后面加上一个斜体大写字母表示其不同的基因座。全部用正体体大写字母表示其不同的基因座。全部用正体时表示蛋白表示蛋白产物和表型;物和表型;例如,例如,对于大于大肠杆菌和其他杆菌和其他细菌,用三个小写菌,用三个小写字母表示一个操字母表示一个操纵子,接着的大写字母表示不子,接着的大写字母表示不同基因座,同基因座,lac 操操纵子的基因座:子的基因座:lacZ,lacY,lacA;其表达;其表达产物蛋白物蛋白质则是是lacZ,lacY,lacA。3737-3质粒和其他染色体外成分的命名粒和其他染色体外成分的命名自然自然产生的生的质粒,用三个正

20、体字母表示,第粒,用三个正体字母表示,第个字母大写,个字母大写,例如:例如:ColE;重重组质粒,粒,则在两个大写字母之前加一个在两个大写字母之前加一个p,大写字母表示构建大写字母表示构建该质粒的研究者或粒的研究者或实验室。室。例如:例如:pSC 101,(SC代表代表StartleyCohen),pMT555,(MT代表代表Manchester technology)。3838-4果果蝇基因命名基因命名对突突变表型的表示用表型的表示用14个字母代表。例如,个字母代表。例如,基因基因white(w),tailless(tll),hedgehog(hh);而蛋白而蛋白质则为White,Taill

21、ess,Hedgehog3939-5酵母基因的命名酵母基因的命名一般用三个大写斜体字母表示基因的功能,一般用三个大写斜体字母表示基因的功能,后面的数字表示不同的基因座;后面的数字表示不同的基因座;例如,啤酒酵母基因例如,啤酒酵母基因GAL4,CDC28;其表其表达的蛋白达的蛋白质则是:是:GAL4,CDC28;但也有例外,例如非洲粟酒酵母基因是但也有例外,例如非洲粟酒酵母基因是gal4,cdc2;蛋白;蛋白质为:Gal4,Cdc2。4040-6线虫基因的命名虫基因的命名用三个小写斜体字母表示突用三个小写斜体字母表示突变表型,如存表型,如存在不止一个基因座,在不止一个基因座,则在在连字符后用数字

22、字符后用数字表示表示,如基因,如基因unc-86,ced-9;蛋白蛋白UNC-86;CED-9。4141-7植物基因的命名植物基因的命名多数用多数用13个小写英文斜体字母表示。个小写英文斜体字母表示。4242-8脊椎脊椎动物基因的命名物基因的命名用描述基因功能的用描述基因功能的14个小写字母和数字个小写字母和数字表示其基因功能;表示其基因功能;例如,基因例如,基因sey,myc,蛋白蛋白Sey,Myc。4343-9人人类基因的命名基因的命名与脊椎与脊椎动物相似,但需大写;物相似,但需大写;例如基因是例如基因是MYC、ENO1,蛋白蛋白质则为MYC、ENO1。4444-3.3 真核生物的断裂基因

23、真核生物的断裂基因1977年年Berget等首先等首先发现,在真核生物基,在真核生物基因因组中,基因是不中,基因是不连续的,在基因的的,在基因的编码区域内部含有大量的不区域内部含有大量的不编码序列,从而隔序列,从而隔断了断了对应于蛋白于蛋白质的氨基酸序列。的氨基酸序列。这种不种不连续的基因又称的基因又称断裂基因或割裂基断裂基因或割裂基因因(split gene)。4545-构成断裂基因的构成断裂基因的DNA序列被分序列被分为两两类:基因中基因中编码的序列称的序列称为外外显子子(exon),外,外显子是基因中子是基因中对应于信使于信使RNA序列的区域;序列的区域;不不编码的的间隔序列称隔序列称为

24、内含子内含子(intron),内,内含子是在信使含子是在信使RNA被被转录后的剪接加工中后的剪接加工中去除的区域。去除的区域。4646-断裂基因由一系列交替存在的外断裂基因由一系列交替存在的外显子和内含子和内含子构成,基因的两端起始和子构成,基因的两端起始和结束于外束于外显子,子,对应于其于其转录产物物RNA的的5和和3末端。末端。如果一个基因具有如果一个基因具有n个内含子。个内含子。则相相应地含地含有有n+1个外个外显子。子。4747-4848-通通过比比较mRNA与与DNA的分子的分子杂交,研究交,研究其其结构构发现,如果基因中含有内含子,因,如果基因中含有内含子,因为其其mRNA中没有相

25、中没有相应的序列,在所形成的序列,在所形成的的RNA-DNA杂交双交双链的某一部位就会出的某一部位就会出现不能配不能配对的的单链环,即是内含子。,即是内含子。此法此法还可确定内含子在基因中的位置和大可确定内含子在基因中的位置和大小小(图3-1)。4949-5050-必必须从从mRNA原初原初转录产物物(hnRNA)中去中去除内含子序列,以除内含子序列,以产生一个只由外生一个只由外显子构子构成的信使成的信使RNA(mRNA)。从原初从原初转录产物中除去内含子的物中除去内含子的过程叫做程叫做RNA剪接。剪接。经过剪接后,所有的外剪接后,所有的外显子按其在子按其在DNA上上相同的相同的顺序序连接在同

26、一个接在同一个RNA分子上。分子上。5151-5252-DNA和相和相应信使信使RNA结构上的差异构上的差异(断裂基因断裂基因存在存在)在真核生物中普遍存在。在真核生物中普遍存在。但也有一些真核生物的但也有一些真核生物的结构基因不含内含子,构基因不含内含子,如在如在酵母基因酵母基因组中大部分的基因是不中断的,中大部分的基因是不中断的,组蛋白基因和干蛋白基因和干扰素基因素基因等直接等直接对应于其蛋于其蛋白白质产物。物。某些低等真核生物的某些低等真核生物的线粒体以及叶粒体以及叶绿体基因中体基因中也也发现有断裂基因。有断裂基因。5353-断裂基因在断裂基因在细菌中菌中较为少少见。但在某些原核生物如古

27、但在某些原核生物如古细菌和大菌和大肠杆菌的杆菌的噬菌体中也噬菌体中也发现了断裂了断裂现象。象。5454-断裂基因共同的性断裂基因共同的性质:外外显子在基因中的排列子在基因中的排列顺序与它在成熟序与它在成熟mRNA产物中的排列物中的排列顺序相同;序相同;每种断裂基因在所有每种断裂基因在所有组织中都具有相同的中都具有相同的内含子成分;内含子成分;核基因的内含子通常含有无核基因的内含子通常含有无义密密码子子(nonsense codon),因此一般没有,因此一般没有编码功能;功能;5555-在内含子上在内含子上发生的突生的突变不影响蛋白不影响蛋白质的的结构,所以其突构,所以其突变往往往往对生物体没有

28、影响;生物体没有影响;但也有例外,如某些但也有例外,如某些发生在内含子上的突生在内含子上的突变可通可通过抑制外抑制外显子的相互剪接,从而干子的相互剪接,从而干扰了正确的信使了正确的信使RNA产生。生。5656-利用利用结构基因的特殊构基因的特殊DNA限制片段作限制片段作为探探针,可以,可以检测基因基因组中与之有中与之有亲缘关系的关系的序列;序列;结果表明果表明个基因的外个基因的外显子常与其他基因的子常与其他基因的外外显子有子有亲缘关系。关系。5757-如果一个外如果一个外显子可与其他基因的外子可与其他基因的外显子片段互子片段互补,则表明表明这两个基因可能起源于共同的祖两个基因可能起源于共同的祖

29、先。先。经过无数代的无数代的基因基因扩增及增及细胞分裂胞分裂后,在后,在进化化过程中逐程中逐渐扩大差距,而形成了不同的功能大差距,而形成了不同的功能基因。基因。5858-由于在两个相关基因的内含子之由于在两个相关基因的内含子之间,其,其亲缘关系关系远远不如外不如外显子之子之间紧密,有些含密,有些含有相同外有相同外显子的基因其内含子的差异子的基因其内含子的差异还相相当大,以至于不能找到序列当大,以至于不能找到序列间的的亲缘关系。关系。这是因是因为在在进化化过程中,相关基因的内含程中,相关基因的内含子比外子比外显子子变化快得多。化快得多。5959-虽然突然突变是以相同的是以相同的频率率发生在外生在

30、外显子和内子和内含子上的,但含子上的,但发生在外生在外显子上的突子上的突变将使基将使基因因编码的的产物物丧失功能失功能,导致生物体无法生致生物体无法生存,存,经过长期的自然期的自然选择这种突种突变就从外就从外显子中淘汰了;子中淘汰了;而内含子由于没有来自而内含子由于没有来自编码功能的限制,可功能的限制,可以自然的累以自然的累积各种突各种突变,导致它致它产生了生了较大大的的变化。化。6060-3.4 基因及基因基因及基因组的大小与的大小与C值矛盾矛盾由于断裂基因的存在,使人由于断裂基因的存在,使人们认识到一个基到一个基因比它因比它实际编码蛋白蛋白质的序列要大得多。的序列要大得多。与与整个基因相比

31、,真正整个基因相比,真正编码蛋白蛋白质的序列很短的序列很短。因此,基因可能是由一些因此,基因可能是由一些编码较小的独立蛋小的独立蛋白白质分区的分区的单位(外位(外显子部分)在子部分)在进化化过程程中加合起来的。中加合起来的。也有一些比也有一些比较大的外大的外显子子编码不翻不翻译的的5和和3区域。区域。6161-GC CAAT TATA6262-基因的大小取决于它所包含的内含子的基因的大小取决于它所包含的内含子的长度;度;一些基因的内含子特一些基因的内含子特别长,例如哺乳,例如哺乳动物物的二的二氢叶酸叶酸还原原酶基因含有基因含有6个外个外显子,其子,其mRNA的的长度度为2.0kb,但它含有极,

32、但它含有极长的内的内含子,使其基因的含子,使其基因的总长度度长达达2531kb。6363-由于内含子通常比外由于内含子通常比外显子大很多,子大很多,导致整致整个基因比其个基因比其编码区域大很多。而且内含子区域大很多。而且内含子之之间区区别也很大,其大小从也很大,其大小从200个个bp左右左右到上万个到上万个bp。在一些极端的例子中,甚至。在一些极端的例子中,甚至有有5060kb的内含子。的内含子。6464-比比较基因基因长度和由它度和由它们编码的的mRNA的的长度度发现:酵母中酵母中mRNA的的长度度变化范化范围与其基因大小的与其基因大小的变化范化范围并没有什么不同;并没有什么不同;哺乳哺乳动

33、物中的情况有明物中的情况有明显不同,它不同,它们的的mRNA分子常常不到分子常常不到10kb,基因的大小常常达到,基因的大小常常达到100kb。6565-在所有已知的在所有已知的珠蛋白基因珠蛋白基因中,断裂都中,断裂都发生在生在相同的位置上,第一个内含子位于相同的位置上,第一个内含子位于30和和31位位氨基酸密氨基酸密码子之子之间,第二个内含子位于,第二个内含子位于104和和105位氨基酸密位氨基酸密码子之子之间。通常第。通常第个内个内含子含子较短,第二个短,第二个则长很多。很多。6666-6767-不同珠蛋白基因外不同珠蛋白基因外显子的子的长度差度差别不大,差异不大,差异的是第二个内含子的是

34、第二个内含子长度的差异。度的差异。例如,小鼠的例如,小鼠的-珠蛋白基因的珠蛋白基因的总长度度为850 bp,而,而-珠蛋白基因的珠蛋白基因的长度度为1382 bp,但但二者的二者的mRNA长度却相差不多度却相差不多(-珠蛋白的珠蛋白的mRNA为585碱基,而碱基,而-珠蛋白珠蛋白为620碱基碱基)。6868-6969-基因的大小基因的大小还与它所包含内含子的数目有关与它所包含内含子的数目有关不同基因,内含子数目不同基因,内含子数目变化很大;化很大;有些断裂基因含有一个或少数几个内含子,如有些断裂基因含有一个或少数几个内含子,如珠蛋白基因;珠蛋白基因;某些基因含有某些基因含有较多的内含子,例如多

35、的内含子,例如鸡卵清蛋白卵清蛋白基因基因7个内含子。伴清蛋白基因含有个内含子。伴清蛋白基因含有16个内含个内含子。子。7070-7171-低等真核生物低等真核生物酿酒酵母中的大多数基因是酒酵母中的大多数基因是非断裂的。断裂基因的外非断裂的。断裂基因的外显子数目也很少。子数目也很少。酵母基因的外酵母基因的外显子不超子不超过4个,且很短。个,且很短。真菌基因的外真菌基因的外显子少于子少于6个,个,长度不到度不到5 kb。昆虫的外。昆虫的外显子也不超子也不超过10个。个。7272-在哺乳在哺乳动物中情况物中情况则相反,只有极少量的相反,只有极少量的连续排列排列编码序列,某些种序列,某些种类甚至有几十

36、甚至有几十个外个外显子。子。7373-7474-当基因的当基因的长度大到一定程度后,度大到一定程度后,DNA的的总量量与生物体的复与生物体的复杂性性之之间开始失去必然的开始失去必然的联系。系。例如,例如,虽然属于同一个然属于同一个门,果果蝇细胞的胞的DNA总量量较小,而小,而家家蝇细胞的胞的DNA总量却是它的量却是它的6倍。倍。在在较高等的真核生物中,高等的真核生物中,基因大小基因大小与与外外显子子的大小和数目的大小和数目之之间也也没有必然没有必然联系系。7575-表表3.1总结了一些生物体的平均基因大小,了一些生物体的平均基因大小,当比当比较不同物种不同物种时,可以看出从低等真核,可以看出从

37、低等真核生物到高等真核生物的生物到高等真核生物的mRNA和其基因的和其基因的平均大小略有增加,平均大小略有增加,平均外平均外显子数目的明子数目的明显增加是真核生物基因的一种增加是真核生物基因的一种标志志。在哺。在哺乳乳动物、昆虫、物、昆虫、鸟类中,基因的平均中,基因的平均长度度将近是其将近是其mRNA长度的度的5倍。倍。7676-表表3-1 不同生物的平均基因大小不同生物的平均基因大小种种种种类类平均外平均外平均外平均外显显子数子数子数子数目目目目/个个个个平均基因平均基因平均基因平均基因长长度度度度/kb/kb平均平均平均平均mRNAmRNA长长度度度度/kb/kb酵母酵母酵母酵母真菌真菌真

38、菌真菌藻虫藻虫藻虫藻虫果果果果蝇蝇鸡鸡哺乳哺乳哺乳哺乳动动物物物物1 13 34 44 49 97 71.61.61.51.54.04.011.311.313.913.916.616.61.61.61.51.53.03.02.72.72.42.42.22.27777-已知基因已知基因组的的总体大小,可粗略估算基因体大小,可粗略估算基因组中基因的数目。中基因的数目。目前已知酵母基因目前已知酵母基因组的全序列,其基因全的全序列,其基因全长12068kb,有,有5885个个编码蛋白蛋白质的可的可读框框(ORF)。每隔。每隔2kb就存在一个就存在一个编码蛋白蛋白质的的ORF(平均每个(平均每个 ORF

39、为1.4 kb,间隔序列隔序列为600 bp,即大,即大约70的区域是可的区域是可阅读框)。框)。7878-其中其中约有一半基因是已知的,或与已知基因有一半基因是已知的,或与已知基因有关的基因,因此可推有关的基因,因此可推测未未发现基因(孤儿基因(孤儿基因)的数目。基因)的数目。由此可大致推出由此可大致推出细菌基因菌基因组约有有2 400个基个基因,酵母因,酵母为6.0103个,果个,果蝇为9.0103个,个,哺乳哺乳动物高达物高达8104个,个,(见表表3-2)。7979-表表3-2 不同生物的基因数目不同生物的基因数目种种种种 类类基因基因基因基因组组大大大大小小小小/bp/bp基因数目基

40、因数目基因数目基因数目支原体支原体支原体支原体噬菌体噬菌体噬菌体噬菌体T T4 4大大大大肠肠杆菌杆菌杆菌杆菌酵母酵母酵母酵母果果果果蝇蝇人人人人1.0101.0106 61.6101.6105 54.2104.2106 61.3101.3107 71.4101.4108 83.3103.3109 97507502002002 3502 3506 0006 0008 7508 75065 00080 65 00080 0000008080-生物体的一个特征是一个生物体的一个特征是一个单倍体基因倍体基因组的的DNA含量含量总是相是相对恒定的。通常称恒定的。通常称为该物物种的种的C值。真核生物基因

41、真核生物基因组的的C值(C-value):指生物:指生物单倍体基因倍体基因组中的中的DNA含量,以含量,以pg(1pg=10-12g)或或bp表示。表示。8181-不同物种的不同物种的C值差异很大,最小的支原体只差异很大,最小的支原体只有有106 bp,而最大的如某些,而最大的如某些显花植物和两花植物和两栖栖动物可达物可达1011bp。8282-随着生物的随着生物的进化,生物体的化,生物体的结构和功能越构和功能越来越复来越复杂,其,其C值就越大,例如真菌和高等就越大,例如真菌和高等植物同属于真核生物,但后者的植物同属于真核生物,但后者的C值却大得却大得多。多。这一点是不一点是不难理解的,因理解

42、的,因为结构和功构和功能越复能越复杂,所需要的基因,所需要的基因产物的种物的种类也越也越多,即需要的基因越多,因而多,即需要的基因越多,因而C值越大。越大。图3-2为不同生物种不同生物种类的的C值范范围分布分布。8383-8484-然而在另一方面,随着然而在另一方面,随着进化,生物体复化,生物体复杂性和性和DNA含量之含量之间的关系的关系变得模糊了,出得模糊了,出现了很多令人了很多令人费解的解的现象。象。一些物种基因一些物种基因组大小的大小的变化范化范围很窄。很窄。鸟、爬行爬行动物、哺乳物、哺乳动物各物各门内基因内基因组大小的大小的范范围只有两倍的只有两倍的变化。化。8585-但大多数昆虫、两

43、栖但大多数昆虫、两栖动物和植物的情况却物和植物的情况却不同,在不同,在结构、功能很相似的同一构、功能很相似的同一类生物生物中,甚至在中,甚至在亲缘关系十分接近的物种之关系十分接近的物种之间,C值可以相差数十倍乃至上百倍。可以相差数十倍乃至上百倍。8686-突出的例子是两栖突出的例子是两栖动物,物,C值小的低至小的低至109bp以下,以下,C值大的大的则高达高达1011bp,而哺乳,而哺乳动物的物的C值均均为109bp的数量的数量级。人人们很很难相信不同的两栖相信不同的两栖动物,所需基因的数物,所需基因的数量会有量会有100倍的差倍的差别。这种种C值与生物与生物进化复化复杂性不相性不相对应的的现

44、象称象称为C值悖理(悖理(C value paradox)。)。8787-表表3-3 个个别生物的生物的C值生物生物C值染色数目染色数目肺肺鱼牛牛人人果果蝇豌豆豌豆大大肠杆菌杆菌X174112.23.23.20.1814.00.00470.0000051930234611 8888-C值悖理主要表悖理主要表现为:C值不随生物的不随生物的进化程度和复化程度和复杂性而增性而增加,如肺加,如肺鱼的的C值为112.2,而人是,而人是3.2,与牛相近与牛相近(表表3-3)8989-亲缘关系密切的生物关系密切的生物C值相差甚大,如豌相差甚大,如豌豆豆为14,而蚕豆,而蚕豆为2;高等真核生物具有比用于高等真

45、核生物具有比用于遗传高得多的高得多的C值,如人的染色体,如人的染色体组DNA含量在理含量在理论上包含上包含300万个基因,但有万个基因,但有实际用途的基因只有用途的基因只有3万个左右。万个左右。9090-3.5 重叠基因重叠基因3.5.1 原核生物的重叠基因原核生物的重叠基因9191-1976年年Barrell等等发现,在噬菌体,在噬菌体X174单链环形形DNA的序列的序列组织上有一个最上有一个最显著著特点,即特点,即E基因的基因的237个核苷酸完全包括在个核苷酸完全包括在含有含有456个核苷酸的个核苷酸的D基因之内基因之内。1977年,年,Sanger又又发现B基因的基因的260个核个核苷酸

46、完全位于含苷酸完全位于含1546个核苷酸的个核苷酸的A基因之基因之内内。9292-K基因基因则跨越在跨越在A基因和基因和C基因之基因之间,表明,表明噬菌体噬菌体X174单链环形形DNA含有含有重叠基因重叠基因和基因内基因和基因内基因(见图3-3)。这些重叠在一起的基因表达些重叠在一起的基因表达时使用了不同使用了不同的的阅读框,因此,框,因此,虽然然DNA序列相同,但序列相同,但表达的蛋白表达的蛋白质不同。不同。9393-在基因重叠的情况下:在基因重叠的情况下:共同序列上共同序列上发生的突生的突变可能影响其中一个基可能影响其中一个基因的功能,也可能影响两个基因。因的功能,也可能影响两个基因。当一

47、个基因包含在另一基因之中当一个基因包含在另一基因之中时,两个基,两个基因使用相同的可因使用相同的可读框。小基因可独立地表达框。小基因可独立地表达一种蛋白一种蛋白质,相当于整个基因表达的蛋白,相当于整个基因表达的蛋白质的一部分。最的一部分。最终结果果类似于一个完整的蛋白似于一个完整的蛋白质发生了部分的断裂。生了部分的断裂。9494-重叠基因及基因内基因重叠基因及基因内基因现象的意象的意义:原核生:原核生物利用有限的物利用有限的遗传资源表达更多生物功能的源表达更多生物功能的能力。能力。9595-9696-3.5.2 真核生物的重叠基因真核生物的重叠基因通常情况下真核生物基因通常情况下真核生物基因组

48、中很少有重叠中很少有重叠基因。基因。断裂基因的每个外断裂基因的每个外显子可子可编码一段氨基酸一段氨基酸序列,序列,对应于整个蛋白于整个蛋白质分子上的相分子上的相应部部分,而内含子不在最分,而内含子不在最终的蛋白的蛋白质产物中表物中表达。达。9797-但在有些基因当中,内含子和外但在有些基因当中,内含子和外显子的区分是子的区分是相相对的,并无的,并无严格的格的规定,定,这与它与它们表达的途表达的途径有一定关系。径有一定关系。在一段区域以一种途径表达在一段区域以一种途径表达时作作为外外显子,而子,而以另一种途径表达以另一种途径表达时作作为内含子。内含子。说明一段明一段DNA序列通常可以多种方式序列

49、通常可以多种方式发挥作用。作用。在在这种种选择性性产生的两种蛋白生的两种蛋白质当中,一部分当中,一部分序列相同而其他部分可能不同。序列相同而其他部分可能不同。9898-由于由于选择性剪接使得外性剪接使得外显子子4序列存在于一个序列存在于一个mRNA中,而在另一个中,而在另一个mRNA中不存在;中不存在;在第一种情况下,它被定在第一种情况下,它被定义为外外显子;子;在第二种在第二种mRNA的剪接的剪接时,它却被作,它却被作为外外显子子3和和5之之间内含子的一部分而被切除。内含子的一部分而被切除。这种种选择性剪接可从一段性剪接可从一段DNA序列序列产生有部分生有部分重叠序列的多种蛋白重叠序列的多种

50、蛋白质。9999-100100-3.6 基因基因组每个物种每个物种单倍体染色体的数目及其所携倍体染色体的数目及其所携带的的全部基因称全部基因称为该物种的基因物种的基因组(genome)。)。101101-3.6.1 原核生物的染色体基因原核生物的染色体基因组原核生物的染色体基因原核生物的染色体基因组是指其是指其环状或状或线状的双状的双链DNA分子所含有的全部基因;分子所含有的全部基因;有的原核生物有的原核生物还含有染色体外的含有染色体外的质粒基因粒基因组。102102-E.coli 染色体基因染色体基因组(E.coli chromosome genome)是指存在于是指存在于E.coli 染色

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 教育专区 > 生物学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服