1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三篇 基因信息的传递,中心法则,(central dogma),:,1958,年,F.Crick,提出。,1970,年,H.Temin,发现逆转录现象,补充中心法则。,DNA,RNA,蛋白质,转录,翻译,逆转录,复制,遗 传 学 中 心 法 则,复制,?,第三篇,基因信息的传递,包括内容:,第十三章 真核基因与基因组,第十四章,DNA,的生物合成,第十五章,DNA,的损伤和修复,第十六章,RNA,的生物合成,第十七章 蛋
2、白质的生物合成,第十八章 基因表达调控,第十九章 细胞信号转导,第十三章 真核基因与基因组,基因(,gene,),:编码生物活性产物的,DNA,功能片段,以碱基排列顺序贮存遗传信息。由,Johannsen,于,1909,年首先提出。,除了某些以,RNA,为基因组的,RNA,病毒外,基因通常是指染色体或基因组的一段,DNA,序列。,基因包括,编码序列,(外显子)、,调控序列,和,间隔序列,(内含子),。,基因组(,genome,):,一个生物体内所有遗传信息的总和。,人类基因组包含了细胞,核染色体,DNA,(常染色体和性染色体)及,线粒体,DNA,所携带的所有遗传物质。,真核基因的结构与功能,第
3、一节,The Structure and Function of Eukaryote Gene,利用碱基的不同排列荷载遗传信息。,通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。,作为基因表达(,gene expression,)的模板,使其所携带的遗传信息通过各种,RNA,和蛋白质在细胞内有序合成而表现出来。,基因的功能,单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为,基因组构,(,gene organization,)。,与基因功能相关的结构,编码区序列(,coding region sequence,),非编码序列(,non-
4、coding sequence,),基因表达需要的调控区(,regulatory region,)序列,包括启动子(,promoter,)、增强子(,enhancer,)等。,在细胞内表达为蛋白质或功能,RNA,的,DNA,序列,一、真核基因的基本结构,编码蛋白质或,RNA,的,编码序列,。,非编码序列,,包括编码区两侧的调控序列和编码序列间的间隔序列。,真核基因结构不连续,为,断裂基因(,split gene,),。,真核基因结构,外显子,(,exon,);在基因序列中,出现在成熟,mRNA,分子上的序列。,内含子,(,intron,):外显子之间、与,mRNA,剪接过程中被删除部分相对应的
5、间隔序列。,真核生物绝大部分编码蛋白质的基因都有内含子。编码,rRNA,和一些,tRNA,的基因也都有内含子。,内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。,外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中,RNA,剪接的识别信号。,基因的,5,端称之为上游,,3,端称为下游,基因序列中开始,RNA,链合成的第一个核苷酸所对应的碱基记为,+1,,此碱基上游的序列记为负数,下游的序列记为正数。,二、基因编码区编码多肽链和特定的,RNA,分子,基因的编码序列决定其编码产物的序列和功能。,编码序列中一个碱基的改变或突变,可能使
6、基因功能发生重要的变化。,相同的,DNA,序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。,基因编码区中的,DNA,碱基序列,决定特定的成熟,RNA,分子的序列,即,DNA,的一级结构决定着其转录产物,RNA,分子的一级结构。,三、调控序列参与真核基因表达调控,位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的,DNA,序列,又称旁侧序列。,基因的调控区(顺式作用元件),启动子,上游调控元件,增强子,加尾信号,细胞信号反应元件,转录起始点,TATA,盒,CAAT,盒,GC,盒,增强子,AATAAA,剪接加尾,转录终止点,修饰点,外显子,翻译起始点,内含子,OCT-1,O
7、CT-1,:,ATTTGCAT,八聚体,+1,结构基因,启动子,上游启动子元件,1.,启动子提供转录起始信号,启动子,是,DNA,分子上能够介导,RNA,聚合酶结合并形成转录起始复合体的序列。,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。,少数启动子(如编码,tRNA,基因的启动子)位于转录起始点的下游,这些,DNA,序列可以被转录。,真核生物有,3,类启动子,分别对应于细胞内存在的三种不同的,RNA,聚合酶和相关蛋白质。,能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。,增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱
8、基对。,通常数个增强子序列形成一簇。,有时增强子序列也可位于内含子之中。,不同的增强子序列结合不同的调节蛋白。,2.,增强子增强邻近基因的转录,增强子,是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。,沉默子,(,silencer,)是抑制基因转录的特定,DNA,序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。,3.,沉默子是负调节元件,真核基因组的结构与功能,第二节,The Structure and Function of Eukaryote Genome,基因组,:细胞或生物体的一套完整单倍体遗传物质的总和
9、一、真核基因组具有独特的结构,基因的,编码序列,所占比例远,小,于非编码序列。,高等真核生物基因组含有大量的,重复序列,,,真核基因组中存在,多基因家族和假基因,。,大多基因具有,可变剪接,,,80%,的可变剪接会使蛋白质的序列发生改变。,基因组,DNA,与蛋白质结合形成,染色体,,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。,结构特点:,二、真核基因组中存在大量重复序列,高度重复序列(,highly repetitive sequence,),中度重复序列(,moderately repetitive sequence,),单拷贝序列(,single copy sequence
10、或低度重复序列,(一)高度重复序列,主要存在于染色体的着丝粒区域,重复单位一般由,2-10,bp,组成,成串排列,在人基因组中约占,5,%-6,%,。,重复频率可达,10,6,以上,不编码蛋白质或,RNA,。,反向重复序列(,inverted repeat sequence,),卫星,DNA,(,satellite DNA,),两个相同顺序的互补拷贝在同一,DNA,链上反向排列而成,重复单位长度约,300 bp,,多数散在于基因组中,总长度约占人基因组的,5,。,分类:,参与复制水平的调节,存在于,DNA,复制起点区的附近,是一些蛋白质(包括酶)的结合位点。,参与基因表达的调控,可以转录到
11、核内不均一,RNA,分子中,有些反向重复序列可以形成发夹结构,有助于稳定,RNA,分子。,参与染色体配对,如,卫星,DNA,成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。,功能:,(二)中度重复序列,重复数十至数千次,大多数与单拷贝基因间隔排列。,短分散重复片段,长分散重复片段,平均长度约,300,bp-500,bp,,与长度约为,1000 bp,的单拷贝序列间隔排列。拷贝数可达数十万。如,Alu,家族、,KpnI,家族、,Hinf,家族。,平均长度为,3500,bp-5000bp,,与长度约为,13000bp,的单拷贝序列间隔排列。,重复达,3050,万次,,,每个成员
12、的长度约,300 bp,。,每个单位长度中一个限制性内切酶,Alu,的切点(,AGCT,),将其切成长,130bp,和,170bp,的两段。,Alu,家族,仅次于,Alu,家族的第二大家族,,重复序列中含有限制性内切酶,Kpn,的位点,呈散在分布,拷贝数约为,3000-4800,个,KpnI,家族,以,319bp,长度的串联重复存在于人基因组中,重复序列中含有限制性内切酶,Hinf,I,的位点。,Hinf,家族,rRNA,基因重复序列属于中度重复序列,各重复单位中的,rRNA,基因都是相同的。,rRNA,基因集中成簇存在,这样的区域称为,rDNA,区。,人类的,rRNA,基因位于,13,、,1
13、4,、,15,、,21,和,22,号染色体的核仁组织区,每个核仁组织区平均含有,50,个,rRNA,基因的重复单位。,5SrRNA,基因似乎全部位于,1,号染色体,每个单倍体基因组约有,1000,个,5SrRNA,基因。,在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。,(三)单拷贝序列(低度重复序列),三、真核基因组中存在大量的多基因家族与假基因,多基因家族,是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。,基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。,基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密
14、相关的蛋白质。如球蛋白基因家族。,DNA,序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。,超家族基因(,superfamily gene,),基因组中存在的一段与正常基因非常相似但不能表达的,DNA,序列。以,来表示。,假基因(,psuedogene,),四、线粒体,DNA,结构有别于染色体,DNA,线粒体,DNA,(,mitochondrial DNA,,,mtDNA,)是核外遗传物质,能独立编码线粒体中的一些蛋白质。,mtDNA,的结构为环状分子,与原核生物的,DNA,类似,结构特点也与原核生物相似。,人的线粒体基因组,线粒体基因组编码,37,个基因,包括,13,个编码
15、呼吸链多酶体系的一些多肽的基因、,22,个编码,mt-tRNA,的基因、,2,个编码,mt-rRNA,(,16S,和,12S,)的基因。,物种,基因组大小,(Mb),基因数,染色体数*,支原体,M.genitalium,0.58,470,无,流感嗜血杆菌,H.influrnzae,1.83,1743,无,枯草芽孢桿菌,B.subtilis,4.20,4100,无,大肠杆菌,E.coli,4.60,4288,无,酿酒酵母,S.cerevisiae,13.50,6034,16,裂殖酵母,S.pombe,12.50,4929,16,燕麦,O.sativa,466,30000,21,果蝇,D.mela
16、nogaster,165,13601,4,秀丽隐杆线虫,C.elegans,97,18424,6,小鼠,mouse,2700,30000,20,人,H.sapiens,3000,25000,23,不同生物体基因组的比较,五、人基因组中有两万多个基因,基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,人类的基因较其他生物体可能更为“有效”,其发挥功能的方式与其他生物不同。,六、人的基因在染色体上的分布特征,人类基因组的染色体,DNA,基因在染色体上并不是均匀分布。基因密度最大的是第,19,号染色体,密度最小的是第,13,号和,Y,染色体。,染色体上存在着无基因的“沙漠区”,即在,500kb,区域内,没有任何基因的编码序列。,基因在染色体上的分布特征,






