1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,目录,遗传信息的传递,第三篇,DNA,RNA,PROTEIN,Transcription,Reverse-transcription,RNA-replication,DNA-replication,Translation,复制,转录,逆转录,RNA,复制,翻译,中心法则,原核和真核细胞中遗传信息的传递,真核基因与基因组,DNA,的生物合成,DNA,的损伤和修复,RNA,的生物合成,蛋白质的生物合成,基因表达调控,细胞信号转导,本篇学习内容:,真核基因与基因组,第十三章,Eukaryote Gene and
2、Genome,核心内容:,1.,什么是基因(,Gene,)?,2.,基因的结构组成?功能?,3.,什么是基因组(,Genome,)?,4.,真核基因组的结构特点?,基因(,gene,),:,编码蛋白质或,RNA,等具有特定功能产物的、负载遗传信息的基本单位。染色体或基因组的一段,DNA,序列。,Gene,vs,Genome,基因组(,genome,),:,泛指一个细胞或一个生物体的全部遗传信息。包括核染色体及线粒体,DNA,。,真核基因的结构与功能,第一节,The Structure and Function of Eukaryotic Genes,1.,利用碱基的不同排列荷载遗传信息,2.,
3、指导,RNA,和蛋白质的合成,表达遗传信息,基因的功能,转录起始位点(,mRNA,合成起始位点),翻译起始位点(起始密码子,ATG,),上游调控区,翻译终止密码子,3-,端非翻译区(,3 UTR,),5-,端非翻译区(,5 UTR,),编码序列,初级转录物,成熟转录物,内含子,一、真核基因的基本结构,真核基因的编码序列被内含子隔开,是断裂基因,1.,编码序列(,coding sequence),2.,非编码序列,(non-coding sequence),,包括编码区两侧的,调控序列,和编码序列间的,间隔序列,(,内含子,,intron,),在细胞内表达为蛋白质或功能,RNA,的,DNA,序列
4、真核基因的结构包括两部分:,转录起始点,TATA,盒,CAAT,盒,GC,盒,增强子,AATAAA,剪切位点,转录终止点,加尾信号序列,外显子,翻译起始点,内含子,OCT-1,OCT-1,:,ATTTGCAT,八聚体,+1,核心启动子,上游启动子元件,基因表达需要调控区(,regulatory region,)序列,包括启动子(,promoter,)、增强子(,enhancer,)等。,5,AAT,GCTACT,A,GTCGAAGCC3,+1,+2,+3,+4,+5,+6,+7,+8,-8,-7,-6,-5,-4,-3,-2,-1,-9,DNA,5,A,GUCGAAGCC3,+9,+10,m
5、RNA,基因序列的正负编号,编码序列决定编码产物的序列和功能;,编码序列碱基突变可导致基因功能变化;,相同序列起始位点的变化或不同的剪接方式可导致产物不同。,编码序列编码多肽链和特定的,RNA,分子,1.,启动子提供转录起始信号,启动子,是结合,RNA,聚合酶并形成转录起始复合体的,DNA,序列。,调控序列参与真核基因表达调控,可在启动子的上游或下游发挥作用;,距离所调控基因几百至几千个碱基对;,通常数个增强子序列形成一簇;,有时位于内含子之中;,不同的增强子结合不同调节蛋白。,2.,增强子增强邻近基因的转录,增强子(,Enhancer),是,增强真核基因启动子工作效率的最重要的顺式作用元件。
6、沉默子,(,silencer,)是抑制基因转录的特定,DNA,序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。,3.,沉默子是负调节元件,真核基因组的结构与功能,第二节,The Structure and Function of Eukaryote Genome,人基因组构成,1.,编码序列比例远小于非编码序列,;,2.,含有大量的,重复序列,;,3.,存在,多基因家族,和,假基因,;,4.,多数基因进行可变剪接,导致蛋白多样性,;,5.,基因组,DNA,与蛋白质结合形成染色体。,一、真核基因组独特的结构特点,二、根据重复频率将重复序列分为三类,(一)高度重复序列,重复频
7、率,10,6,,不编码蛋白质或,RNA,。,2.,反向重复序列,(,inverted repeat sequence,),重复单位长度约,300 bp,,多数散在分布,约占,5,依据结构特点分为:,着丝粒区域,重复单位长度,2,10 bp,,成串排列,约占,5%,6%,。,1.,卫星,DNA,(,satellite DNA,),5,5,3,3,5,5,3,3,AGGATTTC,CTTTAGGA,TCCTAAAG,GAAATCCT,5,3,AGGATTTC,GAAATCCT,Inverted repeats,:同一个序列的两个拷贝在一个分子中以相反的方向重复。,参与复制水平的调节,存在于,DNA
8、复制起点附近,参与基因表达的调控,转录,hn,RNA,分子中,形成发夹结构,稳定,RNA,参与染色体配对,如,卫星,DNA,成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。,高度重复序列的功能:,(二)中度重复序列,重复数十至数千次,与单拷贝基因间隔排列。,1.,短分散重复片段,300 bp,500 bp,,与,1000 bp,的单拷贝序列间隔排列,Alu,家族,:,300 bp,,重复,3050,万次,,Alu,酶切位点,(,AGCT,),分成,130bp,和,170bp,两段。,KpnI,家族,:仅次于,Alu,家族,,Kpn,位点,散在分布,,3000,4800,个
9、拷贝,Hinf,家族,:串联重复,,319 bp,,,H,inf,I,酶切位点。,3,.,rRNA,基因重复序列属于中度重复序列,各重复单位中的,rRNA,基因都是相同的。,rRNA,基因集中成簇存在,这样的区域称为,rDNA,区。,rRNA,基因位于核仁组织区,每个核仁组织区平均含有,50,个,rRNA,基因的重复单位。,5SrRNA,基因似乎全部位于,1,号染色体,每个单倍体基因组约有,1000,个,5SrRNA,基因。,2.,长分散重复片段,3500 bp,5000,bp,,与,13000bp,的单拷贝序列间隔排列。,在单倍体基因组中只出现一次,大多数为蛋白质编码的基因。,(三)单拷贝序
10、列,多基因家族(,multigene family),是指一类结构相似(核苷酸序列具有同源性)、功能相关的基因。可分为两类:,1.,基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。,2.,基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族。,三、真核基因组存在多基因家族与假基因,与正常基因非常相似但不能表达的,DNA,序列。,假基因(,pseudogene,),,DNA,序列相似,功能不一定相关的若干个基因或若干组基因家族的总称。如,IgG,超家族。,超家族基因,(,superfamily gene,),四、线粒体,
11、DNA,(,mitochondrial DNA,,,mtDNA,),37,个基因:,13,个编码呼吸链多酶体系,,22,个编码,mt-tRNA,,,2,个编码,mt-rRNA,(,16S,和,12S,)。,物种,基因组大小,(,Mb,),基因数,染色体数*,支原体,M.genitalium,0.58,470,无,流感嗜血杆菌,H.influrnzae,1.83,1743,无,枯草芽孢桿菌,B.subtilis,4.20,4100,无,大肠杆菌,E.coli,4.60,4288,无,酿酒酵母,S.cerevisiae,13.50,6034,16,裂殖酵母,S.pombe,12.50,4929,1
12、6,燕麦,O.sativa,466,30000,21,果蝇,D.melanogaster,165,13601,4,秀丽隐杆线虫,C.elegans,97,18424,6,小鼠,mouse,2700,30000,20,人,H.sapiens,3000,25000,23,不同生物体基因组的比较,五、基因组大小或基因数量与生物体复杂度,六、人的基因在染色体上的分布特征,非均匀分布,19,号基因密度最大,,13,号和,Y,基因密度最小。,存在,“,沙漠区,”,,即在,500kb,区域内,没有任何基因的编码序列。,全部人类基因组约有,2.91Gbp,基因,数量约,3-4,万,,目前已定位了,2.6,万多个基因,但其中尚有,42%,的功能不明。,人类基因组中存在“热点”和大片“荒漠”。编码序列约占,3%,,,非编码序列约占,97%,。,35.3%,的基因组包含,重复,的序列。,人与人之间,99.99%,的基因密码,是,相同,的。,大约有,223,个基因可能是人类的脊椎动物祖先生存时由细菌插入的顺序。,人类基因组草图初步结论,1.,如何理解断裂基因及其意义?,2.,何谓启动子、增强子、沉默子?,3.,真核基因组的结构特点是什么?,4.,是否可以依据基因组大小或基因数量判断,生物体的复杂度?,讨 论,






