资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,主 要 内 容,染色体,DNA,的结构,DNA,的复制,DNA,的修复,DNA,的转座,2025/6/23 周一,一、染色体(,Chromosome),内容提要:,细胞周期,染色体与染色质,染色体的结构和组成(,原核生物、真核生物,),核小体,原核生物和真核生物基因组结构特点比较,(一)细胞周期,(二)染色体与染色质,染色体(,chromosome,)是细胞在有丝分裂时遗传物质存在的特定形式,是间期细胞染色质结构紧密包装的结果。,真核生物的染色体在细胞生活周期的大部分时间里都是以染色质,(chromatin),的形式存在的。,染色质是一种纤维状结构,叫做染色质丝,它是由最基本的单位,核小体,(nucleosome),成串排列而成的。,(三)染色体的结构和组成,原核生物,(prokaryote),组蛋白,:,H1 H2A H2B H3 H4,非组蛋白,核小体,DNA,蛋白质,染色体,真核生物染色体的组成,核小体组蛋白,(nucleosomal histone),:,H2B,、,H2A,、,H3,和,H4,帮助,DNA,卷曲形成核小体的稳定结构,H1,组蛋白:在构成核小体时,H1,起连接作用,它赋予染色质以极性。,1,、组蛋白,(histone),真核生物染色体的基本结构蛋白,富含带正电荷的,Arg,和,Lys,等碱性氨基酸,碱性蛋白质,可以和酸性的,DNA,紧密结合(非特异性结合);,组蛋白的一般特性:,i),进化极端保守性,:,不同种生物组蛋白的氨基酸组成十分相似。,其中,H3,、,H4,最保守;,H2A,、,H2B,变化相对大;,H1,变化更大。,H3,、,H4,可能对稳定真核生物的染色体结构起重要作用。,保守程度:,H1 H2A,、,H2B H3,、,H4,上海生化所分子遗传学,1998,年试题:,在真核生物核内,五种组蛋白(,H1 H2A H2B H3,和,H4,)在进化过程中,,H4,极为保守,,H2A,最不保守(),ii),无,种属,组织特异性,:,到目前为止,仅发现鸟类、鱼类及两栖类红细胞染色体不含,H1,而带有,H5,;,精细胞染色体的组蛋白是鱼精蛋白。,iii),肽链氨基酸分布的不对称性,碱性氨基酸集中分布在,N,端的半条链上,大部分疏水基团分布在,C,端;,可能与它们的功能相互作用有关,:,碱性的半条链易与,DNA,的负电荷区结合,而另外半条链与其它组蛋白、非组蛋白结合。,iv)H5,组蛋白的特殊性,:,富含赖氨酸(,24%,)、丙氨酸(,16,)、丝氨酸(,13,)、精氨酸(,11,)。,H5,的磷酸化可能在染色质失活过程中起重要作用。,在细胞周期特定时间可发生甲基化、乙酰化、磷酸化和,ADP,核糖基化等。,H3,、,H4,修饰作用较普遍,,H2B,有乙酰化作用、,H1,有磷酸化作用。,H2A,、,H2B,、,H1,不明显。,v),组蛋白的可修饰性,修饰作用的特点:,降低组蛋白所携带的正电荷。,组蛋白修饰的,意义,:,一是改变染色体的结构,直接影响转录活性;,二是核小体表面发生改变,使其它调控蛋白易于和染色质相互接触,从而间接影响转录活性。,简述真核生物染色体上组蛋白的种类,组蛋白修饰的种类及其生物学意义,中国科学院,2003,年硕士研究生入学,生物化学与分子生物学,试题,2.,非组蛋白,占组蛋白总量的,60,70,,种类很多,,20,100,种,常见有,15,20,种;,包括酶类、如,RNA,聚合酶及与细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物以及肌动蛋白、肌球蛋白、微管蛋白、原肌蛋白等。,可能是染色质的结构部分。,高速泳动(,high mobility group protein,,,HMG),蛋白:,能与,DNA,结合,也能与,H1,结合,可能与,DNA,的超螺旋结构有关。,DNA,结合蛋白:,能是一些与,DNA,的复制或转录有关的酶或调节物质。,A24,非组蛋白:,其,C,端与,H2A,相同,但它有两个,N,端,一个,N,端的序列与,H2A,相同,另一个与泛素相同;其大小与,H2A,差不多,酸性,含较多的谷氨酸和天冬氨酸,位于核小体内,功能不祥。,非组蛋白,非组蛋白具多样性和异质性,对,DNA,具有识别特异性,又称序列特异性,DNA,结合蛋白,(sequence specific DNA binding proteins),具有多种功能,包括基因表达的调控和染色质高级结构的形成。,C,值,:,是一种生物的单倍体基因组,DNA,的总量。,C,值反常现象(,C-value paradox)/,C,值矛盾,:,真核细胞基因组的最大特点是它含有大量的重复序列,而且功能,DNA,序列大多被不编码蛋白质的非功能,DNA,所隔开,这就是著名的,“,C,值反常现象,”,。,3.,真核生物基因组,DNA,Genome,:all DNA sequences in a cell,Genes:,a stretch of continuous DNA sequence encoding a protein or RNA,C-value,is the quantity of DNA in the genome(per haploid set of chromosomes).,C-value paradox,(C,值矛盾,)refers to the lack of a correlation between genome size and genetic complexity,在真核生物中,C,值一般是随生物进化而增加的,高等生物的,C,值一般大于低等生物。,然而,某些两栖类的,C,值甚至比哺乳动物还大,而在两栖类中,C,值的变化也很大,可相差,100,倍。,由此推断,许多,DNA,序列可能不编码蛋白质,是无生理功能的。,Range of genome size found in different organism phyla.,C,值反常现象,/,C,值矛盾:,指,C,值与种系进化复杂性不一致的现象。,简述,DNA,的,C,值以及,C,值矛盾(,C Value paradox,),.,中科院上海生化所,98,年,上海第二军医大:,C,值矛盾,(四)核小体,(nucleosome),Nucleosome,、,chromosome,、,genome,中科院,2002,年硕士学位研究生入学分子遗传学试题,1,、定义:,用于包装染色质的结构单位,是由,DNA,链缠绕一个组蛋白核构成的。,2,、核小体的结构,核心颗粒,连接区,DNA,Histone octamer,(,组蛋白八聚体,),Top view,Side view,Nucleosome core,Nucleosome core,146 bp,1.8 superhelical turn,Chromatosome,166 bp,2 superhelical turn,DNA,Histone octamer,Histone H1,每个核小体单位包括,200bp,左右的,DNA,超螺旋和一个组蛋白八聚体及一分子,H1,组蛋白构成核小体的盘状核心结构,146bp,的,DNA,分子超螺旋盘绕组蛋白八聚体,1.75,圈,组蛋白,H1,在核心颗粒外结合额外,20bpDNA,,锁住核小体,DNA,的进出端,起稳定核小体的作用。,包括组蛋白,H1,和,166bp DNA,的核小体结构又称染色质小体。,两个相邻核小体之间以连接,DNA,相连,典型长度,60bp,,不同物种变化值为,0,80bp,组蛋白与,DNA,之间的相互作用主要是结构性的,基本不依赖于核苷酸的特异序列,实验表明,核小体具有自组装(,self-assemble,)的性质,核小体沿,DNA,的定位受不同因素的影响,进而通过核小体相位改变影响基因表达,中国科学院上海生化与细胞所,2002,年招收硕士研究生分子遗传学入学考试:,简述真核细胞内核小体与核小体核心颗粒的结构。,3,、染色体的包装,超螺旋结构,染色质包装的多级螺旋模型,一级结构:核小体,二级结构:螺线管,(solenoid),三级结构:超螺线管,(supersolenoid),四级结构:染色单体(,chromatid,),压缩,7,倍 压缩,6,倍 压缩,40,倍 压缩,5,倍,DNA,核小体,螺线管,超螺线管,染色单体,6.8:1,40:1,1000:1,8000:1,DNA double helix,Nucleosome(10 nm fiber),30 nm Fiber,Loops I,Loops II,chromosome,由,X-,射线晶体衍射,(2.8A),所揭示的核小体三维结构,(引自,K.Luger,等,,1997,),a.,通过,DNA,超螺旋中心轴所显示的核小体核心颗粒,8,个组蛋白分子的位置;,b,垂直与中心轴的角度所见到的核小体核心颗粒的盘状结构;,c,半个核小体核心颗粒的示意模型,一圈,DNA,超螺旋(,73bp,)和,4,种核心组蛋白分子,每种组蛋白由,3,个,螺旋和一个伸展的,N-,端尾部组成。,N-,端尾部有序排列,参与核小体之间的相互作用,以形成螺线管等高级结构。,上海第二军医大硕士研究生入学考试试题:,基因组的特点(真核、原核比较),(五),原核生物和真核生物基因组 结构特点比较,1,、真核生物基因组结构特点,基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。,基因组,DNA,与蛋白质结合形成染色体,,储存于细胞核内,体细胞内的基因的基因组是双份的(即双倍体,diploid,),即有两份同源的基因组。,单顺反子:,一个结构基因经过转录和翻译生成一个,mRNA,分子和一条多肽链。,基因不连续性,断裂基因(,interrupted gene,)、内含子,(,intron,),、外显子,(,exon,),非编码区较多,多于编码序列,(9:1),含有大量重复序列:,重复次数可达百万次以上,真核基因组存在大量的顺式作用元件。,包括启动子、增强子、沉默子等。,真核基因组存在大量的,DNA,多态性。,DNA,多态性是指,DNA,序列中发生变异而导致的个体间核苷酸序列的差异,主要包括单核苷酸多态性(,SNP),和串联重复序列多态性等。,真核生物基因组具有端粒结构。,真核细胞,DNA,序列大致可被分为,3,类:,不重复序列,/,单一序列,中度重复序列,高度重复序列,(1),不重复序列,/,单一序列,在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占,DNA,总量的,40,-80,,不重复序列长约,750-2000bp,,相当于一个结构基因的长度。,真核生物的大多数基因在单倍体中都是单拷贝的。如:蛋清蛋白、血红蛋白等,功能:编码蛋白质。,在基因组中,单拷贝顺序的两侧往往为散在分布的重复顺序。,由于某些单拷贝顺序编码蛋白质,体现了生物的各种功能,因此对这些序列的研究对医学实践有特别重要的意义。,(2),中度重复序列,:,这类序列的重复次数在,10,1,10,4,之间,占总,DNA,的,10,40,,如小鼠中占,20,,果蝇中占,15,。,各种,rRNA,、,tRNA,以及某些结构基因,(,如组蛋白基因等,),都属于这一类。,一般是不编码蛋白质的序列,在调控基因表达中起重要作用,28S,、,5.8S,及,18S rRNA,基因:,非洲爪蛙的,18S,、,5.8S,及,28S rRNA,基因是连在一起的,它们中间隔着不转录的间隔区,这些,18S,、,5.8S,及,28S rRNA,基因及间隔区组成的单位在,DNA,链上串联重复许多次。,不转录的间隔区是由,21-100,个碱基对组成的类似卫星,DNA,的串联重复序列。,中度重复序列往往分散在不重复序列之间,。,依据重复顺序的长度,中度重复顺序可分为两种类型:,短分散片段,长分散片段,补充,:,(,i,),短分散片段,(,short interspersed repeated segments,SINES,):,这类重复顺序的平均长度约为,300bp(,小于,500bp,),它们与平均长度约为,1000bp,的单拷贝顺序间隔排列。拷贝数可达,10,万左右。,如,Alu,家族等属于这种类型的中度重复序列。,Alu,家族,:,Alu,家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达,30,万,-50,万次,约占人基因组的,3-6,。,Alu,家族每个成员的长度约,300bp,,由于每个单位长度中有一个限制性内切酶,Alu,的切点(,AGCT,)从而将其切成长,130,和,170bp,的两段,因而定名为,Alu,序列(或,Alu,家族)。,Alu,序列分散在整个人体或其他哺乳动物基因组中,在间隔,DNA,、内含子中都发现有,Alu,序列,平均每,5kb DNA,就有一个,Alu,顺序。已建立的基因组中无例外地含有,Alu,顺序。,Alu,序列具有,种的特异性,,人的,Alu,序列制备的探针只能用于检测人的基因组中的,Alu,序列。由于在大多数的含有人的,DNA,的克隆中都含有,Alu,顺序,因此,可以这样认为,用人的,Alu,序列制备的探针与要筛选的克隆杂交,阳性者即为含有人,DNA,克隆,阴性者不含有人,DNA,。,Hinf,家族:,这一家族以,319bp,长度的串联重复存在于人体基因组中。用限制性内切酶,Hinf,消化人体,DNA,,可以分离到这一片段。,Hinf,家族在单位基因组内约有,50-100,个拷贝,分散在不同的区域。,319bp,单位可以再分成两个亚单位,分别为,172bp,和,147bp,它们之间有,70%,的同源性。,多聚,d,-d,家族,:,这一家族的基本单位是,d,-d,双核苷酸,多个,d,-d,双核苷酸串联重复在一起,分散于人体基因组中。,这个家族的一个成员位于人类,和,珠蛋白基因之间,含有,17,个,d,-d,双核苷酸组成的串联重复顺序。在人基因组中,,d,-d,交替顺序达,10,6,拷贝,这些顺序的平均长度为,40bp,。人们推测,这样一个短的串联重复顺序可能是基因转变(,gene conversion,)或不等交换(,unequal crossing-over,)的识别信号。,另外,这些嘌呤和嘧啶的交替顺序有助于,Z-DNA,的形成,在基因调节中可能起着重要的作用。中度重复顺序除了包括以上非编码区域外,许多编码区如,rRNA,基因,,tRNA,基因,组蛋白基因等在基因组中也多次重复,属于中度重复顺序。,(,ii,),长分散片段,(,Long interspersed repeated segments,LINES,),:,这类重复顺序的长度大于,1000bp,,平均长度为,3500-5000bp,,它们与平均长度为,13000bp,(个别长几万,bp,)的单拷贝顺序间隔排列。,也有的实验显示人基因组中所有,LINES,之间的平均距离为,2.2kb,拷贝数一般在,1,万左右,如,Kpn,家族等。,Kpn,家族,:,Kpn,家族是中度重复序列中仅次于,Alu,家族的第二大家族。,用限制性内切酶,Kpn,消化人类及其它灵长类动物的,DNA,,在电泳谱上可以看到,4,个不同长度的片段,分别为,1.2,、,1.5,、,1.8,和,1.9kb,,这就是所谓的,Kpn,家族。,Kpn,家族成员顺序比,Alu,家族更长(如人,Kpn,顺序长,6.4kb,),而且更加不均一,呈散在分布,属于中度重复顺序的长分散片段型。,尽管不同长度类型的,Kpn,家族(称为亚类)之间同源性比较小,不能互相杂交,但它们的,3,端有广泛的同源性。,Kpn,家族的拷贝数约为,3000,4800,个,占人体基因组的,1,与散在分布的,Alu,家族相似,,Kpn,家族中至少有一部份也是通过,Kpn,顺序的,RNA,转录产物的,cDNA,拷贝的重新插入到人基因组,DNA,中而产生的。,(3),高度重复序列,卫星,DNA,这类,DNA,只在,真核生物,中发现,占基因组的,10,60,,由,6,100,个碱基组成,在,DNA,链上串联重复高达数百万次。,卫星,DNA,:,实验中常用,CsCI,密度梯度离心将卫星,DNA,与其他,DNA,分开,形成两个以上的峰,即含量较大的主峰和高度重复序列小峰,后者又称卫星区带,(,峰,),。,A,T,含量很高的简单高度重复序列,Satellite DNA,Mouse genome DNA,30%GC in satellite DNA,D4 Genome Complexity,CsCl centrifugation,5 ATAAACTATAAACTATAAACT 3,3 TATTTGATATTTGATATTTGA 5,Drosophila,satellite DNA repeat,(several million copies),n,ACAAACT,1.1x10,7,bp,25%genome,ATAAACT,3.6x10,6,bp,8%genome,ACAAATT,3.6x10,6,bp,8%genome,AATATAG,cryptic,Satellites comprise more than 40%of the genome,(,i,)倒位(反向)重复序列,重复顺序复性速度极快,分布较广,约占人基因组的,5,。,(,ii,)卫星,DNA,卫星,DNA(satellite DNA),是另一类高度重复序列,这类重复顺序的重复单位一般由,2-10bp,组成,成串排列。,由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体,DNA,分开,因而称为卫星,DNA,或随体,DNA,。在人细胞组中卫星,DNA,约占,5-6,。,(,iii,)较复杂的重复单位组成的重复顺序,这种重复顺序为灵长类所独有。用限制性内切酶,Hind,消化非洲绿猴,DNA,,可以得到重复单位为,172bp,的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。,有人把这类称为,卫星,DNA,。而人的,卫星,DNA,更为复杂,含有多顺序家族。,(,iv,)高度重复顺序的功能,a.,参与复制水平的调节 反向序列常存在于,DNA,复制起点区的附近。另外,许多反向重复序列是一些蛋白质(包括酶)和,DNA,的结合位点。,b.,参与基因表达的调控,DNA,的重复顺序可以转录到核内不均一,RNA,分子中,而有些反向重复顺序可以形成发夹结构,这对稳定,RNA,分子,免遭分解有重要作用,.,c.,参与转位作用 几乎所有转位因子的末端都包括反向重复顺序,长度由几个,bp,到,1400bp,。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。,d.,与进化有关 不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。如人的,卫星,DNA,长度仅差,1,个碱基(前者为,171bp,,后者为,172bp,),而且碱基序列有,65,是相同的,这表明它们来自共同的祖先。在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。,e.,同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即,DNA,指纹,.,f.,卫星,DNA,成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星,DNA,顺序。,根据,DNA,复性动力学研究,,DNA,序列可以分成哪几种类型?并加以举例说明。,(2001,年上海生化所),多基因家族与假基因,真核基因组的另一特点就是存在多基因家族(,multi-gene family,)。,多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。,多基因家族大致可分为两类:,一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第,7,号染色体长臂,3,区,2,带到,3,区,6,带区域内;,另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。,在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(,pseudo gene,)。,假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。,与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。,人们推测,假基因的来源之一可能是基因经过转录后生成的,RNA,前体通过剪接失去内含子形成,mRNA,,如果,mRNA,经反复转录产生,cDNA,,再整合到染色体,DNA,中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。,自私,DNA(selfish DNA),在哺乳动物包括人体基因组中,存在着大量的非编码顺序,如高度重复顺序,内含子,间隔,DNA,等。这些顺序中,只有很小一部份具有重要的调节功能,绝大部分都没有什么特殊功用。在这些,DNA,序列中虽然积累了大量缺失,重复或其他突变,但对生物并没有什么影响,它们的功能似乎只是自身复制,所以人们称这类,DNA,为自私,DNA,或寄生,DNA(parasite DNA),。自私,DNA,也许有重要的功能。,高变区,DNA,与,DNA,指纹,人的卫星,DNA,或称随体,DNA,是由一些短的,DNA,片段(,10bp,左右)多次重复所构成的。重复片段的组成和拷贝数在不同的个体及基因组的不同位置上不一样。,提取不同个体的基因组,DNA,后,用其切点能识别序列为,4,个碱基而又不切割该重复片段的限制性内切酶在重复片段的两侧切割基因组,DNA,,然后将样品进行凝胶电泳。不同长度的重复片段(主要是由于重复单位的拷贝数不同所致)就会分开,再与含有这些重复序列的特异性探针杂交,便形成有个体特异性的放射性自显影图,亦称为,DNA,指纹。,DNA,指纹的图谱取决于所用探针的核心序列(即重复序列中的重复单位)。,目前所用的探针有两种,即,探针,33.5,:其核心序列为,AGAGGTGGGCAGGTGG,探针,33.6,:即,AGGGCTGGAGG,。,这两种序列在人体基因组中不同的位置上分别重复不同的次数,而在不同个体的基因组中,对应位置上这两种核心序列的重复次数也不相同。这样用这两种探针之一与合适的酶切割的人体基因组,DNA,片段杂交,在不同的个体将得到不同的,DNA,指纹,而且探针,33.5,的,DNA,指纹图也不相同。,DNA,指纹具有细胞稳定性和种系稳定性,是按孟德尔规律遗传的,而且杂合性高。杂合性可以这样来理解,对于由点突变引起的,RFLP,,就某一个多态性切点来说只有两种多态性,即切点有(,+,)或切点无(,-,)。,而对由于高变区重复片段长度不同所引起的,RFLP,来说,在基因组上某一个位置核心序列的重复次数在不同的个体不一样,比如在个体为,10,个拷贝,个体为,15,个拷贝,而个体又可能为,18,个拷贝等等。因此,在不同个体同一个相应位置上核心序列的重复次数就是多态的,而不是双态的。即使在基因组上的某一个位置处核心序列的次数一样,从而被酶切出的长度相同,但在基因组的其他位置上该核心序列重复次数又可能不同。,由于,DNA,指纹是按孟德尔规律遗传的,子代的,DNA,指纹图可以追溯到其父母,DNA,指纹图上,而在不是其父母的,DNA,指纹图上则很难找到与其一样的小随体,DNA,片段。在父亲的,5,条可分辨的小随体,DNA,片段中,有,4,条处于杂合状态,即这,4,条,DNA,片段有不同的个体长度。因此,因高变区核心序列重复次数不同引起的,RLFP,才是真正的多态性。在不同个体,这种,RLFP,即,DNA,指纹可以说不存在相同的。即使使用一种探针产生的,DNA,指纹图无法鉴定这两个个体,如再用另一种探针便有可能将这两个个体区分开。,DNA,指纹技术已被应用于亲子鉴定和法医学上对罪犯的确认等领域。,2,、原核生物基因组结构特点,(,1,)原核生物的基因组很小,大多只有一条染色体,且,DNA,含量少。,大肠杆菌,DNA,的相对分子质量仅为,2.4x10,9,,或,4.6x10,6,bp,,其完全伸展总长约为,1.3mm,,含,4000,多个基因。最小的病毒如双链,DNA,病毒,SV40,,其基因组相对分子质量只有,3x10,6,,含,5,个基因。,细菌的质粒、真核生物的线粒体、高等植物的叶绿体等也含有,DNA,和功能基因,这些,DNA,被称为染色体外遗传因子。,(,2,)结构简练,原核,DNA,分子的绝大部分是用来编码蛋白质的,只有非常小的一部分不转录,而且,这些不转录,DNA,序列通常是控制基因表达的序列,如,Xl74,的,H,和,A,基因之间,(3906,3973,位核苷酸,),就包括了,RNA,聚合酶结合位点、转录终止信号区及核糖体结合位点等基因表达调控元件。,(,3,)存在转录单元 多顺反子,原核生物,DNA,序列中功能相关的,RNA,和蛋白质基因,往往丛集在基因组的一个或几个特定部位,形成功能单位或转录单元,它们可被一起转录为含多个,mRNA,的分子,叫多顺反子,mRNA,。功能相关的基因。,如,Xl74,中的,D-E-J-F-G-H,等都串联在一起转录产生一条,mRNA,链,然后再翻译成各种蛋白质,其中,J,、,F,、,G,及,H,编码外壳蛋白,,D,蛋白与病毒装配有关,,E,蛋白则导致细菌的裂解。这是功能相关基因协同表达的方式之一。,X174 D-E-J-F-G-H mRNA,蛋白,J,、,F,、,G,H D E,(,4,)重叠基因,即同一段,DNA,能携带两种不同蛋白质的信息。,主要有以下几种情况:,(1),一个基因完全在另一个基因里面,如基因,B,在基因,A,内,基因,E,在基因,D,内。,(2),部分重叠,如基因,K,和基因,C,的部分重叠。,(3),两个基因只有一个碱基对的重叠,如,D,基因终止密码子的最后一个碱基是,J,基因起始密码子的第一个碱基。,有,重叠基因(,Sanger,发现),基因内基因 部分重叠基因 一个碱基重叠,尽管这些重叠基因的,DNA,序列大致相同,但由于基因重叠部位一个碱基的变化可能影响后续肽链的全部序列,从而编码完全不同的蛋白质。除了,X174,外,,SV40,病毒、,噬菌体的,DNA,中也存在基因重叠现象。,基因重叠可能是生物进化过程中自然选择的结果。,二、,DNA,的组成与结构,(一),DNA,的结构,1.,DNA,的一级结构,:,就是指,4,种核苷酸的连接及其排列顺序,表示了该,DNA,分子的化学构成。,核苷酸序列对,DNA,高级结构的形成有很大影响,如,B-DNA,中多聚(,G-C,)区易出现左手螺旋,DNA,(,Z-DNA,),而反向重复的,DNA,片段易出现发卡式结构等。,DNA,不仅具有严格的化学组成,还具有特殊的高级结构,它主要以有规则的,双螺旋,形式存在,其基本特点是:,(,1,),DNA,分子是由两条平行的脱氧核苷酸长链盘绕而成的。(,2,),DNA,分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。(,3,)两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。这就是嘌呤与嘧啶配对,而且腺嘌呤(,A,)只能与胸腺嘧啶(,T,)配对,鸟嘌呤(,G,)只能与胞嘧啶(,C,)配对。,2,、,DNA,的二级结构,1,)定义:,指,两,条多核苷酸链反向平行盘绕所产生的双螺旋结构,。,这些研究表明,DNA,的分子结构不是一成不变的,在不同的条件下可以有所不同。但是,这些不同构象的,DNA,都有共同的一点,:,它们都是,右手双螺旋,;,两条反向平行的核苷酸链通过,atson-Crick,碱基配对结合在一起;,链的重复单位是单核苷酸;,这些螺旋中都有两个螺旋沟,分为大沟与小沟,只是它们的宽窄和深浅程度有所不同,。,DNA,结构的多态性,A,B,Z,Double helix,B form,:,Right-handed,10 base pairs/turn,34,/turn,Diameter:ca.20,Other forms:,A,:11 bases/turn,base plate 20,slant,Z,:12 bases/turn,left-handed helical,one groove,A-T,丰富的,DNA,片段常呈,B-DNA,。,若,DNA,双链中一条链被相应的,RNA,链所替换,会变构成,A-DNA,。,当,DNA,处于转录状态时,,DNA,模板链与由它转录所得的,RNA,链间形成的双链就是,A-DNA,。,A-DNA,构象对基因表达有重要意义。此外,B-DNA,双链都被,RNA,链所取代而得到由两条,RNA,链组成的双螺旋结构也是,A-DNA,。,在右手螺旋中,除,A-DNA,、,B-DNA,螺旋外,还存在,B-DNA,、,C-DNA,和,D-DNA,等不同形式。,左手螺旋,-Z-DNA,Z-DNA(,英文字,Zigzag,的第一个字母,),结构是,1979,年由,Rich,提出的。,Rich,用一位荷兰科学家提供的,d(CGCGCG),结晶,对它进行,X,射线衍射结构分析,最后提出了,Z-DNA,结构模型。,当时,由于用右手螺旋结构模型解链过程来解释大分子,DNA,复制时遇到困难,该模型的提出曾一度动摇过右手螺旋学说,现已证明,左手螺旋,Z-DNA,只是右手螺旋结构模型的一个补充和发展。,虽然,B-DNA,是最常见的,DNA,构象,但,A-DNA,和,Z-DNA,似乎具有不同的生物活性。,在邻近调控系统中,与调节区相邻的转录区被,Z-DNA,抑制,只有当,Z-DNA,转变为,B-DNA,后,转录才得以活化。,而在远距离调控系统中,,Z-DNA,可通过改变负超螺旋水平,决定聚合酶能否与模板链相结合而调节转录起始活性。,3 DNA,的高级结构,DNA,的高级结构是指,DNA,双螺旋进一步扭曲盘绕所形成的特定空间结构。超螺旋结构是,DNA,高级结构的主要形式,可分为正超螺旋与负超螺旋两大类,它们在特殊情况下可以相互转变。,线状,DNA,形成的超螺旋,环状,DNA,形成的超螺旋,拓扑异构酶,or,溴化乙锭,拓扑异构酶,or,溴化乙锭,DNA,扭曲与双螺,旋相同(拧紧),DNA,扭曲与双螺旋相反(松开),负超螺旋,松弛,DNA,正超螺旋,4.,核酸的变性和复性,变性,(,denaturation,),和复性,(,renaturation,),是双链核酸分子的二个重要物理特性。也是核酸研究中经常引用的术语。,双链,DNA,、,RNA,双链区、,DNA:RNA,杂种双链,(,hybrid duplex,),以及其它异源双链核酸分子,(,heteroduplex,),都具有此性质。,(1)DNA,的变性:,指,DNA,分子由稳定的双螺旋结构松解为无规则线性结构的现象。,就是维持双螺旋稳定性的氢键和疏水键的断裂。,断裂可以是部分的或全部的,是可逆的或是非可逆的。,DNA,变性不涉及到其一级结构的改变。,凡能破坏双螺旋稳定性的因素都可以成为变性的条件,:,加热,极端的,pH,有机试剂甲醇、乙醇,尿素及甲酰胺等,均可破坏双螺旋结构引起核酸分子变性。,溶液粘度降低,:,DNA,双螺旋是紧密的,刚性,结构,变性后代之以,“,柔软,”,而松散的无规则单股线性结构,,DNA,粘度因此而明显下降。,溶液旋光性发生改变,:,变性后整个,DNA,分子的对称性及分子局部的构性改变,使,DNA,溶液的旋光性发生变化。,变性导致,DNA,理化及生物学性质的改变,:,增色效应或高色效应,(hyperchromic effect),:,指变性后,DNA,溶液的紫外吸收作用增强的效应。,DNA,分子具有吸收,250,280nm,波长的紫外光的特性,其吸收峰值在,260nm,。,DNA,分子中碱基间电子的相互作用是紫外吸收的结构基础,但双螺旋结构有序堆积的碱基又,束缚,了这种作用。变性,DNA,的双链解开,碱基中电子的相互作用更有利于紫外吸收,故而产生增色效应。,以加热为变性条件时,增色效应与温度有十分密切的关系,这主要是变性温度取决于,DNA,自身的性质。,热变性使,DNA,分子双链解开所需温度称为熔解温度,(melting temperature,Tm),。,Tm,定义中包含了使被测,DNA,的,50%,发生变性的意义,.,不同来源,DNA,具有不同的,Tm,。,在溶剂相同的前提下,有下列两方面造成的:,(i)DNA,的均一性:,DNA,分子中碱基组成的均一性:如人工合成的只含有一种碱基对的多核苷酸片段,与天然,DNA,比较,其,Tm,值范围就较窄。因前者在变性时的氢链断裂几乎可,“,齐同,”,进行,故所要求的变性温度更趋于一致。,其次还包含有待测样品,DNA,的组成是否均一:如样品中只含有一种病毒,DNA,其,Tm,值范围较窄,若混杂有其它来源的,DNA,则,Tm,值范围较宽。,总的说,DNA,均一性,变性的,DNA,链各部分的氢键断裂所需能量较接近,Tm,值范围较窄,反之亦然。,(ii)DNA,的,(G+C),含量:,在溶剂固定的前提下,,Tm,值的高低取决于,DNA,分子中的,(G+C),的含量。,(G+C),含量越高,即,G-C,碱基对越多,Tm,值越高。,因,G-C,碱基对具有,3,对氢键,而,A-T,碱基对只有,2,对氢键,DNA,中,(G+C),含量高显然更能增强结构的稳定性,破坏,G-C,间氢键需比,A-T,氢键付出更多的能量,故,(G+C),含量高的,DNA,其变性,Tm,也高。,实验说明,Tm,与,DNA,中,(G+C),含量存在着密切相关性,变性温度还受到溶液离子强度的影响。,Tm,与,(G+C),含量,(X),百分数的这种关系可用以下经验公式表示,(DNA,溶于,0.2mol/L NaCl,中,):,X%(G+C)=2.44(Tm-69.3),(2)DNA,的复性:,指变性,DNA,在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象。,它是变性的一种逆转过程。,热变性,DNA,一般经缓慢冷却后即可复性,此过程称之为,“,退火,”,(annealing),。,DNA,的复性受温度和,DNA,自身特性等影响。,温度和时间:,一般认为比,Tm,低,5,左右的温度是复性的最佳条件。,降温时间太短以及温差大均不利于复性。,DNA,浓度,:,复性的速度与,DNA,浓度的平方成正比。即溶液中,DNA,分子越多,相互碰撞结合,“,成核,”,的机会越大。,DNA,顺序的复杂性,:,简单顺序的,DNA,分子,互补碱基的配对较易实现。,而顺序复杂的,DNA,如小牛,DNA,的非重复部分,一般以单拷贝存在于基因组中,这种复杂特定序列要实现互补,显然要比上述简单序列困难得多。,Cot,:,Co,为单链,DNA,的起始浓度,t,是以秒为单位的时间,用以表示复性速度与,DNA,序列复杂性的关系。,将温度、溶剂离子强度、核酸片段大小不变,以不同程度的核酸分子重缔合部分,(,在时间,t,时的复性率,),取对数后对,Cot,作图,可以得到如图所示的曲线,用非重复碱基对数表示核酸分子的复杂性。如多聚,(A),的复杂性为,1,重复的,(ATGC)n,组成的多聚体的复杂性为,4,分子长度是,10,5,,核苷对的非重复,DNA,的复杂性为,10,5,。原核生物基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接与基因组大小成正比,对于真核生物基因组中的非重复片段也是如此。,在标准条件下,(,一般为,0.18mol/L,阳离子浓度,400,核苷酸的长的片段,),测得的复性率达,0.5,时的,Cot,值,(,称,Cot 1/2),与核苷酸对的复杂性成正比。,对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。,真核基因组中因含有许多不同程度的重复序列,所得到的,Cot,曲线要较图中的,S
展开阅读全文