资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,原核生物一般只有一个环状的,DNA,分子,其上所含有的基因为一个基因组。,真核生物细胞中的细胞器,如叶绿体、线粒体中的,DNA,一般也为环状,构成叶绿体基因组和线粒体基因组,基因组,DNA,测序的结果表明基因组中不仅包含着整套基因的编码序列,同时还包含着大量非编码序列,即基因之间的序列。这些序列同样包含着遗传指令,(genetic instruction),。因此,,基因组(应该)是指整细胞所包含的,DNA,分子以及,DNA,分子所携带的全部遗传指令。,一个物种单倍体细胞基因组的,DNA,总含量总是恒定的,我们称之为该物种,DNA,的,C,值。每种生物各有其特定的,C,值,不同物种之间的,C,值差异非常大。,2.,基因组的大小与,C,值悖理,基因组的大小一般用碱基对,(bp),的数量来表示。,千碱基对表示,10,3,个碱基对,英文简写,kb.,百万碱基对表示,10,6,个碱基对,英文简写,Mb,。,因此,从总体上说,:,生物基因组的大小与生物在进化上所处的地位及复杂性之间并无严格的对应关系,这种现象称为,C,值悖理,(Cvalue paradox),。,C-value paradox:the lack of direct relationship between the C value and phylogenetic complex.,DNA,的,C,值悖理的另一种表述:,DNA,的,C,值矛盾:,人们无法用已知的功能来解释基因组的如此之大的,DNA,含量,这就叫做,C,值矛盾。,物,种,基因平均,长度,(kbp),平均内含子,/,基因,平均,mRNA,长度,外显子,(,),酿酒酵母,1.5,95,不被打断,1.5,100,线虫,4,3,4,3,77,果蝇,11,3,4,3,25,人类,16,6,7,2.5,13,3.,序列复杂性,(sequence complexity),同一类生物中基因组大小相差悬殊,其主要差别在于“多余”,(excess)DNA,的量的差别。“多余”,DNA,量多,则基因组大;反之,则小。所谓“多余”,DNA,主要是重复序列,即这种,DNA,序列在基因组中可以有不止一个拷贝。,序列复杂性:指的是不同序列的总长度;或者说:,DNA,分子中不重复碱基的总量(用,bp,来表示);或者说:最长的没有重复序列的核苷酸对的数值。,例如,(),40,;其总长为,160bp,,但不重复的碱基为,AT,;所以其序列复杂性为,x=2(bp),。而,(),40,的序列复杂性则为,x=4(bp),。若一个,DNA,分子长度为,10,6,bp,,完全不含重复顺序,则其序列复杂性为,x=10,6,(bp),。,ATAT,TATA,ATCG,TAGC,由此可见,,序列复杂性的高低反映了序列包括的遗传信息量的多少,。,此外,,生物体基因组的复杂程度还表现在基因的外显子数目的多寡,(,见下,图,),。,外显子数目多表现在,RNA,剪接时可以有更多种剪接方式,一个基因可以产生更多种的,RNA,,编码更多种蛋白质分子,也就是一个基因可以不止有一种功能。从进化角度看,更多的外显子有助于形成更多的外显子组合,生成新的基因,对生物在多种环境下生存是有利的。,因此,,C,值悖理可以用很多真核生物基因组中主要是非编码,DNA,来解释。,非编码,DNA,可能是重复,DNA,或单一顺序,DNA,。基因组内单一序列和重复序列的组成情况,可通过,DNA,复性动力学研究来确定。,4.DNA,复性动力学:,DNA,复性,:,当变性,DNA,的两条互补单链在除去变性因素后,可以重新或部分恢复成双螺旋结构的过程。,复性的必要条件:足够的盐浓度,;,温度适中(低于,Tm20-25,),复性过程缓慢:成核作用拉链作用,当两条单链,DNA,接触时,如果某个区段可以互补配对,就先形成一个双链核心区,然后扩展其互补配对区段而复性形成双链。,复性过程很复杂,单链,DNA,复性的速率可用下列公式表示:,dC/dt=-kC,2,这里,,C,是在,t,时单链,DNA,的浓度,,k,是二级反应常数。上述公式可以重排为:,-dC/C,2,=kdt,对上式积分整理得,:,C/C,0,=1/(1+kC,0,t),这里,C,0,是,t,0,时,DNA,的初始浓度。,这个公式表明反应中单链,DNA,所占百分数,(C/C,0,),是,DNA,初始浓度,(C,0,),同反应时间,(t),乘积的函数,通常用,C,0,t,来表示。,在一个特定的实验中,,C,0,是已知的,,C,是可以测定的,如,C/C,0,对,C,0,t,作图可以得到下图的曲线,称为,Cot,曲线,(,见下图,),。,当,C/C,0,=0.5,即复性反应完成一半时,(t,1/2,),的,Cot,值定义为,C,0,t,1/2,。,当条件一定时,,C,0,t,1/2,的大小与,DNA,的分子量及复杂性有关,体现在:,(1)C,0,t,1/2,越大,表示复性速度越慢,,DNA,的分子量越大。,DNA,总量一定时,基因组越复杂,任何特定顺序的 拷贝数就越少。,例如,,DNA,起始总量为,12pg,,一种细菌基因组大小为,0.004pg,则它的各种顺序有:,12/0.004=3000,拷贝。另一种真核生物基因组大小,3pg,12/3,4,拷贝。尽管测得的,C,0,绝对量相同,12pg,(核苷酸,mol/L,),而事实上后者各顺序的浓度比前者低了,3000/4=750,倍。要使该真核生物基因的拷贝数也达到,3000,则要多加,750,倍的,DNA.,因此,该真核生物,DNA,复性反应,C,0,t,1/2,是细菌,DNA,反应,C,0,t,的,750,倍。,(2),在不存在重复序列的情况下,,C,0,t,1/2,值与基因组的大小成正比,也即与反应体系中的复杂度成正比,:X,C,0,t,A.,在一般标准条件下,(,阳离子浓度为,0.18 mol/L,,片段大小为,400bp),,,K=510,5,,,则有:,X=510,5,C,0,t,B.,在非标准条件下,通常用大肠杆菌的,DNA,作为标准测定未知,DNA,的复杂度,:C,0,t,1/2,(,欲测基因组,DNA)/C,0,t,1/2,(,大肠杆菌,DNA),复杂度,(,欲测基因组,DNA)/(4.2 10,6,),(3).,在有重复顺序的复性中,在同一个复性曲线上的各动力学组分的,C,0,t,1/2,并不因基因组的大小而增减,而是与,DNA,序列的重复频率成反比:,C,0,t,(1),:,C,0,t,(2),f(2):f(1),式中,(1),和,(2),代表两个不同的动力学组分,,f,代表其重组频率(拷贝数)。,复性动力学研究表明:原核生物基因组的,Cot,曲线是单一的,S,形曲线;真核生物基因组的,Cot,曲线是多,S,形曲线,由若干个(一般,2,3,个),S,形加合成的曲线。,5.,基因组,DNA,序列的分类,基因序列与非基因序列,开放阅读框,(open reading frame,ORF),编码序列与非编码序列,(coding or non-coding sequence),单一序列与重复序列,(unique or repetitive sequence),短串联重复序列,(short tandem repeat,,,STR),和,序列标定位点,(sequence tagged site,,,STS),。,重复序列的分类:,轻度重复序列:组蛋白基因和酵母,tRNA,基因,中度重复序列:,10-,几百份拷贝的,DNA,序列,高度重复序列:基因组中有几百份甚至几百万份拷贝的,DNA,序列。既有重复几百份拷贝的基因,如,rRNA,基因和某些,tRNA,基因,更多的则是很短的非编码序列的重复。这些序列往往是许多份拷贝呈头尾衔接的串联形式,也就是串联重复序列,(tandem repeat),。,不同生物基因组中重复序列所占比例:,原核生物基因组:基本上不含有重复序列,低等真核生物基因组:重复组成不超过,20,,且多半是中度重复序列,动物细胞基因组:中度和高度重复序列约各占,50,一些显花植物和两栖类动物基因组:中度和高度重复序列几乎可以高达,80,6.,重复顺序,DNA,:,基因家族,(gene family),:,由同一个祖先基因经过重复,(duplication),与变异进化而形成结构与功能相似的一组基因,组成了一个基因家族。基因家族中的各个成员可以聚集成簇也可以分散在不同染色体上,或者两种情况兼而有之。结构基因家族中各个成员通常具有相关的甚至相同的功能。,基因簇,(,gene cluster),:,由相同或相关的邻近基因组成的一个基因群或一组基因。,多基因家族,(multigene family),:,是一个基因组中功能相似、进化上同源的一组基因。在这些基因中,拷贝数、顺序保守性、构成、分布状态和功能相关性有很大差异。例如:在一些多基因家族中,家族成员可能非常相似或完全一样,(,如,rRNA,基因,),。在其他一些例子中,保守性非常差,即使通过序列比较也不能发现。经典的多基因家族是结构相似,在整个编码顺序中保守。它们可以在特殊座位上成簇排列,(,如人类,珠蛋白基因,),、分散的,(,如人类肌动蛋白基因,),或者两者都有,(,玉米醇溶蛋白基因,),。,孤独基因,(orphon),:,成簇的多基因家族的偶尔分散的成员。,孤儿基因,(,orphan),:,是在基因组测序计划中发现的,在其他有机体中没有对应的基因,已确定它没有功能。,超基因家族,(supergene family),:,DNA,序列相似,但功能不一定相关的若干基因家族或单拷贝基因总称。,假基因,(pseudo-gene),:,多基因家族一些结构保守的基因由于突变使基因功能完全丧失,这样的无功能的基因拷贝称为假基因,。,a.,未加工的假基因,(nonprocess pseudo-gene),常规假基因,(conventional pseudo-gene),b.,加工的假基因,(processed pseudo-gene),反转录假基因,(retropseudo-gene),未加工的假基因:,是指通过基因组,DNA,复制产生,经常位于相同基因有功能拷贝的附近。它们与有功能的同源基因有类似的结构,可以包括内含子和调节元件。这样的假基因在细菌和真核生物中都有发现,因为它们是积累突变,包括使转录消失的调节突变和产生截短编码产物的无义突变,所以能够被识别。偶尔未加工的假基因可以通过一个有利的突变重新激活。,加工的假基因,是指通过对,mRNA,的反转录和获得的,cDNA,的随机整合而产生;它们经常是分散的。加工假基因是由反转录因子,(,参阅,),编码的反转录酶和整合酶的外来活性而产生的,只在真核生物中被发现。加工的假基因结构对应于起源基因的转录单位,缺乏内含子和侧翼顺序。因为缺乏侧翼顺序,加工假基因一般不表达。但在人类中发现的高度重复序列,Alu,元件却是能表达的一种假基因。,结构和功能的冗余性,:,冗余,(redumdant),序列是在基因组中出现超过一次的序列,也就是增加基因组大小,并不增加复杂性的序列。冗余基因并不必定是功能冗余。一些基因被发现有冗余拷贝,以产生足够基因产物,(rRNA,基因属于这一类,),,另一些进化以实现不同功能。,功能冗余可以通过特定基因或元件的缺失造成表型缺陷来建立。完全或部分功能基因冗余在多细胞有机体的很多定向突变中可以看到。,重复,DNA,顺序的结构:,串联重复,(tandem repeats),不完善的重复,(hyphenated repeats),分散重复,(dispersed repeats),单个重复顺序间可以是相同方向重复或者是相反方向重复排列。,卫星,DNA:,是高等真核生物基因组重复程度最高的成分,由非常短的串联多次重复,DNA,序列组成。高度重复,DNA,在物种间变化,但一般占了基因组的,10,30,。因为它的低复杂性,有时称为简单序列,DNA,,又因为其不寻常的核苷酸组成,它经常在浮力密度梯度离心中从整个基因组,DNA,中分离成一个或多个“卫星”条带,也称为卫星,DNA,。,卫星,DNA,(,Satellite DNA,),:,大多数位于着丝粒区或核仁 区。,小卫星,DNA(Minisatellite DNA),:,一般位于端粒处,由几百个核苷酸对的单元重复组成。,微卫星,DNA(Microsatellite DNA),:,由,2,20,个左右的核苷酸对的单元重复成百上千次组成,隐蔽卫星,DNA(cryptic satellite DNA):,有些重复,DNA,与大多数基因组,DNA,具有相当的浮力密度,离心时并不象卫星,DNA,那样被分开,它不形成卫星条带,但它的属性却类似卫星,DNA,,因此我们称之为隐蔽卫星,DNA,。它可以通过限制性作图等方法来鉴定。大多数人类染色体的中心粒,DNA,包含了隐蔽卫星,DNA,,称为,-,卫星,DNA,。,7.,原核生物与真核生物基因组的特点:,原核生物基因组:,(,1,)不具备明显的核结构,只有,DNA,的集中区,形成拟核,Nucleoid,(,2,)基因组小,;,多数基因都包括在单一环状,DNA,分子上,单一,DNA,复制起点,一个复制子。,(,3,)重复序列和不编码序列很少。,DNA,的绝大部分是用来编码蛋白质的,只有非常小的部分不转录。一般无内含子和重复基因,即原核生物基因是连续的基因。,(,4,)功能上密切相关的基因构成操纵元或高度集中,常转录成多基因,mRNA,(多顺反子,mRNA,)。,(,5,)有重叠基因。这是因为原核生物的基因组往往很小,为了充分利用有限的,DNA,序列来编码更多的蛋白质,不得不使一些基因重叠起来,这是它们增加自己的遗传信息的一种重要的进化策略。,(,6,)除,rRNA,和,tRNA,基因外,结构基因通常是单一的,DNA,序列;因此,原核生物结构基因往往是单拷贝的。,真核生物基因组:,(,1,)真核生物基因组数目庞大,结构复杂,基因组大部分位于细胞核中,一般由多条染色体组成,每条染色体又是由,DNA,分子与蛋白质稳定结合形成染色质的多级结构,(,2,)每条染色体的,DNA,分子具有多个复制起点;真核基因多为断裂基因。,(,3,)编码序列仅占基因组,DNA,的一小部分,绝大多数为非编码序列。,(,4,)存在着大量的奢侈基因:,真核生物基因呈时序表达,不同的组织细胞在不同时期有不同的基因表达谱。某一细胞在特点的时期只有约,1,3,的基因表达,大部分的基因处于静息状态。,活动的基因中仅有小部分基因对于维持各种细胞生命活动是必需的,我们称之为看家基因,(house-keeping gene),。据估计,人的一个体细胞内约有,1000,个看家基因。,大部分的基因在某种细胞的特定时期,以完成某种特殊功能,这些基因称为奢侈基因。,(,5,)没有重叠基因。,一段结构基因,DNA,经转录和翻译只形成一种有功能的,RNA,和多肽链。高等生物基因组中有少数基因转录成,hnRNA,后,经过不同的剪切,可以形成几个长短不同的,mRNA,和多肽链,但保持相同的核心模块,功能作用相似。,(,6,)基因组中存在大量的重复序列。,Thanks!,
展开阅读全文