收藏 分销(赏)

基因与基因组.ppt

上传人:精**** 文档编号:12855737 上传时间:2025-12-17 格式:PPT 页数:97 大小:2.86MB 下载积分:10 金币
下载 相关 举报
基因与基因组.ppt_第1页
第1页 / 共97页
基因与基因组.ppt_第2页
第2页 / 共97页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,6.,基因与基因组,1,1.,基因概念的历史演变,2.DNA,与基因,3.,真核生物的割裂基因,4.,基因大小,5.,重叠基因,6.,真核生物的基因组,真核生物,DNA,序列组织,8.,细胞器基因组,9.,基因组计划,2,1.1,基因(,gene,)的概念,基因是遗传的功能单位,,DNA,分子中,不同排列顺序,的,DNA,片段构成特定的功能单位;,含有合成有功能的蛋白质多肽链或,RNA,所必需的全部核苷酸序列。,广义地说,基因是,有功能的,DNA,片段,。,1.,基因概念的历史演变,3,1.2,基因概念的历史演变:,(,1,),Mendel,提出基因的存在,(,2,),Morgan,证实基因在染色体上,(,3,)“一个基因一个酶”修正为“一个基因一个多肽链”,“,基因,”,一词的创立,:1909,年,丹麦遗传学家约翰逊,“,基因,”,(,gene,)。,4,Gregor Mendel,5,Thomas Hunt Morgan,6,1.3,基因概念的理论基础,1.3.1,一个基因一个酶,1941,年,G W Beadle,和,E L Tatum,研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。,7,1903,年,10,月,22,日,乔治,威尔斯,比德尔,(G.W.Beadle),出生于美国内布拉斯加州一户农民家庭,1926,年和,1927,年先后获内布拉斯加林肯大学理科学士和硕士学位,.,尔后,他到康奈尔大学,在遗传学大师爱默生,(Emerson),领导的,玉米小组,攻读博士学位,从事玉米细胞遗传学研究,.,1 931,年获博士学位后,他又到加州理工学院,在遗传学大师摩尔根,(Morgan),领导的,蝇室,从事果蝇细胞遗传学研究,.,1936,年,他到哈佛大学任助理教授,1937,1946,年任斯坦福大学教授,1946,年回到加州理工学院任教授和生物学系主任,1961,1968,年任芝加哥大学校长,.,比德尔和泰特姆,(Tatum),以及莱德伯格,(Lederberg),共获,1958,年诺贝尔生理学或医学奖,.,8,1958,年诺贝尔生理学或医学奖得主,:,发现了基因通过调节,特定的化学事件而起作用,比德尔,George Wells Beadle,美国遗传学家芝加哥大学校长教授,1903,1989,塔特姆,Edward Lawrie Tatum,美国生物化学家洛克菲勒医学研究所 教授,1909,1975,莱德伯格,Joshua Lederberg,美国遗传学家威斯康星大学 教授,1925,年,9,比德尔等通过果蝇复眼色素的研究和脉孢菌的营养缺陷型的研究,于,1941,年提出了,“,一个基因一种酶,”,假说。这一假说揭示了基因的基本功能。他所使用的营养缺陷型研究方法,以后被广泛应用于各种代谢途径和发育途径的研究。,J.,莱德伯格采用大肠杆菌的营养缺陷型发现了细菌的遗传重组,从而开辟了微生物遗传学研究的广阔领域。因此,无论在概念上还是在方法上,,“,一个基因一种酶,”,的假说及工作,是分子生物学的重要基础之一。为此,比德尔与泰特姆以及莱德伯格共同获得了,1958,年的诺贝尔生理学或医学奖。他的重要著作有:,遗传学引论,(和,A.H.,斯特蒂文特合著,,1939,)、,遗传学和现代生物学,(,1963,)、,生命的语言,(和,M.M.,比德尔合著,,1966,)等。,10,1.3.2,一个基因一条多肽链,本世纪,50,年代,,Yanofsky,有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了,“,一个基因一条多肽链,”,的假设。,11,1968,年诺贝尔生理学或医学奖得主,.,解读了遗传密码及其在蛋白质合成方面的机能,霍利,(,1922,1993),Robert W,Holley,美国分子生物学家,康奈尔大学,科拉纳,(1922,),Har Gobind Khorana,美国生物化学家,威斯康星大学,尼伦伯格,(1927,),Marshall W,Nirenberg,美国生化遗传学家国立卫生研究院,12,1.3.3,基因的化学本质是,DNA,(,有时是,RNA,),1944,年,,O T,Avery,证实了,DNA,是遗传物质。,有些病毒只含有,RNA,。,1953,年沃森和克里克建立,DNA,分子的双螺旋结构模型。,13,1.3.4,基因顺反子(,Cistron,)的概念,1955,年,美国本兹尔,(Benzer),提出,顺反子,的概念,:,是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。,基因仅是一个,功能单位,,基因内部的碱基对才是,重组单位和突变单位。,14,一对同源染色体上两突变(,a,和,b,)在同一染色体上时,称为,顺式构型,,在两条染色体上时,为反式构型,;,顺反互补测验,(,cis-trans test,):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。,测验时,,两突变发生在同一基因上,杂合体就不存在野生型的基因,因而为突变体表型;,如果两突变在两个不同的基因上,后代杂合体中将有一个基因是野生型的,另外一个基因是突变型,杂合体的表型成了野生型。这两个基因的这种关系称为,互补,。,15,1.4,新的发现 概念,断裂基因,重叠基因,跳跃基因,16,可转录、可翻译的,(如乳糖操纵子结构基因,Z,Y,A,真核蛋白基因,),可转录但不翻译,(,tDNA,rDNA,),不转录、不翻译,(,promoter,operator,),1.5,基因的类型,17,2.DNA,中的编码区与间隔区,1),编码区:,与蛋白质中氨基酸序列相应的核苷酸序列。,2),间隔区:,基因序列外,没有编码功能序列。,3),转录单位的组成:,启动子,上游调控区,基因编码区,转录终止序列,4),假基因:,在序列上与活性的基因相似,但不能转录或翻译生成成熟,mRNA,或蛋白质,或产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质。,18,3.,真核生物的断裂基因,19,3.,1,割裂基因(,splitting gene,),不连续基因(,discontinuous gene,),断裂基因(,interrupted gene,),本世纪,70,年代,,Chambon,和,Berget,。,通过成熟,mRNA,(或,cDNA,)与编码基因的,DNA,杂交试 验而发现。,割裂基因,:基因的编码序列在,DNA,上不是连续的,而是被不编码的序列隔开。,外显子,Exon,:基因中编码的序列,与,mRNA,的序列相对应。,内含子,Intron,:基因中不编码的序列。,20,R,环,鸡的卵清蛋白基因,DNA,与其,mRNA,杂交图,21,剪接,:,前体,RNA,中由内含子转录下来的序列去除,并把由外显子转录的,RNA,序列连接起来的过程。,割裂基因,前体,mRNA,Introns,去除,Exons,连接,22,3.2,割裂基因的性质:,1,)外显子在基因中的排列顺序和它在成熟,mRNA,产物中的排列顺序是相同的,,2,)某种割裂基因在所有组织中都有相同的内含子成分,,3,)核基因的内含子的可读框,通常,含无义密码子,没有编码功能。,23,3.3,割裂基因,的普遍性,a),真核生物中:,绝大部分结构基因,tDNA,rDNA,mtDNA,cpDNA,b),原核生物 中:,SV40,大,T,抗原,gene,小,t,抗原,gene,T4 phage,的胸苷合成酶,gene,1017 bp intron,24,四、基因大小,25,与所包含的内含子的数目相关,不同生物的外显子数目随着进化增加,基因平均长度也在增加。,在进化相关的相似组织的基因,其外显子基本一致,内含子的位置也是保守的,只是长度有变化。,基因的大小,26,27,五、重叠基因,28,1977,年 维纳,(Weiner),1978,年 费尔,(Feir),和桑戈尔,(Sanger),在噬菌体,G4,、,MS2,和,SV40,中都发现了重叠基因,基因的重叠,原核生物的重叠基因,29,果蝇蛹上皮蛋白质基因,位于另一个基因的内含子之中,人,I,型神经纤维瘤,(NF1),基因,的第一个内含子中有三个编码蛋白质的基因,,线虫基因组中每个基因平均有,5,个内含子,有的内含子中包含,tRNA,基因,,以上这些重叠基因的转录方向不一定与包含它的基因的转录方向一致,两个重叠基因的转录是各自独立、互不依赖,。,30,真核生物的重叠基因,31,砂囊,砂囊(,shanang,),(,1,),脊椎动物,鸟类的胃分为前胃和砂囊两部分。砂囊又称“肌胃”。它前接前胃,后通,小肠,。砂囊常具有很厚的,肌肉,壁,胃腔较小。凡食谷类,坚硬果实以及杂食性的鸟类,其砂囊内面一般都有一层,角质,皮,囊内贮有吞入的砂石,用以代替,牙齿,磨碎,食物,,故称砂囊。但食肉性的鸟类(如鹰等),砂囊壁较薄,且无角质衬里。,(,2,)无脊椎动物,蚯蚓,的胃壁肌肉也很厚,并有很强收缩力,能磨碎食物,故也称砂囊。,32,六、真核生物的基因组,33,基因组(,genome,),:真核基因组是指一个物种单倍体的染色体所携带的一整套基因。,比如,人,基因组的全长为大约,3,10,9,对,碱基,编码,3-4,万个蛋白,分子,6.1,真核生物的基因组:,34,与预期的编码蛋白质的基因的数量相比,基因组的,DNA,含量过多,例:人类与,E.coli,编码基因数目的比较研究,E.coli.4.2 X 10,6,bp DNA,约编码,3000,种基因,人类,3.3 X 10,9,bp,的,DNA,是大肠杆菌的,700,多倍,根据不同细胞中的,mRNA,数目来估算表达基因的方法,,“,人类大约有万个基因,而蛋白质却有十万甚至更多的蛋白质,这说明与过去,一个基因编码一种蛋白质,的假设相比,每个基因可能负责合成多种蛋白质,?,”,持家基因(,housekeeping gene,),:有些基因是在所有的细胞类型中都表达的,即这些基因的功能为所有细胞所必须(或称,组成型基因,constitutive gene,),奢侈基因(,luxury gene,),:,仅在某种特定类型的,细胞中表达的基因。,35,原核生物与真核生物基因组的特点,原核生物基因组的特点:,1,)原核生物的基因组很小,,DNA,含量低;,2,)原核生物,DNA,不和蛋白质固定结合,一般不具有核小体结构;,3,)原核生物的基因组内绝大部分序列用于编码蛋白质。,4,)功能上密切相关得到基因高度集中形成一个功能转录单位,可以转录形成含有多个蛋白质分子的一个,mRNA,单元。,5,)重复序列少,具重叠基因;,36,真核生物基因组的特点:,1,)真核生物基因组的分子量大,2,)真核生物的,DNA,一般与蛋白质结合成染色体。,3,)转录和翻译在细胞中不同的位置进行。,4,)基因组,DNA,的大量序列不编码蛋白。,5,)真核生物的蛋白编码基因往往以单拷贝存在。,37,6.2,基因组大小和,C,值,C,值,(C Value),:,在每一种生物中其单倍体基因组的,DNA,总量是特异的。,DNA,的长度是根据碱基对的多少推算出来的。,C,值是每种生物的一个特征,不同生物之间差别很大,38,低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大,39,C,值矛盾,(C-value paradox)C,值悖论:,C,值和生物结构或组成的复杂性不一致的现象,。,高等生物的,C,值不一定就意味着它的,C,值高于比它低等的生物。,C,值悖论,在每一种生物中其单倍体基因组的,DNA,总量是特异的,被称为,C,值,(,CValue,)。,40,某些生物的基因组数据,物种 基因组大小 基因数目 基因长度,X174 0.7kb 10,噬菌体,45Kb 100,大肠杆菌,4.2Mb 4200 1.2kb,酿酒酵母,13.5Mb 6300 1.4kb,果蝇,14 Mb 12000 11.3kb,人,3.3Gb 35000 16.3kb,拟南芥,70Gb 25000,3,基因组的基因数目,41,七、真核生物,DNA,序列组织,42,DNA,复性过程遵循二级反应动力学,DNA,复性过程中单链消失的速度用公式表示:,-dC/dt=kC,2,7.1 DNA,的复性动力学,反应初始,t=0,单链,DNA,浓度,=C,0,反应达,t,时,单链,DNA,浓度,=C,t,K,复性速度常数,影响,DNA,复性的因素:,DNA,序列的复杂性、初始浓度、片段大小、温度、离子强度,.,43,7.2,重复序列,(repetitive sequences),真核生物复性动力学研究发现了重复序列,单拷贝序列,轻度重复序列,中度重复序列,高度重复序列,44,1,)单拷贝序列,(single copy sequences),又称非重复序列:,一个基因组中只有一个拷贝。,单一序列的复性曲线常只有一个拐点,而重复序列常有多个拐点。,结构基因,(,蛋白质基因,),大多是单拷贝。,7.3.,真核基因序列,45,2,)轻度重复序列,(light repetitive sequences),在基因组中重复数,2-10,的重复顺序,,为慢复性速度。,少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。,多为编码功能,46,3,)中度重复序列,(moderate repetitive sequences),基因组中重复数十至数万(,10,5,)次的重复顺序,,复性速度快于单拷贝顺序,慢于高度重复顺序。,多与单拷贝基因间隔排列。,多为非编码序列,,如,Alu,序列。*,也有编码基因,产物的,如,rDNA,、,tDNA,、,Histone gene cluster,一般往往以基因家族的形式组织。,47,Alu,序列,Alu,重复序列是哺乳动物基因组中,SINE,家族的一员,约有,50,万份拷贝。也就是说平均,4,6 kb,中就有一个,Alu,序列。由于这种,DNA,序列中有限制性内切核酸酶,Alu,工的识别序列,AGCT,,所以称为,Alu,重复序列。,典型的人基因组,Alu,序列长,282 bp,,由两个同源但有差别的亚基构成。亚基来源于有缺失突变和点突变的,7SLRNA,基因。两个亚基间由腺嘌呤核苷酸密集的序列连接。右边的亚基中有无关的,31 bp,插入片段,称为,IH,。,Alu,序列两端各有一个正向重复序列,末端有一个,poly(A),尾。,Alu,序列一般散在分布,少数呈簇状分布。在细胞遗传学水平上观察,,Alu,重复序列集中在基因转录最活跃的染色体区段内。在所有已知的基因内含子中,几乎都发现了,Alu,序列。,是非自主性的反转录因子(借助于细胞内存在的反转录酶等进行转座),48,4,)高度重复序列,(highly repetitive sequences),在基因组中重复频率高,可达百万,(10,6,),以上,,复性速度很快。,序列一般较短,长,10-300bp,,,如真核生物的卫星,DNA,。,49,不同生物的非重复基因占基因组的比例差别很大;,原核生物无重复序列,低等真核生物,10-20%repetitive sequence,高等植物,80%,高等动物,50%,原核生物无重复序列,低等真核生物,10-20%repetitive sequence,高等植物,80%,高等动物,50%,平均长度为,13000bp,单拷贝顺序储存了巨大的遗传信息。,真核生物的单一序列:,50,7.4.,真核生物基因家族,7.4.1.,基因家族和基因簇,基因家族(,gene family,),:真核生物基因组中来源相同,结构和功能相关的基因聚集在一起形成基因家族。,根据分布形式分基因簇和散布的基因家族,:,1,)基因簇(,gene cluster,),基因家族的各个成员,紧密成簇排列,成大段的,串联重复,单位,分布在某一条染色体的特殊区域;,它们可同时发挥作用,合成某些蛋白质。,51,2,)假基因(,pseudo gene,):,在多基因家族中,某些并不产生有功能产物的基因成员。,假基因与有功能的基因同源。,关于假基因的来源一般认为是由,mRNA,反转录成,cDNA,,然后整合在基因组中。假基因同,cDNA,一样没有内含子序列,也没有启动基因转录的启动子序列,而在,5,端都有,mRNA,分子特有的多聚腺苷,poly(A),序列。,由于假基因没有,生物学,功能,所以不再受到进化的选择压力,因此在假基因中可以积累许多突变,并常常同时存在三种终止,密码子,序列。,假基因是由功能基因演变而来,可以看作是进化的一种遗迹。,52,3,)散布的基因家族(,interspersed gene family,),概念:,一个基因家族的不同成员成簇地分布不同染色体上,各成员在序列上有明显差异。,这些不同成员编码一组,功能上紧密相关,的蛋白质,如,珠蛋白基因家族。,53,7.4.2.,广义的基因家族,根据基因家族成员序列的相似程度分类:,1,),经典的基因家族,,家族成员序列有高度的同源性,序 列一致,拷贝数高,非转录间隔区短而一致。,2),基因家族各成员的编码产物保守(,大段的高度保守,氨基酸序列);只是,DNA,序列的相似性低。,3,)基因家族各成员的编码产物之间只有,很短的保守氨基酸,序列,,DNA,序列的相似性更低。,4,),超基因家族,,各基因序列之间,无同源性,,但其基因产物的功能相似。编码产物之间也无明显的保守氨基酸序列,但也有一些共同特征。,54,7.4.3,基因外的重复序列,即为无编码功能的重复序列,7.4.3.1,串联重复,DNA-,卫星,DNA(,高度重复序列,),7.4.3.2,散布的重复,DNA,55,7.4.3.1,卫星,DNA,(satellite DNA),特点:,高度重复序列,,,重复单位由,2-10bp,组成,,成串排列。,56,卫星,DNA,:,将,DNA,切成数百个碱基对的片段进行超速离心,简单高度重复序列区段浮力密度较小,很容易和总体,DNA,分开,在主要的,DNA,带的上面伴随一个次要带。,CsCl,离心,57,卫星,DNA,的分类,(1),卫星,DNA,:,长串联重复序列,位于染色体上的异染色区域。,(2),小卫星,DNA,重复序列,(minisatellite),:中等大小的串联重复序列,位于染色体末端,或其他部位。,高变小卫星,DNA,:,重复单位之间的序列差异大,但是有一个核心序列,GGGCAGGAXG,近端粒部位;,端粒,DNA,:,主要有六个串联重复单位组成,TTAGGG,58,卫星,DNA,的分类,(3),微卫星,(microsatellite,MS,),或为简短串联重复,(STR,short tandem repeats):,由更简单的重复单位组成的小序列,一般为,2,6,个碱基重复,如,(CA)n,(GT)n,(CAG)n,等,,(CA)n,最为常见。,在染色体,DNA,中散在分布,,其数量可达五到十万,是目前最有用的遗传标记。,59,7.4.3.2,散布的重复,DNA,重复单位不成簇,,分散在染色体的各个位点上。,1,)短分散片段,2,)长分散片段,60,1,)短分散片段(,short interspersed repeated segments,SINES,),特点:,长度约为,300bp,,,与长度约,1000bp,的单拷贝顺序间隔排列。,拷贝数可达,10,万左右。,如人的,Alu,家族。,61,Alu,家族:,Alu,家族是哺乳动物包括人基因组中含量最丰富的一种,中度重复顺序,家族,在单倍体人基因组中重复达,30,万,-50,万次,约占人基因组的,3-6,。,长度约,300bp,,,含有限制性内切酶,Alu,的切点(,AGCT,)。,具有,种的特异性,。,相近的生物体中存在,相似性,,,Alu,顺序,很象转座子,,每个,Alu,顺序两侧为,6-20bp,的正向重复顺序。,62,功能:,可能参与,hnRNA,的加工与成熟。,与遗传重组及染色体不稳定性有关。,有形成,Z-DNA,的能力。,可能具有转录调节作用。,还有许多其它家族如:,Kpn,家族、,Hinf,家族、,多聚,d,-d,家族等。,63,2,)长分散片段(,long interspersed repeated segments,LINES,),重复顺序的长度大于,1000bp,,平均长度为,3500-5000bp,,,与平均长度为,13000bp,(个别长几万,bp,)的单拷贝顺序间隔排列。,在基因组中的比例随不同种属差异大,为,10-40,。,64,65,8,、细胞器基因组,66,8.1,真核细胞中的线粒体和叶绿体基因组,1,)线粒体的基因组,mtDNA,:,哺乳动物的,mtDNA,为,16.5Kb,为核,DNA,的,1%,。,2,)叶绿体的基因组,cpDNA,植物的,cpDNA,是动物的,8-9,倍,一般为,121-155Kb,;,67,68,2.,细胞器的蛋白合成系统,tRNA,、,rRNA,、,RNA,聚合酶、核糖体等。,有些生物的细胞器基因,一部分是自身合成,一部分是核基因组编码的,,如细胞色素氧化酶;,还,有一些基因在某些生物中是自我合成的,在别的生物中由核基因组编码,,如,ATP,酶基因;,69,9.,基因组计划,70,什么是基因组,(Genome),基因组就是一个物种中所有基因的整体组成,人类基因组有两层意义:,遗传信息,遗传物质,从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。,71,基因组:,遗传信息的总和。或者说是细胞或生物体全套遗传物质。,1.,举世瞩目的人类基因组研究计划,72,遗传图谱:,某一物种的染色体图谱,显示所知的基因或遗传标记的相对位置,通过遗传重组所得到的基因在具体染色体上线性排列图。,物理图谱,染色体上每个,DNA,片段的实际顺序。利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离碱基对,(bp),或千碱基,(kb),或兆碱基,(Mb),的图谱。,序列图谱,是在遗传图谱和物理图谱的基础上建立起来的。,基因图谱:,在人类基因组中鉴别出占具,2%5%,长度的全部基因的位置、结构与功能。,基因组研究的具体内容,73,74,1.,图谱标记,图谱构建中需要可以鉴别的标记,(marker),,在构建遗传图谱中,可用基因和,DNA,作为标记。,(1),基因标记,基因控制性状的表现,所以也就是利用可以鉴别的,形态、生化等表型性状作标记,,,这与前述的连锁交换中介绍的方法一样。遗传学中最早建立的果蝇连锁图,就是利用控制果蝇眼睛的一些基因作为标记,分析各基因间的连锁关系及遗传距离,绘制出连锁遗传图谱。,这些基本原理和方法,仍在现在的基因组遗传图谱构建中广泛应用。,遗传图谱的构建,75,DNA,标记,以,DNA,为基础的分子标记主要包括(,Gupata et al,,,1999,),基于杂交的分子标记,如,RFLP,(,Restriction fragment length polymorphism,)。,基于,PCR,的分子标记,如,RAPD,(,Random amplified polymorphic DNA,)、,SSR(simple sequence repeats,;又称,microsatellite),、,AFLP(Amplicon fragment length polymorphism),等。,基于,DNA,序列和芯片的分子标记,如,SNP,(,single nucleotide polymorphism,)。,76,RFLP,RFLP,技术是基于,Southern,杂交的分子标记的方法。它是指用限制性内切酶酶切不同个体基因组,DNA,后,酶切片段长度的差异。这一技术用放射性同位素标记,DNA,片段作为同源序列探针(,RFLP,标记),与经限制酶消化并转移到支持膜上的基因组总,DNA,杂交,通过放射性自显影(或非同位素技术)来显示酶切片段的大小,检测不同遗传位点的多态性,.,RAPD,RAPD,由,Williams,等(,1990,)和,Welsh,等(,1990,)分别发展起来的分子标记技术。这一技术是以基因组,DNA,为模板,采用随机设计的单个寡核甘酸序列(一般为,10bp,)为引物,通过,PCR,扩增,产生不连续的,DNA,产物,用于检测,DNA,序列的多态性。,77,重复序列:,串联重复序列(,tandem repeated sequence,),其重复单位首尾相连,成串排列(,Flavell 1986,)。,散布重复序列(,interspersed repeated sequence,),其重复单位与其它无关序列或单拷贝序列相间排列。,微卫星,DNA,序列又称简单重复序列(,simple sequence repeat,,,SSR,)、短串联重复序列(,short sequence repeat,,,STR,),它是由几个核甘酸(一般,15,个)为重复单位簇集而成的串联重复序列,可分布在整个基因组的不同位置上,而且在基因组中的分布是随机的,。,微卫星长度具有高度变异性,并且这种多态性常常表现复等位性,两端的序列多是相对保守的单拷贝序列,因而可以根据两端的序列设计一对特异引物,扩增每个位点的微卫星序列,从而揭示其长度的多态性,(,simple sequence length polymorphism,,,SSLP,)。,SSR,或微卫星,78,ISSR,ISSR,是一种新型的分子标记。与,SSR,相反,直接用同位素标记,SSR,序列,扩增,2,个,SSR,间的单拷贝序列。为了增加扩增的特异性,在引物的,5,和,3,端分别加入,1,2,个选择性碱基,引物长度,16,18bp,。,AFLP,AFLP,是由荷兰,Key Gene,公司,Zabeau,(,1992,)发现,并由,Vos,等(,1995,)发展起来的分子标记技术,结合了,RFLP,和,RAPD,技术的优点。,AFLP,的基本原理是基于,PCR,的扩增基因组,DNA,限制性片段多态性。基因组,DNA,先用限制性内切酶切割,然后将双链接头(,adapter,)连接到,DNA,片段的末端,通过选择在,3,端分别添加,1,3,个选择性碱基的不同引物,选择性地识别具有特异配对顺序的酶切片段并与之结合,从而实现特异扩增。,79,EST,EST,(,expressed sequence tags,)是长约,300400bp,的基因表达序列片段。,EST,技术是将,mRNA,反转录成,cDNA,并克隆到质粒或噬菌体载体构建成,cDNA,文库后,大规模随机挑选,cDNA,克隆,对其,5,或,3,端进行一步法测序,将所获序列与基因数据库中已知序列进行比较,从而获得对生物体生长、发育、代谢、繁殖、衰落死亡等一系列生理生化过程认识的技术(,Hatey 1998,)。,SNP,SNP,是基因中的点突变,存在的数量多,其中有些可产生,RFLP,,但多数突变不是发生在酶切位点。,人类基因组的编码基因中有,20,万个,SNPs,在非编码区的数目可能还要多,10,倍以上。这种标记也只有两种等位基因。,80,特性,RFLP,RAPD,SSR,ISSR,AFLP,分布,普遍存在,普遍存在,普遍存在,普遍存在,普遍存在,遗传,共显性,多数显性,共显性,多数显性,多数显性,多态性,中,高,高,高,非常高,等位检测,是,不是,是,不是,不是,检测位点数,13,110,15,050,更多,20100,样品信息量,低,中,高,高,高,非常高,基因组区域,底拷贝编码,整个基因组,整个基因组,整个基因组,整个基因组,技术难度,中等,简单,简单,简单,中等,重复性,高,中等,高,高,高,DNA,样品量,230g,1100ng,50-100ng,250ng,100ng,反射线,一般是,不是,不是,不是,一般是,耗费时间,慢,快,快,快,中等,可靠性,高,中等,高,高,高,81,2.,遗传图谱的构建,1,)人类基因组遗传图谱的构建,人类的遗传图谱是利用,家系分析法,,在对,8,个家系的,134,个成员的分析中,(186,个减数分裂,),,主要根据,5264,个,STR,标记绘制而成的。因为,STR,在每一百万个碱基中总有几个位点,而且每一个,STR,具有多个等位基因位点。利用这些家系的资料绘制第,1,至,22,号染色体图谱。对于,X,染色体图谱,还利用了来自另外,12,个家系,,170,个成员,(105,个减数分裂,),的资料绘制而成。最后,将,5264,个标记定位在,2335,个位点,因为其中有些标记相距很近而作为一个位点,所以位点数小于标记数目。,82,物理图谱的构建,83,物理图谱的构建,84,拟南芥,85,人类部分染色体物理图谱,86,E.coli,物理图谱,87,基因定位,借助基因组图谱,可使基因定位在精度、速度、广度等方面有极大的提高,在复杂的数量性状位点,(quantitative trait loci,,,QTL),定位分析方面,也取得了很大进展。,基因组比较分析,已经在禾本科,茄科,十字花科等做了遗传图谱比较分析,从分子水平了解物种间的同源性,研究基因组的进化和染色体的演变。,标记辅助选择,(marker-assisted selection,,,MAS),根据图谱间接选择目的基因,大大加速目的基因的转移与利用,提高回交育种的效率。此外,标记辅助选择有助于克服轮回选择过程中早期选择的盲目性。,基因的克隆与分离,根据饱和的基因组图谱,可以找到一个与目的基因紧密连锁的分子标记,作为染色体步行,(chromosome walking),的起始点,,进行基因的克隆和分离,。,基因组图谱的应用,88,2,功能基因组学研究,研究内容:,人类基因组多样性的研究、,基因组表达调控的研究、,模式生物体的研究、,生物信息学的研究等。,89,功能基因组学,基因组,DNA,测序:,人类对自身基因组认识的第一步。,功能基因组学:,从基因组信息与外界环境相互作用的高度,阐明基因组的功能。,功能基因组学的研究内容:,人类基因组,DNA,序列变异性研究,基因组表达调控的研究,模式生物体的研究,生物信息学,90,基因组表达及调控的研究,在全细胞的水平,识别所有基因组表达产物:,mRNA,:,c DNA,阵列,蛋白质:二维电泳,质谱,研究生物大分子相互作用:,阐明基因组表达在发育过程中的时、空的整体调控网络。,蛋白质组学:,高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。,91,基因芯片,92,基因芯片示意,93,94,名词解释,基因组,C-,值矛盾 基因家族 基因簇 割裂基因 卫星,DNA,简答题,1.,根据复性动力学曲线判断真核生物各种序列类型,2.,真核、原核生物的结构基因的主要组成特点。,思考题,95,The end,96,97,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服