收藏 分销(赏)

第十三章 基因组学.ppt

上传人:xrp****65 文档编号:14027667 上传时间:2026-06-09 格式:PPT 页数:52 大小:4.54MB 下载积分:10 金币
下载 相关 举报
第十三章 基因组学.ppt_第1页
第1页 / 共52页
第十三章 基因组学.ppt_第2页
第2页 / 共52页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第九章基因工程和基因组学,*,第十三章基因组学,第十三章基因工程和基因组学,第一节 基因组学 概述,基因组学,(genomics),:遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征。*研究对象:以整个基因组为研究单位,而不以单个基因为单位作为研究对象。*研究目标:认识基因组的结构、功能和进化;阐明整个基因组所包含的遗传信息和相互关系;充分利用有效资源,预防和治疗人类疾病。,基因组,(Genome),:,又称染色体组,是指一个物种单倍体的染色体数目,是生物体全部遗传物质的总和。,基因组学,(Genomics),:,对生物体所有基因进行基因组作图,(,包括遗传图谱、物理图谱、转录图谱,),、核苷酸序列分析、基因定位和基因功能分析的一门科学。,最终目标:,获得生物体全部基因组序列,注解基因组所含的全部基因,鉴定所有基因的功能及基因间相互作用关系,并阐明基因组的复制及进化规律。,一、,基因组学的概念,生物,基因组大小(,bp,),T4,噬菌体,T4,phage,2.0,10,5,大肠杆菌,Escherichia coli,4.2,10,6,酵母,Sccharomyces,cereviside,1.5,10,7,拟南芥,Arabidopsis thaliana,1.0,10,8,线虫,Caenorhbditis,elegans,1.0,10,8,果蝇,Drosophila melanogaste,r,1.65,10,8,水稻,Oryza,sativa,4.3,10,8,小鼠,Mus,musculus,3.0,10,9,人类,Homo sapiens,3.3,10,9,玉米,Zea,mays,5.4,10,9,小麦,Triticum,aestivum,1.6,10,10,不同生物基因组大小,1.,人类基因组计划,与曼哈顿原子 计划、阿波罗登月计划并称的人类科学史上的重大工程。于,1990,年首先在美国启 动,后有德、日、英、法、中等国的科学家先后正式加入。,(一)人类基因组,1990,年,美国国会批准美国的,“,人类基因组计划,”,在,10,月,1,日正式启动。其总体规 划是准备在,15,年内(,1990,2005,)至少投入,30,亿美元,分析人类的基因组,30,亿个碱基对,。,2003,年,,6,国科学家宣布人类基因组序列图绘制成功,,HGP,的所有目标全部实现。覆盖人类基因组所含基因区域的,99%,,精确率达到,99.99%,,比原计划提前两年多,耗资,27,亿美元。,人类基因组计划,人类基因组,核基因组,DNA,的总长约,3109bp,,含有,24,条线性,DNA,分子,最长的有,250 Mb,,最短的,55 Mb,。,30,亿个碱基对。,线粒体基因组是长度为,16569 bp,的环状,DNA,分子,每个细胞平均含有,800,个线粒体,每个线粒体含,10,个基因组拷贝。,以每,10cm,书写,60,个字母计算,,30,亿个碱基对连接的长度可达,5 000 km,,相当于北京到香港来回的距离。,为人类的基因组研究提供重要的依据。,1996,年,酵母菌基因组测序。,1998,年,12,月,线虫完整基因组序列的,2000,年,3,月,果蝇的基因组测序,2001,年,12,月,14,日,拟南芥基因组的完整图谱。,(二)其他生物基因组,我国超级杂交稻(籼稻)基因组计划,2001,年,7,月启动,2002,年,4,月,5,日,Science,。,材料:籼稻,“,9311,”,。,完成单位:华大基因研究中心、中科院遗传与发育生物学研究所等,12,个单位。,水平:水稻基因组的总基因数约为,46022,55615,个,工作框架图序列已覆盖水稻整个基因组,92,以上的基因。,方法:,“,鸟枪射击法,”,,利用国产曙光,2000,、曙光,3000,超级计算机,(1000,亿次,/,秒,),对随机,DNA,碎片进行排序和组装。,水稻基因组计划,国际水稻(粳稻)基因组计划始于,1998,年,日本、美国、中国、法国等国家和地区参加。中国负责第,4,号染色体:,36 Mb(,占,910%),。,国际水稻基因组测序计划,2002,年,12,月,21,日,Nature,,中国第四号染色体。,材料:粳稻,“,日本晴,”,。,完成单位:中科院国家基因研究中心等,4,家单位。,水平:第四号染色体中的总碱基数目为,0.35,亿碱基对,覆盖全长序列,98,的区域,只剩下,7,个小空洞,碱基序列的精确度达到,99.99%,。完整测定的着丝粒序列在高等生物中属于首次。,国际水稻基因组测序计划,水稻是第一个完成基因组全序列测定的农作物,核基因组含有,12,条染色体,总长约,389Mb,,,1,号染色体最大为,43.2Mb,,,10,号染色体最小,22.6Mb,。全基因组预测约含有,4,万个基因。,水稻双链闭环线粒体基因组大小为,491kb,,叶绿体基因组,134.5kb,C,值:,是指一个单倍体基因组中,DNA,的总量。,值悖理(,C value paradox,):,物种的,C,值和它的进化复杂性之间无严格对应关系的现象称为,C,值悖理,是复杂生物基因组的一个普遍特征,(三),C,值悖理和,N,值悖理,(三),C,值悖理和,N,值悖理,N,值:,是指生物体所含有的基因数目。,N,值悖理(,N value paradox,),:复杂性不同的生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象。,如结构比较简单的线虫含有的基因数为,1.9,万个,比线虫更复杂的果蝇基因数为,1.8,万个,水稻的基因数约,4,万个,最复杂的人类其基因总数约,3,万个。,四、基因组学研究内容,(一)结构基因组学,(structural genomics),通过基因作图、核苷酸序列分析确定基因组成、进行基因定位的科学。,遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。完成基因组图谱构建之后,就可以利用图谱进行基因组序列测定和组装。,四、基因组学研究内容,(二)功能基因组学,(functional genomics),利用结构基因组所提供的信息和产物,研究基因组功能表达的一门分支学科。,主要研究内容,:,基因的识别、鉴定和克隆。包括新策略、新技术、新方法的创立和各种基因组数据的建立;,基因结构与功能及其相互关系的研究。包括基因变异体的系统鉴定和目录的绘制;基因表达谱的编制、基因结构与功能关系的鉴定、基因相互作用网络图的编制;,基因表达调控的研究,四、基因组学研究内容,(三)蛋白质组学,(proteomics),研究细胞内蛋白质组成及其活动规律。旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式、结构、功能和相互作用方式等。,基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,仅仅从基因的角度来研究是远远不够的。,第,2,节 基因组图谱构建,基因组计划的目的是获得全基因组序列,并对其进行解读。,DNA,测序每次反应仅能读取,1000bp,的长度,因此,基因组测序的基础是基因组图谱的构建。,鸟枪射击法,(shotgun),基因组序列测定,第,2,节 基因组图谱构建,基因组测序策略,重叠群法,相互存在重叠序列的一组克隆。根据重叠群的相对位置讲各个克隆首尾相连,长度可达百万级,bp,。对单个重叠群,采用鸟枪法测序,然后进行组装。这是由上而下(,up to down,)的测序策略。,直接鸟枪法,首先进行全基因组鸟枪法测序,再用分子标记为起点强鸟枪,DNA,片段组装。这是由下而上(,bottom to up,)的测序策略。这种方法依赖于高密度分子标记基因组图谱。,基因组图谱分为遗传图谱和物理图谱。,(一)遗传标记,遗传标记就是遗传物质的特殊的易于识别的多态性表现形式,它包括形态标记、细胞学标记、生化标记和分子标记。,形态标记:主要指可以观察到的一些性状,如种皮颜色、眼色、株高等。,细胞学标记:细胞学标记是指能明确显示遗传多态性的细胞学特征。,生化标记:主要是同工酶及种子贮藏蛋白,有时又称蛋白质标记。,分子标记:主要指,DNA,水平上的标记。,DNA,标记,以,DNA,为基础的分子标记主要包括,基于杂交的分子标记,如,RFLP,。,基于,PCR,的分子标记,如,RAPD,、,AFLP,、,SSR(,又称,microsatellite),、,AFLP,等。,基于,DNA,序列和芯片的分子标记,如,SNP,(,single nucleotide polymorphism,)。,RAPD,由,Williams,等(,1990,)和,Welsh,等(,1990,)分别发展起来的分子标记技术。这一技术是以基因组,DNA,为模板,采用随机设计的单个寡核甘酸序列(一般为,10bp,)为引物,通过,PCR,扩增,产生不连续的,DNA,产物,用于检测,DNA,序列的多态性,。,RAPD,(,Random amplified polymorphic DNA,),重复序列,串联重复序列(,tandem repeated sequence,),其重复单位首尾相连,成串排列(,Flavell 1986,)。,散布重复序列(,interspersed repeated sequence,),其重复单位与其它无关序列或单拷贝序列相间排列。,SSR,(,simple sequence repeats,),或微卫星,(,microsatellite),微卫星,DNA,序列或,SSR,又称短串联重复序列(,short sequence repeat,,,STR,),它是由几个核甘酸(一般,16,个)为重复单位簇集而成的串联重复序列,可随机的分布在整个基因组的不同位置上。微卫星长度具有高度变异性,并且这种多态性常常表现复等位性,两端的序列多是相对保守的单拷贝序列,因而可以根据两端的序列设计一对特异引物,扩增每个位点的微卫星序列,从而揭示其,长度的多态性(,simple sequence length polymorphism,,,SSLP,)。,SSR,ISSR,是一种新型的分子标记。与,SSR,相反,直接用同位素标记,SSR,序列,扩增,2,个,SSR,间的单拷贝序列。为了增加扩增的特异性,在引物的,5,和,3,端分别加入,1,2,个选择性碱基,引物长度,16,18bp,。,ISSR,(,inter-ssr,),AFLP,结合了,RFLP,和,RAPD,技术的优点。,AFLP,的基本原理是基于,PCR,的扩增基因组,DNA,限制性片段多态性。基因组,DNA,先用限制性内切酶切割,然后将双链接头(,adapter,)连接到,DNA,片段的末端,通过选择在,3,端分别添加,1,3,个选择性碱基的不同引物,选择性地识别具有特异配对顺序的酶切片段并与之结合,从而实现特异扩增。,AFLP,(Amplicon fragment length polymorphism),AFLP,反应过程示意图,遗传信息由,DNA,mRNA,蛋白质。,一个典型的真核生物,mRNA,分子:,5,-U TR(5,端转录非翻译区,),ORF(,开放阅读框架,),3-U TR(3,端转录非翻译区,),,,polyA,任何一个基因,,cDNA,的,5,端或,3,端的有限序列即可特异性地代表生物体某种组织某个时期的一个表达基因。,EST,的数目可以显示所代表的基因的拷贝数,EST,(,expressed sequence tags,),从组织细胞中提取总,mRNA,,构建成标准,cDNA,文库,然后从中挑取大量克隆,利用载体通用引物测出插入载体的,cDNA,片段,5,端或,3,端,300-500,碱基的序列。,将测序所得的,EST,与,dbEST,等数据库中的数据进行比较分析,根据核酸或蛋白质序列的同源性比较,可以鉴定出哪些,EST,代表已知基因,哪些,EST,代表未知基因。,EST,序列标签位点(,sequence tagged site,)是一小段,DNA,序列。每个基因组仅,1,个拷贝,很容易分辨。,STS,要满足,2,个条件:,是一段已知的序列,可据此涉及,PCR,引物来检测不同,DNA,片断中是否存在 这一序列。,STS,在染色体上必须是独一无二的。如果在基因组中有多个位点出现,作图数据将含混不清。,常见的寻找,STS,的方法:,EST,、,SSLP,、随机基因组序列,STS,单核苷酸多态性是指基因组序列中由于单个核苷酸,(,),的替换而引起的多态性。通常,SNPs,不包括碱基的插入、缺失以及重复序列拷贝数的变化。这种标记只有两种等位基因。,人类基因组的编码基因中有,20,万个,SNPs,在非编码区的数目可能还要多,10,倍以上。,单倍型:当前常用术语“,happlotype”(,单倍型,),代替术语“,allele”(,等位基因,),。在给定的一条染色体的紧密连锁的位点上多个等位基因的集合,通常,3,4,个相邻等位基因彼此靠近而构成的单倍型可作为一个整体而遗传,(,称为单倍型块,(haploblock),SNP,(single nucleotide polymorphism),特性,RFLP,RAPD,SSR,ISSR,AFLP,分布,普遍存在,普遍存在,普遍存在,普遍存在,普遍存在,遗传,共显性,多数显性,共显性,多数显性,多数显性,多态性,中,高,高,高,非常高,等位检测,是,不是,是,不是,不是,检测位点数,13,110,15,050,更多,20100,样品信息量,低,中,高,高,高,非常高,基因组区域,底拷贝编码,整个基因组,整个基因组,整个基因组,整个基因组,技术难度,中等,简单,简单,简单,中等,重复性,高,中等,高,高,高,DNA,样品量,230g,1100ng,50-100ng,250ng,100ng,反射线,一般是,不是,不是,不是,一般是,耗费时间,慢,快,快,快,中等,可靠性,高,中等,高,高,高,(二)遗传图谱的构建,1,人类基因组遗传图谱的构建,人类的遗传图谱是利用,家系分析法,,在对,8,个家系的,134,个成员的分析中,(186,个减数分裂,),,主要根据,5264,个,STR,标记绘制而成的。,利用这些家系的资料绘制第,1,至,22,号染色体图谱。对于,X,染色体图谱,还利用了来自另外,12,个家系,,170,个成员,(105,个减数分裂,),的资料绘制而成。,最后,将,5264,个标记定位在,2335,个位点(其中有些标记相距很近而作为一个位点)。,2,植物基因组遗传图谱的构建,作图群体,常用的遗传作图群体有,F,2,群体、回交群体、加倍单倍体(,double haploid,,,DH,)群体、重组近交系(,recombinant inbred lines,,,RIL,)群体、近等基因系(,nearisogenic lines,,,NIL,)群体等(徐云碧,,1994,)。,遗传标记的染色体定位,标记间的连锁分析,LINKAGE,、,Mapmaker,、,JoinMap,二、物理图谱绘制,(一)限制性作图,(二)基于克隆的基因组作图,(三)原位杂交,(四)序列标签位点(,STS,)作图,(五)人类基因组图谱,重叠群(,contigous DNA clones,contigs,),从,1,个感兴趣的位置开始,利用第,1,个元件的末端部分来辩别第,2,个元件,沿染色体“行走”(,walk,)。通过鉴别目标位点两测的,2,个,DNA,标记,从,1,个标记向另,1,个标记的行走。,沿染色体鉴别一系列重叠群是大规模研究的基础。在特定区域的染色体行走可以提供分离通过遗传图谱定位在该区域基因的方法。集中全部染色体的重叠群,可以为以后研究提供有效克隆来源。,染色体行走考虑的根本是每“步”的大小,较大的步加快积聚相邻克隆的进程。,(二)基于克隆的基因组作图,区域作图,Regional mapping,区域作图,Regional mapping,Minimal tiling path selected for sequencing.,区域作图,Regional mapping,(三)原位杂交,荧光原位杂交(,fluorescent in situ hybridization,FISH,),基因组原位杂交(,genome in situ hybridization,GISH,),(四)序列标签位点(,STS,)作图,辐射杂交系,是含有另一种生物染色体片断的啮齿类细胞。带有人类染色体片段的辐射杂交系,DNA,库,YAC/BAC,克隆作图,获得大分子,DNA,克隆文库以后,用,PCR,的方法检测,STS,,根据重叠的,STS,标记绘制克隆连锁图。,(四)序列标签位点(,STS,)作图,当两个片段含有同一,STS,顺序时,则这两个片段彼此重叠。如果它们彼此邻接,这两个,STS,总会同时出现在相同片段上。如果它们相距甚远,有时会在同一片段,有时则在不同片段。,要将一组,STS,作图定位,必需收集来自同一染色体或整个基因组随机断裂的,DNA,片段。不同,DNA,片段之间有各种可能的重叠,可以覆盖整个作图区段。依次采用单个,STS,挑出它们所在的,DNA,片段,根据它们彼此的重叠关系可以逐段绘,DNA,物理图。,生物信息学是现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息的学科。,应用生物信息学可以将来自不同的基因组理论和应用综合并标准化,利用大量的生物信息资料了解遗传网络系统、信号传递及相互关系,计算机还可进行一些生物模拟研究。,利用生物信息学能够分析从微生物、动物、植物以及人类基因组序列测定产生的大量资料,阐明遗传信息。,研究内容两大类:,DNA,数据分析;,蛋白质数据分析。,第三节生物信息学,(bioinformatics),基因芯片,基因芯片,(gene chip),又称,DNA,微阵列,(microarray),是由大量,DNA,或寡核苷酸探针密集排列所形成的探针阵列,其基本原理是通过杂交检测信息。利用基因芯片,可以实现基因信息的大规模检测。,生物信息学的应用,(一)发现新基因和新的单核苷酸多态性,在研究生物的基因时,不断的发现新的基因。一般说来,从基因组,DNA,预测新基因,是发现新基因的另一个重要途径。,SNP,出现在蛋白质的编码基因上,它可改变蛋白质的结构和功能,也可出现在非编码区,操控基因的表达水平。,(二)分析基因组中非编码蛋白质区域功能,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分,这表明这些非编码序列必定具有重要的生物功能。,(三)在基因组水平上研究生物进化,分子进化是对不同生物的同源分子,即结构和功能相似的蛋白质或编码该蛋白质的基因,进行比较。,(四)完整基因组比较研究,在后基因组时代,完整基因组数据越来越多,有了这些资料人们就能对若干重大生物学问题进行分析研究,如,:,生命的起源,?,生命是如何进化的,?,估计最小独立生活的生物体至少需要多少基因,?,这些基因是如何使生物体具有生命,?,等等。,在蛋白质水平研究基因组的基因表达。分析基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。,蛋白质组学比基因组学更为复杂:,DNA,线状结构与二级结构的功能差异不大,但多肽链需折叠成一定的三维空间结构才形成有功能的蛋白质;同一种蛋白质经不同的加工修饰可形成不同的功能,因此蛋白质的多样性远复杂于基因本身。,第四节 蛋白质组学(,Proteomics,),蛋白质,2D,电泳分析,A,对照;,B,为人的垂体瘤蛋白质,2D,电泳箭头示有明显差异的蛋白质。,蛋白质组学(,Proteomics,),人角化细胞的,2D,电泳蛋白质图谱,经,S35,放射自显影显示,可以分辨出,100,种以上的蛋白质。,蛋白质组学,酵母双杂交系统原理示意图,如左图所示,将蛋白质,X,与转录因子结合域构建融合蛋白;,Y,、,Z,分别与激活域融合,通过检测报告基因(,lac,Z,)的转录与否确定,X,蛋白的互作蛋白是,Y,,而不是,Z,。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服