1、单击此处编辑母版标题样式,单击此处编辑母版文本版式,第二层,第三层,第四层,第五层,.,*,胡正茂,huzhengmao,基因定位与克隆,基因定位或基因制图,(gene mapping),:,人类的基因定位或基因制图,(gene mapping),是近年来发展最快的领域之一。它的目的在于决定不同的基因在染色体上的位置。一条染色体是一条独立的,DNA,链,同一条染色体上的基因在该染色体上呈线性排列。人类的,20000-25000,个基因分布在,24,种染色体上,它们在染色体上的位置可通过两种制图方法来表示:,1,、物理图谱,(physical map),,即确定基因之间的绝对物理学距离,通常用
2、Mb(,百万碱基对,),或,Kb(,千碱基对,),来表示,2,、遗传图谱,(genetic map),,即确定基因之间的遗传学距离,用,cM(centimorgen,分摩,),表示。,广泛定义,基因克隆:,基因克隆通常涉及到将构成某一基因的基因组,DNA(genomic DNA,,,gDNA),或互补,DNA(complemantary DNA,cDNA),插入某一载体内,利用载体在宿主细胞,(,通常用大肠杆菌,),中大量繁殖而获得该基因的足够量的拷贝,以便于进行基因的结构和功能的分析,广义的基因克隆也包括任何使基因或,DNA,片段扩增的操作,。,医学遗传学,讨论的基因定位与克隆实质上不是广
3、泛意义上的基因定位与克隆,主要针对致病基因的鉴定,即将某一特定基因的突变与某一特定的疾病联系起来,,确定基因突变与某一疾病之间的因果关系,了解其致病机理,为疾病的诊断、预防和治疗提供理论依据。,基因定位方法,strategy for gene mapping,染色体多态法(,chromosome heteromorphism,),染色体畸变法,(chromosome abnormality),体细胞杂种法,(somatic cell hybrids),染色体分类法,(chromosome sorting),原位杂交法(,FISH,),剂量分析法,(dosage ananlysis),测序法(,
4、sequencing,),家系分析法(,pedigree ananlysis,),染色体多态法,.,主要限于性染色体上的定位,根据某些性状或疾病在男女性别间的差异,结合系谱分析,将这些基因定位在,X,染色体上。,Duffy,血型基因定位于,1,号染色体上,(Donahue,在做染色体实验时发现自己的,1,号染色体长臂在靠近着丝粒区的地方变长了,通过对他自己家族成员染色体的观察发现,这一异常是遗传的,将其作为,1,号染色体上的一个特定的标记,随后发现这一标记与,Duffy,血型具有平行性,表明这种染色体的异常结构同这一基因相连锁,因此将此血型基因定位于,1,号染色体上。,),染色体畸变法,畸变常
5、涉及两个位点,如果这两个位点之一正好是某一功能基因所在的位置,染色体的畸变则肯破坏该基因的正常功能而引起疾病,根据染色体畸变的位置和疾病发生的关系,则可将致病基因定位于染色体的某一特定位置上。,NLMG,染色体异常进行基因定位,-,睾丸决定因子,Testis determining factor,体细胞杂种法,体细胞杂种通常由人和鼠的体细胞融合而成。这些融合细胞在最初几代培养过程中具有选择性丢失人类染色体趋势,而保留所有的鼠染色体。,保留在融合细胞中的染色体可以是多条,也可能只有一条甚至某条染色体的一部分。,根据研究的需要可将含有不同人类染色体的人鼠杂种细胞组合成人鼠杂种细胞板,(hybrid
6、 panel),,结合杂种细胞板和,PCR,的方法或基因剂量分析,或蛋白质表达分析,可将相应的基因定位到特定的染色体或染色体片段上,该杂种细胞板在人类基因定位以及人类基因组计划中发挥过重要的作用。,体细胞杂交基因定位示意图,Miller,等运用体细胞杂交证明胸苷激酶(,TK,)位于人的,17,号染色体,这是首例应用体细胞杂交法进行的基因定位。,原位杂交法(,FISH,),如果一个基因或基因的某一部分已经被克隆,则可将该基因用同位素或荧光标记和染色体原位的分子杂交,在染色体上恒定出现信号的区域即该基因在染色体上的位置。同一染色体上的多个不同的基因可用不同的荧光标记来鉴别他们在染色体上的相对位置,
7、运用这一方法在中期染色体上,可区分两个相隔约,2Mb,的基因;在间期染色体上,据称可鉴别仅相隔,50kb,的两个基因。,CONNEXIN31.1,候选克隆:,根据基因的功能、结构及已有的研究发现,预测可能与目的新基因有关的疾病,然后在相应患者中检测该基因的突变情况。,位置克隆:,目前最常用的方法,将某一疾病的致病基因用连锁分析的方法定位在某一染色体的特定位置上或区域内,然后在该位置上或区域内鉴定其致病基因。,连锁分析原理,生殖细胞在减数分裂时发生交换,一对同源染色体上存在着两两相邻的基因座位,若两者之间距离较远,发生交换的机会较多,则出现重组次数就多;若两者之间距离较近,则重组机会较少。,连锁
8、分析就是根据基因在染色体上呈线性排列,不同基因相互连锁成连锁群的原理,即应用被定位的基因与同一染色体上另一基因或遗传标记相连锁的特点进行定位。,1,2,3,基因分型,Genotyping,除性染色体外,每个人体内的染色体都有两份。一个人所拥有的一对等位位点的类型被称作基因型,genotype,。,对,SNP,位点而言,一个人有三种可能性,分别是,AA,,,AG,或,GG,。这种基因型的差异叫做单核苷酸多态性,(SNP),。,通过实验确定某个个体在某个多态性位点的基因型,被称作基因分型。,几种多态标记,:,(,1,),RFLPs,(,2,),STRPs,(,3,),SNPs,第一代标记:,RFL
9、P,(,restriction fragment length polymorphism,)。,限制性内切酶可在特定的核苷酸位置切割,DNA,。,DNA,序列的改变甚至是一个碱基的改变,都可能改变限制性内切酶酶切片段的长度,通过凝胶电泳可以方便地检测这种长度的,“,多态性,”,。,RFLP,在整个基因组中都存在,根据对,RFLP,片段的多态性分析,可对某些疾病进行诊断并将与疾病有关的基因进行定位。,www.ncbi.nlm.nih.gov/projects/genome/probe/doc/TechRFLP.shtml,1980,年,,Botstein,首次提出。,使用特殊的外切酶切断,DNA
10、中特殊位点,1987,年,,第一张较完整的人基因连锁图,包含,393,个,RFLP,位点。,缺点:数目少,信息量小;成本昂贵,操作繁琐,不易发展到自动化水平。,第二代标记,:,STR,(short tandem repeat polymorphism),。例如,基因组中两个或两个以上的核苷酸短串联重复,序列,(CA)n,,,微卫星标记等,,在不同个体中重复单位的数目变异非常大。,微卫星标记荧光电泳图,STR,广泛存在于人基因组,占约,5%,,基本单位是,2bp-6bp,的,串联重复,其中以,(CA),n,,,(GT),n,常见。,1996,年建立了以,6000,多个,STR,为主体的遗传图谱
11、目前有,10000,个左右的位点。,主要用于个体识别,优点:信息量大;易实现自动化。,缺点:标记数量不够多,随着人类基因组计划、国际人类基因组单体型计划(,Hapmap,计划)的完成,大量的,SNP,被发现。利用先进的高通量基因芯片技术,精确揭示重大疾病的基因变异,从而阐明疾病的遗传学发病机制,是目前科学界公认的最为有效的搜寻重大疾病易感基因的研究方法,被,Science,杂志评为,2007,年十大科学进展之首。,迄今已发现的,SNP,约,900,1,000,万个,相关的文章约,4000,余篇。,特点:,数量丰富,双等位标记,简单的,+/-,分析,根据结果可以估算出某个等位基因在一个群体中的
12、频率,易于实现自动化,快速筛查,SNP,作为遗传标记的优势,家系分析法(,Lods,),在家系中,重组率是进行连锁分析的基础,L(,)=,r,(1-),n-r,=,1,(1-),4,Lods=lg【(0.2*0.8,4,)/0.5,5,】=0.4185,Lods=0.1249,L(,)=,r,(1-),n-r,=,1,(1-),4,/2+,4,(1-)/2,Lod score,结果判定:,Lod3,肯定连锁,,Lod-2,否定连锁,,-2Lod1,则还需增加样本资料。,2010,年在国内最早应用外显子组测序技术克隆了一个新的共济失调致病基因,TGM6,2004,年定位与克隆角膜,环状皮,样瘤基
13、因,角膜环状皮样瘤,是一种先天性角膜良性肿瘤,呈常染色体显性遗传,以双侧眼球角膜缘处环形淡黄色肿块为特征,可延伸到结膜,患者可出现视力的改变如弱视、斜视和散光。,皮样瘤由外胚层包括角化的上皮、毛发、皮脂腺和中胚层包括纤维组织、脂肪组织、血管组成,角膜环状皮样瘤家系图,基因组扫描的流程,DNA,抽提,利用,STR,引物多重,PCR,Genotype,基因分型,Linkage,连锁分析,侯选基因,突变检测,定位基因,多重,PCR,使用,PE,公司一套覆盖基因组,22,条常染色体、高杂合度的微卫星位点引物,一共,382,对。,采用,Touchdown,程序结合多重,PCR,反应方法,将,5,12,种
14、不同引物混合,放入同一管中进行扩增,总反应体积,5l,以上结果说明这个单体型在该家系中与疾病共分离,而这些重组事件的发生则将角膜环状皮样瘤疾病基因定位于,4q24-26,的,D4S1572,和,D4S1522,之间,15.2 cM,范围内,侯选基因的筛选,首先进行,UCSC,数据库(,April,2003,)查询,D4S1572-D4S1522,之间,15.2cM,的基因资料,结果显示在这个区间总计有,65,个,known genes,52,个,Reference genes,进行候选基因筛选时,考虑到组织发生中皮样瘤为异位到角膜的正常组织,推测角膜环状皮样瘤致病基因可能与胚层的移行、细胞的发
15、育和分化密切相关,侯选基因的筛选,通过筛选,选取其中,3,个能与组织细胞的发育分化和移行有关并在眼睛表达的基因:,CXXC4,PITX2,TM4SF9,PITX2,是一个转录调控因子,与发育相关,,有重要的功能,神经性耳聋疾病基因,GJB3,的克隆,GJB3,基因的计算机克隆,3RACE,或者,nested-PCR,共获得,cDNA,片段,1059bp,,,其中,ORF 813bp,,编码的氨基酸,270aa,个。,该,ORF,与小,鼠,Gjb3,在,813bp,的一致性为,83.4%,,与大鼠,Gjb3,在,813bp,的,一致性为,84.6%,。推测的氨基酸与小鼠,Gjb3,在,270aa
16、的一,致性为,82.6%,,与大鼠,Gjb3,在,270aa,的一致性为,83%,。,蛋白质的结构,:4,个跨膜区,2,个胞外区,3,个胞内区,1of 5,Human cx31 compare to other GJB protein,GJB3(connexin 31)was mapped to 1p33-35 by FISH,定位在,1p33-p35,的疾病有常染色体显性遗传的感觉神经性耳聋(,DFNA2,)、,CMT2A,型的腓骨肌萎缩症、变异性红皮病和眼睑下垂。我们在中国遗传病家系收集数据库收集的神经性耳聋和腓骨肌萎缩症的病人中检测突变,在两个高频听力减退的浙江家系和湖南家系中分别发现
17、错义和无义突 变的杂合子,并选择了非相关的,150,名个体进行检测,未检测到错义和无义突变。,同胞对连锁分析,2.,血缘一致性(,IBD,)等位基因共享:,两个个体在一个,STR,标记位点显示出相同数目的重复次数,而且遗传自同一祖先,1.,状态一致性(,IBS,)等位基因共享:,两个个体在一个,STR,标记位点显示出相同数目的重复次数,a b,a c,a c,a c,a c,b c,a c,a a,a b,a a,IBD IBS,2,1,0 1,0 0,如果两个血缘相关个体表型类似,那么与此性状相关的基因附近的遗传标记也应当类似,类似程度受多个因素的影响,:,1.,该位点对研究性状总的贡献多大
18、2.,影响到该性状的未知基因与待检测遗传标记的遗传距离,关联研究,关联指两个或多个事件之间具有统计学依赖性,等位基因关联:,等位基因频率随疾病性状显著增高或降低,连锁不平衡:,紧密连锁而产生的等位基因关联,当特定标记等位基因与疾病易感基因距离很近,经过多代仍然共同传递,则人群中受累的无血缘关系的个体可能享有共同的等位基因。,关联研究常见类型,1.,病例,对照研究:,收集一组患者以及一组匹配的对照,比较侯选位点等位基因频率是否存在显著性差异,病例对照研究不需要确认家庭单位,容易收集研究对象,但是其缺点是疾病和位点间的等位基因关联可能因为人群混合产生,而不是由于遗传标记和染色体上导致性状的突变位
19、点接近,因此选择对照就很必要,APOE-4,病例,A(T),对照,A(T),合计,APOE-4,240(180),60(120),300,非,APOE-4,360(420),340(280),700,合计,600,400,1000,APOE-4,A,为实际观察值,T,为理论期望值,2.,传递不平衡检测(,TDT,):,应用家系内对照比较传递与未传递给受累子代的等位基因频率有无差异,TDT,有效利用未传递的等位基因作为对照,对照和疾病基因由同一个体提供,分层就被降低或者消除了,TDT,应用前提及特点,前提:杂合子父母在研究位点有一个关联的等位基因和非关联的等位基因,关联的等位基因以非随机的高概率
20、传递给受累的子代,特点:,1.,仅仅需要,“,父母,子,”,三联体,家系 容易收集,2.,比受累同胞对检验连锁的效能要强,3.,对人群分层不敏感,4.,不存在关联的前提下,无法检测连锁,子女,父母,CC,CT,TT,CC,CT,1,7,CT,CT,1,3,2,CT,TT,6,1,常用计算机分析软件,LINKAGE,MERLIN,GENEHUNTER,HAPLOVIEW,SIMWALK2,我们的研究思路,孤独症样本,染色体研究,CNV,分析,大规模,GWAS,Candidate Genes,患者,M8560,染色体,3,的,CNV,影响,CNTN4,基因,Please visit our website for more information.,






