资源描述
SNPs功能学研究功能学研究-理论、策略和实践理论、策略和实践 张正东Functional Study on SNPs-Theory,Strategy,and P4/15/20241提提 纲纲1.单核苷酸多态性单核苷酸多态性Single Nucleotide Polymorphism2.基因多态性与疾病发生遗传易感性基因多态性与疾病发生遗传易感性Gene Polymorphism and Genetic Susceptibility to Disease3.启动子区单核苷酸多态性的功能学研究启动子区单核苷酸多态性的功能学研究Functional Study on SNPs within Promoter Region4.展望展望Future Prospects4/15/20242DNA Structure4/15/20243Human Genome Project 0.1%,10 million SNPs4/15/20244基因突变基因突变o基因突变基因突变(Gene Mutation):一个基因内部一个基因内部由由于于DNA碱基对的置换、插入或缺失而引起的碱基对的置换、插入或缺失而引起的可以可以遗传的遗传的基因结构的变化基因结构的变化。o广义的突变还包括染色体畸变,广义的突变还包括染色体畸变,狭义的突变狭义的突变专指点突变专指点突变。o基因突变通常可引起一定基因突变通常可引起一定表型表型(Phenotype)的变化。)的变化。4/15/20245基因突变基因突变o根据根据基因结构基因结构的改变方式,基因突变可分为的改变方式,基因突变可分为碱基置换突变碱基置换突变和和移码突移码突变变两种类型:两种类型:n碱基置换突变碱基置换突变:由一个错误的碱基对替代一个正确的碱基对的突变叫碱:由一个错误的碱基对替代一个正确的碱基对的突变叫碱基置换突变。碱基替换过程只改变被替换碱基的那个密码子,不会涉及基置换突变。碱基替换过程只改变被替换碱基的那个密码子,不会涉及到其他的密码子。到其他的密码子。n移码突变移码突变:基因中插入或者缺失一个或几个碱基对,使:基因中插入或者缺失一个或几个碱基对,使DNA的阅读框架的阅读框架(读码框)发生改变,导致插入或缺失部位之后的所有密码子都随着发(读码框)发生改变,导致插入或缺失部位之后的所有密码子都随着发生变化,结果产生一种异常的多肽链。生变化,结果产生一种异常的多肽链。碱基对碱基对:形成:形成DNA、RNA单体以及编码遗传信息的化学结构。组成碱基对单体以及编码遗传信息的化学结构。组成碱基对的碱基包括的碱基包括A、G、T、C、U。严格地说,碱基对是一对相互匹配的碱基。严格地说,碱基对是一对相互匹配的碱基(即(即A:T,G:C,A:U相互作用)被氢键连接起来。相互作用)被氢键连接起来。密码子密码子:mRNA链上决定一个氨基酸的相邻的三个碱基叫做一个链上决定一个氨基酸的相邻的三个碱基叫做一个“密码子密码子”,亦称三联体密码。,亦称三联体密码。4/15/20246基因突变基因突变o根据根据遗传信息遗传信息的改变方式,基因突变又可以分为的改变方式,基因突变又可以分为同义突同义突变、错义突变变、错义突变和和无义突变无义突变三种类型:三种类型:n同义突变同义突变:DNA的一个碱基对改变并不影响其所编码蛋白的一个碱基对改变并不影响其所编码蛋白质氨基酸序列,这是因为改变前后的密码子为质氨基酸序列,这是因为改变前后的密码子为简并密码子简并密码子,编码同一种氨基酸。编码同一种氨基酸。n错义突变错义突变:一对或几对碱基对的改变使决定某一氨基酸的:一对或几对碱基对的改变使决定某一氨基酸的密码子变为决定另一种氨基酸的密码子。密码子变为决定另一种氨基酸的密码子。该突变有可能使该突变有可能使其所编码蛋白质部分或完全失活其所编码蛋白质部分或完全失活。n无义突变无义突变:一对或几对碱基对的改变使决定某一氨基酸的:一对或几对碱基对的改变使决定某一氨基酸的密码子变成一个密码子变成一个终止密码子终止密码子。4/15/20247单核苷酸多态性单核苷酸多态性o单单核核苷苷酸酸多多态态性性(Single Nucleotide Polymorphism,SNPs):指指在在基基因因组组水水平平由由单单个个核核苷苷酸酸的的变变异异所所引引起起的的DNA序序列列多多态态性性。它它是是人人类类可可遗遗传传的的变变异异中中最最常常见见的的一一种种,占所有已知多态性的占所有已知多态性的90%以上。以上。oSNP在在人人类类基基因因组组中中广广泛泛存存在在,平平均均每每500-1000个个碱碱基基对对中即有中即有1个,人类个,人类30亿碱基中大约有亿碱基中大约有1000万个万个SNPs。oSNPs如如只只涉涉及及单单个个碱碱基基的的变变异异,可可由由单单个个碱碱基基的的转转换换(Transition,嘌嘌 呤呤 嘌嘌 呤呤 或或 嘧嘧 啶啶 嘧嘧 啶啶)或或 颠颠 换换(Transversion,嘌嘌呤呤嘧嘧啶啶)所所引引起起,也也可可由由碱碱基基的的插插入入或或缺失缺失所致。但通常所说的所致。但通常所说的SNPs是指转换和颠换。是指转换和颠换。4/15/20248单核苷酸多态性单核苷酸多态性o人类中人类中最常见的为最常见的为CT(GA)转换)转换,约占,约占2/3。o转换频率发生较高的原因是因为转换频率发生较高的原因是因为CpG二核苷酸二核苷酸上的胞嘧啶(上的胞嘧啶(C)残基是人类基因组中最易发生)残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发突变的位点,其中大多数是甲基化的,可自发脱去氨基形成胸腺嘧啶(脱去氨基形成胸腺嘧啶(T)。)。4/15/20249单核苷酸多态性单核苷酸多态性Example of an SNP comprising a GA substitutionElectropherograms produced by fluorescence-based sequencing using an ABI 3700 showing the genomic DNA from an individual homozygous for G at the site of the SNP(a)and an individual homozygous for A(b).The base substitution is denoted by an arrow.4/15/202410单核苷酸多态性单核苷酸多态性o人类基因组中大约每个基因有两个常见的错义突变。人类基因组中大约每个基因有两个常见的错义突变。o在公共数据库中至少有在公共数据库中至少有500万个万个SNPs。o仅仅有有少少量量(可可能能为为50,000250,000)SNPs在在一一定定程程度度上上(小到中等度)能反映与疾病发生危险相关的表型。(小到中等度)能反映与疾病发生危险相关的表型。o根根 据据 SNPs在在 基基 因因 中中 的的 位位 置置,可可 分分 为为 基基 因因 编编 码码 区区SNPs(Coding-region SNPs,cSNPs)、基基 因因 周周 边边SNPs(Perigenic SNPs,pSNPs)以以 及及 基基 因因 间间SNPs(Intergenic SNPs,iSNPs)等三类。)等三类。4/15/202411单核苷酸多态性单核苷酸多态性63%Intronic(内含子)(内含子)24%Locus region(基因座区)(基因座区)11%Untranslated region(非翻译区)(非翻译区)1%Nonsynonymous(nsSNPs,错义,错义SNPs,改变氨基酸)改变氨基酸)1%Synonymous(同义(同义SNPs,不改变氨基酸)不改变氨基酸)1%Splice site(剪接位点)(剪接位点)1,increased riskOR G碱基置换可能影响碱基置换可能影响MDM2基因转录。基因转录。o生物信息学生物信息学软件预测该位点是软件预测该位点是C/EBP 转录因子结转录因子结合位点,采用合位点,采用EMSA和和Super-gel Shift试验证实了试验证实了C1797G多态性位点影响了多态性位点影响了C/EBP 转录因子与转录因子与DNA的结合,进一步证实了转录活性试验结果。的结合,进一步证实了转录活性试验结果。4/15/202472生物信息学生物信息学软件预测结果软件预测结果AT TTGTCGCAGT TTCCACCGCG GGCGGGAAGT GTAAACACAA GAAATACAAA CATAGCGCAA CGGCTAAAGG AGTGTCACAG CGCCAAACCT TGCTGGCTCC GCGCCAGGCCGAGCCCCACC CTCTCAGCTC GCGGCCAACA CCCCCACCCC GCCTCAGAGCCCGCCGCGCC CGCGGGGCGA CACCCCCCAC TCCATCATCC CGGAGGTGGTGCGGCCGAGC CCCGGACCCA ATTGGCGGAA GCGGGGCCGG TTGTGTGCGCGCGCACAAAT GCCCGGATGC GCCGCGACGA CCCGCGCGCT CCCCTCGGGC GGTAGGGGGC GCGCACCGAG GCACCGCGGC GAGCTTGGCT GCTTCTGGGG CCTGTGTGGC CCTGTGTGTC GGAAAGATGG AGCAAGAAGC C4/15/202473研究方案及主要结果研究方案及主要结果oRT-PCR试验发现,试验发现,1797GG患者膀胱癌组织中患者膀胱癌组织中MDM2基因基因mRNA表达水平明显高于表达水平明显高于1797CC患者,患者,进一步从体内证实了上述体外功能研究结果。进一步从体内证实了上述体外功能研究结果。o结论:启动子区结论:启动子区C1797G多态性可能通过影响多态性可能通过影响MDM2基因的转录调控而影响基因的转录调控而影响MDM2基因的功能,基因的功能,继而影响个体罹患膀胱癌的危险性,是中国南方汉继而影响个体罹患膀胱癌的危险性,是中国南方汉族人群膀胱癌重要的易感性标志物。族人群膀胱癌重要的易感性标志物。4/15/202474Reconstructed LD plot among 13 MDM2 SNPs in 100 southern Chinese control subjects by the Haploview software.The value among each diamond represents the pairwise correlation between SNPs(measured by D)defined by the upper left and the upper right sides of the diamond.The diamond without a number corresponds to D=1.Shading represents the magnitude and significance of pairwise.4/15/202475报告基因试验结果报告基因试验结果EMSA和和Super-gel shift试验结果试验结果EMSA assay with biotin-labeled either 1797C or 1797G probe and HeLa cell nuclear extracts.Lanes 1 and 6:showed the mobilities of the labeled probes without nuclear extracts;Lanes 3,7,and 8:represented the mobilities of the labeled probes with nuclear extracts in the absence of competitor.A specific nuclear protein binding can be completely abolished both by 100-fold unlabelled 1797C or C/EBP probes(Lanes 4 and 5).Super shift assays incubating with anti-C/EBP antibody showed a supershifted protein complex(Lanes 2 and 9).4/15/202476C1797G多态性与膀胱癌组织多态性与膀胱癌组织MDM2 mRNA表达水平关系(表达水平关系(RT-PCR)C1797G多态性与膀胱癌组织多态性与膀胱癌组织MDM2 蛋白表达水平(蛋白表达水平(Western blot)Lanes 1-2:1797CC;Lanes 4-5:1797CG;Lane 3:1797GG Lanes 4,7-9,11-12,and 16-22:1797CCLanes 1-3 and 13-15:1797CGLanes 5-6 and 10:1797GG 4/15/2024774/15/202478研究实例二研究实例二RUNX3标签标签SNPs与与膀胱癌遗传易感性研究膀胱癌遗传易感性研究4/15/202479RUNX3 基本信息基本信息o人类人类RUNT相关转录因子相关转录因子3(human runtrelated transcription factor 3,RUNX3)基因属基因属RUNT家族家族成员,参与胚胎发育过程中细胞基因表达的调控。成员,参与胚胎发育过程中细胞基因表达的调控。o人类人类RUNT家族成员包括家族成员包括3个个RUNT基因,分别为基因,分别为RUNX1、RUNX2和和 RUNX3。其中其中RUNX3是最小是最小的,是哺乳动物的,是哺乳动物RUNT家族进化的基础,对其研究家族进化的基础,对其研究也是最少的。也是最少的。4/15/202480RUNX3 的定位、结构特点的定位、结构特点o定位:基因位于染色体定位:基因位于染色体lp36o基因全长约基因全长约67kb,含有含有P1和和P2两个启两个启动子,动子,6个外显子和个外显子和1290bp的的ORF,内内含子含子1跨越了整条基因全长的一半跨越了整条基因全长的一半(35 kb)4/15/202481TagSNPs选择选择oHapMap数据库日期为数据库日期为2007/01,所选人群为,所选人群为CHB、MAF=0.10,标签选择方法为,标签选择方法为pairwise tagging onlyoThe location of 10 tagSNPs in the RUNX3 gene.The exons are indicated by black boxes and the 5and 3UTR are denoted by gray boxes.4/15/202482Significance of each tagSNPs.Associations of tagSNPs are indicated by negative base-10 logarithm of the P values for each allele.Point above the dotted line represents tagSNP association found to be significant at the P=0.05 level.4/15/202483rs760805分层分析分层分析4/15/20248410个个tagSNPs单倍型分析单倍型分析4/15/202485SNPs之间交互作用研究之间交互作用研究oPotential locuslocus and geneenvironment interactions were performed by using the non-parametric multifactor dimensionality reduction(MDR)software.oThen,interaction dendrogram was employed.The attributes(i.e.SNPs)that were strongly interacting appeared close together at the leaves of the tree,whereas those that do not interact appeared far from one another.4/15/202486Interaction dendrogram:The colors indicate the type of interactions.Red denotes a high degree of interaction,orange a lesser degree,and green represents week interaction.The hierarchical cluster analysis placed SNP4 and SNP10 on the same branch but SNP3,SNP5,SNP7,SNP8 and pack-years of smoking on the other branch.4/15/2024874/15/202488提提 纲纲1.单核苷酸多态性单核苷酸多态性Single Nucleotide Polymorphism2.基因多态性与疾病发生遗传易感性基因多态性与疾病发生遗传易感性Gene Polymorphism and Genetic Susceptibility to Disease3.启动子区单核苷酸多态性的功能学研究启动子区单核苷酸多态性的功能学研究Functional Study on SNPs within Promoter Region4.展望展望Future Prospects4/15/202489人类基因组计划人类基因组计划(HGP)和和环境基因组计划环境基因组计划(EGP)大范围大范围SNP识别计划识别计划(Large-scale SNP Identification Project)展望展望宿主遗传学特征决定了复杂疾病发生的易感性,这方面的宿主遗传学特征决定了复杂疾病发生的易感性,这方面的研究已经研究已经覆盖了临床医学的各个领域。覆盖了临床医学的各个领域。上述两个计划将为全基因组遗传相关性研究和精确地绘制上述两个计划将为全基因组遗传相关性研究和精确地绘制疾病易感性基因座疾病易感性基因座(Loci)提供大量的遗传标志物。)提供大量的遗传标志物。4/15/202490采用采用基于单倍体结构的高通量基因分型基于单倍体结构的高通量基因分型方法对于方法对于SNPs与疾病发生易感性研究将更为合理,但研与疾病发生易感性研究将更为合理,但研究所需的标志物数量和样本量令人望而却步。究所需的标志物数量和样本量令人望而却步。采用体内和体外方法研究采用体内和体外方法研究SNPs的功能的功能人类基因人类基因密集遗传学图谱的绘制密集遗传学图谱的绘制评价评价环境暴露与人类疾病的关系环境暴露与人类疾病的关系展望展望4/15/202491SNPs功能学研究思路功能学研究思路Association StudyFunctional StudyFunctional StudyAssociation Study4/15/202492Thank You!4/15/202493
展开阅读全文