1、专题一:QTL及其定位方法 nQTL的概念的概念 nQTL检测方法检测方法 n用于用于QTL定位的群体定位的群体 n统计方法统计方法 n图距函数图距函数 nQTL检测所需标记数预估检测所需标记数预估 QTL的概念的概念 1、A QTL is a segment of chromosome affecting the trait,not necessarily a single locus -D.S.Falconer et al,1995 2、A quantitative trait loci(QTL)is defined as a single gene or a cluster of clo
2、sely linked genes that have a large effect on a quantitative trait.-P.Sorensen,2000 QTL的概念的概念3、QTL,quantitative trait locus,is a place(region)that affects trait in the genome.It could span several genes,one or more of which affects the trait,but it has become common to take QTL as equal to major gen
3、e.B.Kinghorn,2000 理解:一个理解:一个QTL指在基因组中占据一定染色体区域,指在基因组中占据一定染色体区域,控制同一性状的一组微效多基因的集合(基因簇)或控制同一性状的一组微效多基因的集合(基因簇)或单个基因。但目前的研究中大部分将单个基因。但目前的研究中大部分将QTL理解为单个理解为单个基因(或主效基因)。一个数量性状可能受多个基因(或主效基因)。一个数量性状可能受多个QTL影响;一个影响;一个QTL也可能影响多个数量性状。也可能影响多个数量性状。QTL的概念的概念nQTL的特点(与传统的孟德尔因子比较)的特点(与传统的孟德尔因子比较)结构更松散,一个结构更松散,一个QTL
4、内各微效基因间可能内各微效基因间可能有比孟德尔因子内高得多的重组率,因此一有比孟德尔因子内高得多的重组率,因此一个个QTL并不象一个孟德尔位点那样独立分离并不象一个孟德尔位点那样独立分离和有明显的性状效应。和有明显的性状效应。QTL的概念的概念nQTL概念提出的意义(概念提出的意义(D.S.Falconer-1995)1、It could improve the efficacy of selective breeding,especially for traits with low heritability or that can only be measured in one sex.2、
5、Transgenic technology might be applied to quantitative traits.QTL的概念的概念3、In medicine,the identification of alleles causing predisposition to common multifactorial diseases could lead to improved methods of prevention.4、Quantitative genetic theory will be made more realistic when the numbers and prop
6、erties of the genes are known,and the more realistic theories will improve our understanding of evolution(and/or the development of the quantitative traits).QTL检测方法检测方法Candidategeneapproach(Hayes,2007)nThecandidate gene approach assumesthatageneinvolvedinthephysiologyofthetraitcouldharbouramutationc
7、ausingvariationinthattrait.Thegene,orpartsofthegene,aresequencedinanumberofdifferentanimals,andanyvariationsintheDNAsequences,thatarefound,aretestedforassociationwithvariationinthephenotypictrait.CandidategeneapproachnTherearetwoproblemswiththecandidategeneapproach:Firstly,thereareusuallyalargenumbe
8、rofcandidategenesaffectingatrait,somanygenesmustbesequencedinseveralanimalsandmanyassociationstudiescarriedoutinalargesampleofanimals.Secondly,thecausativemutationmaylieinagenethatwouldnothavebeenregardeda priori asanobviouscandidateforthisparticulartrait.QTL检测方法检测方法 n侯选基因途径的原理与方法:侯选基因途径的原理与方法:1、选定侯
9、选基因:根据现有的生物学、生理、选定侯选基因:根据现有的生物学、生理、生化知识,对数量性状的形成过程进行分析,生化知识,对数量性状的形成过程进行分析,预先选定一些基因作为数量性状的侯选基因。预先选定一些基因作为数量性状的侯选基因。2、数量性状记录和分子标记分析:数量性状记录和分子标记分析:PCR-RFLP,PCR-SSCP,MS,SNP等。等。QTL检测方法检测方法3、关联分析(关联分析(Association analysis)(1)Marker-based approach:按标记基因型对个按标记基因型对个体分组,然后对数量性状记录进行统计分析(体分组,然后对数量性状记录进行统计分析(t检
10、验,检验,方差分析等)方差分析等)(2)Trait-based approach(Selective genotyping):根据性状表型值分别选取根据性状表型值分别选取10-15%的高值个体和的高值个体和10-15%低值个体形成高低值个体形成高低值群体,低值群体,对两个群体中的个体进行基因型鉴定并对不同标记等对两个群体中的个体进行基因型鉴定并对不同标记等位基因的频率进行统计检验(百分数差异显著性检验位基因的频率进行统计检验(百分数差异显著性检验和和Fishers精确检验等)。精确检验等)。(3)效应值估计:效应值估计:a,d。QTL检测方法检测方法n关键:侯选基因的挑选及其准确性关键:侯选基
11、因的挑选及其准确性 n优点:成本低(与连锁分析法比较)优点:成本低(与连锁分析法比较)n缺点:需具备数量性状形成的生物学、生缺点:需具备数量性状形成的生物学、生理、生化等知识理、生化等知识 n经典例子:影响猪产仔数的经典例子:影响猪产仔数的ESR基因(基因(M.Rothschild et al 1996)QTL检测方法检测方法研究猪产仔数的意义研究猪产仔数的意义 n繁殖性状在猪生产中具有重要意义;繁殖性状在猪生产中具有重要意义;n猪的繁殖性状遗传力低,常规选择效猪的繁殖性状遗传力低,常规选择效果不好;果不好;n不同猪群存在较大的产仔数差异;不同猪群存在较大的产仔数差异;QTL检测方法检测方法选
12、定选定ESR作为侯选基因的依据作为侯选基因的依据 n类固醇类激素在繁殖过程中有重要作用;类固醇类激素在繁殖过程中有重要作用;n人类中发现人类中发现ESR的突变引起自发流产及乳的突变引起自发流产及乳腺癌;腺癌;n转基因研究发现携带突变转基因研究发现携带突变ESR的鼠与正常的鼠与正常鼠繁殖力有重大变化;鼠繁殖力有重大变化;n经典的经典的RFLP研究发现研究发现ESR存在多态性存在多态性(A:3.7;B:4.3kb;1.3kb cDNA Probe)QTL检测方法检测方法 Meishan synthetic lines Large White synthetic lines No.of sires2
13、7No.of sires181No.of dams50No.of dams565No.of females161No.of females1079No.of first parity records161No.of first parity records1079No.of all parity records276No.of all parity records1912QTL检测方法检测方法统计性状及分析方法统计性状及分析方法 nTNB-Total number born;NBA-Number born alive;ADG-Average daily gain;BF-Backfat thic
14、kness;FN-Number of functional nipples n模型:动物模型模型:动物模型 Additive effect was estimated as the linear regression of litter size on ESR(for all alleles,P0.01).Dominance effect was estimated from the least squares means.a,b means P0.01;cd means P0.05 ESR genotype Meishan synthesis lines First Parity All p
15、arities NTNBNBANTNBNBAAA6210.1a9.19811.0a10.2aAB7311.4b10.5125 12.4b11.5bBB2612.4b11.45312.5b11.7ba1.21.20.90.8d0.20.20.70.6QTL检测方法检测方法ESR genotype Large White synthesis lines First Parity All parities NTNBNBANTNBNBAAA4449.5c8.7c7599.8a9.0bAB3919.9c,d9.2c,d677 10.4b9.5bBB224 10.7d9.9d476 10.7b9.9ba0
16、.60.60.50.5d-0.2-0.10.20.0QTL检测方法检测方法讨论:讨论:n研究结果表明:研究结果表明:ESR位点存在变异,且其中一个最早位点存在变异,且其中一个最早在梅山猪中发现的等位基因与高窝仔数有显著关联。在梅山猪中发现的等位基因与高窝仔数有显著关联。n尽管所有各胎的数据不足以排除尽管所有各胎的数据不足以排除ESR-B等位基因对产等位基因对产仔数的效应为非加性的,但其对猪头胎产仔数的效应仔数的效应为非加性的,但其对猪头胎产仔数的效应肯定是加性的。肯定是加性的。nESR-B等位基因在梅山合成系中约增加等位基因在梅山合成系中约增加20%的窝仔的窝仔数,每窝仔猪可产生约数,每窝仔猪
17、可产生约$15-30的利润(美国市场条的利润(美国市场条件下)。件下)。QTL检测方法检测方法nESR-B等位基因在头胎及以后胎次中对窝产仔数效等位基因在头胎及以后胎次中对窝产仔数效应的差异可能反映了该基因的效应在大龄母猪中能为应的差异可能反映了该基因的效应在大龄母猪中能为环境效应所掩盖。环境效应所掩盖。n一个未解决的问题是一个未解决的问题是ESR基因在控制窝仔数性状中的基因在控制窝仔数性状中的实际作用?作者假设它可能控制胚胎的成活力,但这实际作用?作者假设它可能控制胚胎的成活力,但这一假设需进一步验证。一假设需进一步验证。n使用大白遗传背景的猪群进一步证实了使用大白遗传背景的猪群进一步证实了
18、ESR-B等位等位基因对头胎及所有各胎窝仔数有明显效应,但在大白基因对头胎及所有各胎窝仔数有明显效应,但在大白背景下效应较小,这表明遗传背景在背景下效应较小,这表明遗传背景在ESR基因的表达基因的表达中可能有作用或中可能有作用或ESR本身并不是控制窝仔数的主基因本身并不是控制窝仔数的主基因而只是一个连锁基因。而只是一个连锁基因。QTL检测方法检测方法n对与对与ESR基因连锁的各标记进一步进行分析发基因连锁的各标记进一步进行分析发现在所研究的标记中,用现在所研究的标记中,用ESR预测窝仔数效率预测窝仔数效率最高,但这并不能确定最高,但这并不能确定ESR是控制窝仔数的一是控制窝仔数的一个主基因,不
19、过这些结果至少表明个主基因,不过这些结果至少表明ESR是一个是一个与控制窝仔数基因紧密连锁的基因。与控制窝仔数基因紧密连锁的基因。nESR基因附近的雌性连锁图:基因附近的雌性连锁图:Sw552-8.3cM-Swr485-3.2cM-ESR-2.9cM-SOD2-2.9cM-Sw137-2.6cM-Sw64-25.4cM-S0008 QTL检测方法检测方法问题:问题:n侯选基因区可能会有多个多态位点,按传统的侯选基侯选基因区可能会有多个多态位点,按传统的侯选基因法可一个个进行分析。有关因法可一个个进行分析。有关ESR基因的研究实际基因的研究实际上作了这一工作,但受当时的技术条件限制,所找到上作了
20、这一工作,但受当时的技术条件限制,所找到的标记均距的标记均距ESR基因较远基因较远使用如使用如SNP等标记进等标记进行精细作图。行精细作图。n这些位点如为紧密连锁的,这些位点如为紧密连锁的,而且这些多态位点的连而且这些多态位点的连锁并不是随机形成的,因此位点间彼此在统计上并不锁并不是随机形成的,因此位点间彼此在统计上并不独立,这样如一个个分析就会有问题。独立,这样如一个个分析就会有问题。n分析模型中隐含的假设是该位点只有两个等位基因,分析模型中隐含的假设是该位点只有两个等位基因,这一假设从生物学上讲并不严谨。这一假设从生物学上讲并不严谨。QTL检测方法检测方法QTLmapping(Hayes,
21、2007)nQTLmappingassumestheactualgeneswhichaffectaquantitativetraitarenotknown,andthisapproachusesneutralDNAmarkersandlooksforassociationsbetweenallelevariationatthemarkerandvariationinquantitativetraits.nADNAmarkerisanidentifiablephysicallocationonachromosomewhoseinheritancecanbemonitored.nMarkersca
22、nbeexpressedregionsofDNA(genes)ormoreoftensomesegmentofDNAwithnoknowncodingfunctionbutwhosepatternofinheritancecanbedetermined.QTL检测方法检测方法QTLmapping(Hayes,2007)nTheproblemwithmappingQTLexploitinglinkageisthat,unlessahugenumberofprogenyperfamilyorhalfsibfamilyareused,theQTLaremappedtoverylargeconfide
23、nceintervalsonthechromosome.nToillustratethis,considertheformulathatDarvasiandSoller(1997)gaveforestimatingthe95%CIforQTLlocationforsimpleQTLmappingdesignsundertheassumptionofahighdensitygeneticmap.CI=3000/(kN2),whereN isthenumberofindividualsgenotyped,allelesubstitutioneffect(theeffectofgettinganex
24、tracopyoftheincreasingQTLallele)inunitsoftheresidualstandarddeviation,k thenumberofinformativeparentsperindividual,whichisequal1forhalf-sibsandbackcrossdesignsand2forF2QTL检测方法检测方法n连锁分析法(连锁分析法(Linkage analysis)1、原理:用连锁分析法定位原理:用连锁分析法定位QTL的基本原理是经典的基本原理是经典遗传学中的连锁分析(两点测交、三点测交)。遗传学中的连锁分析(两点测交、三点测交)。2、问题:问
25、题:QTL本身在群体中的传递过程无法直接观本身在群体中的传递过程无法直接观察。察。3、解解决决办办法法:利利用用与与QTL连连锁锁的的分分子子标标记记进进行行推推断断。因因为为当当一一个个分分子子标标记记与与QTL连连锁锁时时,他他们们倾倾向向于于一一起起遗遗传传,这这样样我我们们就就可可以以借借助助分分子子标标记记信信息息近近似似估估计计QTL在群体中的传递情况。在群体中的传递情况。QTL检测方法检测方法4.进行连锁分析的前提条件:进行连锁分析的前提条件:(1)有有充充分分覆覆盖盖整整个个基基因因组组的的分分子子标标记记连连锁锁图图谱,使能在整个基因组范围内搜索谱,使能在整个基因组范围内搜索
26、QTL;(2)标标记记座座位位与与QTL间间存存在在连连锁锁不不平平衡衡,即即不不同同的的标标记记等等位位基基因因倾倾向向于于分分别别与与不不同同的的QTL等位基因连锁;等位基因连锁;(3)数量性状在群(系)内(间)存在变异。)数量性状在群(系)内(间)存在变异。QTL检测方法检测方法5.常用分析方法:常用分析方法:(1)单单标标记记分分析析法法:一一次次只只使使用用一一个个标标记记,对对所所选选的的标标记记逐逐个个进进行行分分析析,筛筛选选出出与与QTL连锁的标记。连锁的标记。问题:所得结果为问题:所得结果为QTL效应值和标记与效应值和标记与QTL间交换率的混合结果间交换率的混合结果 QTL
27、检测方法检测方法近交系杂交的近交系杂交的F2设计设计F1交配配子频率及后代基因型频率交配配子频率及后代基因型频率 MQmqMqmQFrequency(1-r)/2(1-r)/2r/2r/2MQ(1-r)/2MMQQ(1-r)2/4MmQq(1-r)2/4 MMQqr(1-r)/4 MmQQr(1-r)/4 mq(1-r)/2MmQq(1-r)2/4mmqq(1-r)2/4 Mmqqr(1-r)/4 mmQqr(1-r)/4 Mqr/2MMQqr(1-r)/4 Mmqqr(1-r)/4 MMqqr2/4 MmQqr2/4 mQr/2MmQQr(1-r)/4 mmQqr(1-r)/4 MmQqr2
28、/4 mmQQr2/4 QTL检测方法检测方法近交系杂交的近交系杂交的F2设计设计设:r为重组率,为重组率,QQ的效应值为的效应值为a;Qq为为d;qq为为-a。各标记组数量性状平均值:。各标记组数量性状平均值:QTL检测方法检测方法近交系杂交的近交系杂交的F2设计设计n均值差:均值差:对均值差进行t检验(或其他统计检验)判定标记是否与QTL连锁。QTL检测方法检测方法女儿设计女儿设计(daughter design)配子频率及后代基因型频率配子频率及后代基因型频率 SireDamsMQmqMqmQ频率频率(1-r)/2(1-r)/2r/2r/2MQpMMQQ(1-r)p/2mMQq(1-r)
29、p/2 MMQqrp/2 mMQQrp/2 MqqMMQq(1-r)q/2 mMqq(1-r)q/2 MMqqrq/2 mMQqrq/2 QTL检测方法检测方法女儿设计女儿设计(daughter design)平均值:平均值:QTL检测方法检测方法女儿设计女儿设计(daughter design)QTL检测方法检测方法(2)区间定位区间定位(Intervalmapping,Lander&Botstein,1989):同时利用两个侧翼标记位点信息,用似然函数方同时利用两个侧翼标记位点信息,用似然函数方法分析标记区间内任何一点上具有法分析标记区间内任何一点上具有QTL的概率,的概率,进行似然比进行
30、似然比(Likelihood ratio)检验。与单标记检验。与单标记分析法比较,该法能大大提高分析法比较,该法能大大提高QTL的检测效率,的检测效率,并能较准确的估计出并能较准确的估计出QTL的位置和效应值。区间的位置和效应值。区间定位已成为目前定位已成为目前QTL检测中的标准方法,在动植检测中的标准方法,在动植物物QTL检测中得到了广泛的应用。检测中得到了广泛的应用。QTL检测方法检测方法n缺点:缺点:a.该方法并非真正的区间检验,某一区间的检验统计该方法并非真正的区间检验,某一区间的检验统计量可能受到该染色体上其他区间的量可能受到该染色体上其他区间的QTL效应影响。效应影响。b.考虑来自
31、其他标记位点的信息,一次只利用两个标考虑来自其他标记位点的信息,一次只利用两个标记进行检验并不是最有效的方法。记进行检验并不是最有效的方法。为此,有人在此基础上提出了同时利用多个标记位点为此,有人在此基础上提出了同时利用多个标记位点信息的复合区间定位法信息的复合区间定位法(Composite interval mapping,Zeng,Z-B,1993,1994),该法能在存该法能在存在两个或多个连锁的在两个或多个连锁的QTL情况下,对情况下,对QTL的位置和的位置和效应提供更精确的估计。效应提供更精确的估计。用于用于QTL 定位的群体定位的群体1、近交系间的杂交:近交系间的杂交:F2,BC,
32、植物中还有植物中还有DH,RIL DH:Doubled haploids,单倍加倍系,取单倍加倍系,取近交系杂交得到的近交系杂交得到的F1的精细胞,将其染色的精细胞,将其染色体加倍形成。体加倍形成。RIL:Recombinant inbreeding lines,重组近交系,由重组近交系,由F1个体自交得到。个体自交得到。用于用于QTL 定位的群体定位的群体2、有差异群体间杂交:与近交系杂交类似,、有差异群体间杂交:与近交系杂交类似,但使用远缘种但使用远缘种(系系)间杂交,如使用商用蛋鸡间杂交,如使用商用蛋鸡系和肉鸡系间的杂交及野猪与家猪杂交等。系和肉鸡系间的杂交及野猪与家猪杂交等。3、远交群
33、体:女儿设计(、远交群体:女儿设计(Daughter design)及孙女设计)及孙女设计(Granddaughter Design)统计方法统计方法 n一般线性模型法:主要利用均值及方差信息,一般线性模型法:主要利用均值及方差信息,常用方法有方差分析法常用方法有方差分析法(ANOVA),简单,简单回归法及多元回归法。回归法及多元回归法。n最大似然法:利用资料的分布特征,因而效最大似然法:利用资料的分布特征,因而效率更高。率更高。n混合线性模型法:利用亲属信息。混合线性模型法:利用亲属信息。图距函数图距函数nHaldane图距函数:图距函数:nKosambi图距函数:图距函数:QTL检测所需标
34、记数预估检测所需标记数预估(Lange and Boehnke,1982)N:随机分布于基因组中的标记位点数随机分布于基因组中的标记位点数dm:任何两个标记间的最大距离:任何两个标记间的最大距离L:基因组总的图距长度:基因组总的图距长度p:任何两个标记间距离不大于:任何两个标记间距离不大于dm的概率的概率 QTL检测所需标记数预估检测所需标记数预估例:人的基因组总长为例:人的基因组总长为3300cM,要,要以以90%的概率得到一个标记间不超过的概率得到一个标记间不超过2cM的饱和标记图谱,至少需的饱和标记图谱,至少需3800个个随机标记位点。如果标记间是均匀分布随机标记位点。如果标记间是均匀分
35、布的,则需的,则需1650个标记。在个标记。在QTL检测中,检测中,通常要求标记的平均距离在通常要求标记的平均距离在10cM以下。以下。QTL克隆克隆 nQTLQTL鉴定的最终目标:克隆并对克隆片段测序,鉴定的最终目标:克隆并对克隆片段测序,n目前的目前的QTLQTL检测方法只能说明一个检测方法只能说明一个QTLQTL与一个或几与一个或几个标记,但不足以克隆该个标记,但不足以克隆该QTLQTL,因为即使是在紧密,因为即使是在紧密连锁的情况下,物理距离也十分远,如连锁的情况下,物理距离也十分远,如1%1%的重组的重组率其物理距离就在百万数量级的碱基。率其物理距离就在百万数量级的碱基。n并不是说不能克隆并不是说不能克隆QTLQTL,但我们必需在与,但我们必需在与QTLQTL连锁连锁的标记附近进行精细作图(如采用的标记附近进行精细作图(如采用SNPSNP标记等),标记等),n有关精细作图的方法还需进一步进行研究。有关精细作图的方法还需进一步进行研究。