1、5 5 目的基因的克隆与基因文库的构建目的基因的克隆与基因文库的构建 基因工程或基因工程或DNADNA重组技术三大用途的前提条件是从生物体基因组重组技术三大用途的前提条件是从生物体基因组中分离克隆目的基因,目的基因获得之后,或确定其表达调控机制和中分离克隆目的基因,目的基因获得之后,或确定其表达调控机制和生物学功能,或建立高效表达系统,构建具有经济价值的基因工程菌生物学功能,或建立高效表达系统,构建具有经济价值的基因工程菌(细胞),或将目的基因在体外进行必要的结构功能修饰,然后输回(细胞),或将目的基因在体外进行必要的结构功能修饰,然后输回细胞内改良生物体的遗传性状,包括人体基因治疗。细胞内改
2、良生物体的遗传性状,包括人体基因治疗。一般来说,目的基因的克隆战略分为两大类:一类是构建感兴趣一般来说,目的基因的克隆战略分为两大类:一类是构建感兴趣的生物个体的基因文库,即将某生物体的全基因组分段克隆,然后建的生物个体的基因文库,即将某生物体的全基因组分段克隆,然后建立合适的筛选模型从基因组文库中挑出含有目的基因的重组克隆;另立合适的筛选模型从基因组文库中挑出含有目的基因的重组克隆;另一类是利用一类是利用PCRPCR扩增技术甚至化学合成法体外直接合成目的基因,然扩增技术甚至化学合成法体外直接合成目的基因,然后将之克隆表达。后将之克隆表达。A A 鸟枪法鸟枪法5 5 目的基因的克隆与基因文库的
3、构建目的基因的克隆与基因文库的构建鸟枪法克隆目的基因的基本战略鸟枪法克隆目的基因的基本战略鸟枪法操作的改进鸟枪法操作的改进鸟枪法克隆目的基因的局限性鸟枪法克隆目的基因的局限性鸟枪法克隆目的基因的基本战略鸟枪法克隆目的基因的基本战略 随机克隆供体细胞的全基因组随机克隆供体细胞的全基因组DNADNA片段,然后通过快速有效的筛选程序从片段,然后通过快速有效的筛选程序从众多克隆中分离出含有目的基因的众多克隆中分离出含有目的基因的目的目的重组子重组子,进而获得目的基因。鸟枪法适,进而获得目的基因。鸟枪法适用于原核细菌目的基因的克隆分离用于原核细菌目的基因的克隆分离 鸟枪法克隆目的基因的基本战略鸟枪法克隆
4、目的基因的基本战略染色体染色体DNADNA的切断的切断 超声波处理:超声波处理:片段长度均一,大小可控,平头末端片段长度均一,大小可控,平头末端 全酶切:全酶切:片段长度不均一,粘性末端便于连接,但有可能使目的基因断开,片段长度不均一,粘性末端便于连接,但有可能使目的基因断开,大小不可控大小不可控 部分酶切:部分酶切:片段长度可控,含有粘性末端,目的基因完整片段长度可控,含有粘性末端,目的基因完整 与载体连接与载体连接 如果转化子采用菌落原位杂交法或限制性酶切图谱法筛选,则选择多拷贝克隆载如果转化子采用菌落原位杂交法或限制性酶切图谱法筛选,则选择多拷贝克隆载体;如果转化子采用基因产物功能检测法
5、筛选,则选择表达型载体体;如果转化子采用基因产物功能检测法筛选,则选择表达型载体如果转化子采用菌落原位杂交法或限制性酶切图谱法筛选,则选择大肠杆菌作如果转化子采用菌落原位杂交法或限制性酶切图谱法筛选,则选择大肠杆菌作为为转化受体细胞转化受体细胞 受体细胞;如果转化子采用基因产物功能检测法筛选,则选择能使目的基因表达受体细胞;如果转化子采用基因产物功能检测法筛选,则选择能使目的基因表达的受体细胞的受体细胞筛选含有目的基因的目的重组子筛选含有目的基因的目的重组子 菌落原位杂交法、基因产物功能检测法(筛选模型的建立)菌落原位杂交法、基因产物功能检测法(筛选模型的建立)鸟枪法操作的改进鸟枪法操作的改进
6、使用这一改进方法的前提条件是:目的基因的酶切图谱已知。使用这一改进方法的前提条件是:目的基因的酶切图谱已知。如果已知目的基因两端的酶切口,可用该酶处理染色体如果已知目的基因两端的酶切口,可用该酶处理染色体DNADNA,然后与载体拼接,这样可以保证目的基因的完整性,从而提高然后与载体拼接,这样可以保证目的基因的完整性,从而提高重组子中重组子中目的重组子目的重组子的出现频率的出现频率 使用特征性限制性内切酶切开染色体使用特征性限制性内切酶切开染色体DNADNA 鸟枪法操作的改进鸟枪法操作的改进例如,已知某目的基因位于例如,已知某目的基因位于1.8 1.8 kbkb的的SalISalI片段中,将染色
7、体片段中,将染色体DNADNA用用SalISalI切开,琼切开,琼脂糖凝胶电泳分离,用刀片切下相当于脂糖凝胶电泳分离,用刀片切下相当于1.6-2.01.6-2.0 kbkb大小区域内的凝胶块,从此大小区域内的凝胶块,从此凝胶块中回收凝胶块中回收DNADNA片段,然后与载体进片段,然后与载体进行拼接行拼接在连接前将在连接前将DNADNA片段进行分级分离片段进行分级分离 2.0 kb1.6 kb1.8 kb鸟枪法操作的改进鸟枪法操作的改进冻融法冻融法滤纸法滤纸法吸附法吸附法低融点凝胶法低融点凝胶法溶解法溶解法凝胶凝胶DNADNA片段回收技术片段回收技术 鸟枪法克隆目的基因的局限性鸟枪法克隆目的基因
8、的局限性工作量较大,需要了解目的基因的背景知识工作量较大,需要了解目的基因的背景知识不能获得的最小长度的目的基因不能获得的最小长度的目的基因不能除去真核生物目的基因的内含子结构不能除去真核生物目的基因的内含子结构B cDNAB cDNA法法5 5 目的基因的克隆与基因文库的构建目的基因的克隆与基因文库的构建cDNAcDNA法克隆目的基因的基本战略法克隆目的基因的基本战略cDNAcDNA法分离目的基因的基本程序法分离目的基因的基本程序cDNAcDNA法法克隆目的基因的局限性法法克隆目的基因的局限性cDNAcDNA法克隆目的基因的基本战略法克隆目的基因的基本战略mDNAmDNAc cDNADNA第
9、一链的合成第一链的合成 55pppppp55G G AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 3355pppppp55G G AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 33TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 5555pppppp55G G AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 33TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 55cDNAcDNA第一链第一链引物引物退火退火逆转录酶逆转录酶dNTPsdNTPsc cDNADNA第二链的合成第二链的合成 煮沸煮沸NaOHNaOH自
10、身引导法:自身引导法:获得的双链获得的双链cDNA cDNA 55端会有几对碱基缺失端会有几对碱基缺失AAAAAAAAAAAAAAAAAAAAAAAAAAAA55pppppp55G G AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 33TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 55TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 55TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 55AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 33TTTTTTTTTTTTTTTTTTTTTTTTTTTTOHOH 33Kle
11、nowKlenowdNTPsdNTPsS1S1c cDNADNA第二链的合成第二链的合成 DNApol dNTPsDNApol dNTPsRNaesHRNaesH置换合成法:置换合成法:获得的双链获得的双链cDNA cDNA 55端也会有几对碱基缺失端也会有几对碱基缺失55pppppp55G G AAAAAAAAAAAAAAAAAAAAAAAAAAAAOHOH 33TTTTTTTTTTTTTTTTTTTTTTTTTTTTpp 55AAAAAAAAAAAAAAAAAAAAAAAAAAAApp 5555S1S1 AAAA AAAATTTTTTOHOH 33TTTTTTTTTTTTTTTTTTTTT
12、TTTTTTTpp 5555TTTTTTTTTTTTTTTTTTTTTTTTTTTTOHOH 33AAAAAAAAAAAAAAAAAAAAAAAAAAAA 5555TTTTTTTTTTTTTTTTTTTTTTTTTTTT 3333T4-DNA ligaseT4-DNA ligasec cDNADNA第二链的合成第二链的合成 dCTPdCTPTdTTdT引导合成法:引导合成法:获得的双链获得的双链cDNA cDNA 能保留完整的能保留完整的55端序列端序列55pppppp55G G AAAAAAAAAAOHOH 33TTTTTTTTTTpp 5533 HOHO55pppppp55G G AAAA
13、AAAAAACCCCCCCCCCCCCCOHOH 3333 HOHOCCCCCCCCCCCCCCTTTTTTTTTTpp 5533 HOHOCCCCCCCCCCCCCCTTTTTTTTTTpp 5533 HOHOCCCCCCCCCCCCCCTTTTTTTTTTpp 5555 ppGGGGGGGGGGGGGG33 HOHOCCCCCCCCCCCCCCTTTTTTTTTTpp 5555 ppGGGGGGGGGGGGGGAAAAAAAAAAOHOH 33NaOHNaOH退火退火KlenowKlenowdNTPsdNTPscDNAcDNA法克隆目的基因的基本战略法克隆目的基因的基本战略双链双链c cD
14、NADNA的克隆的克隆 双链平头的双链平头的cDNAcDNA通常可以使用下列三种方法克隆入载体中:通常可以使用下列三种方法克隆入载体中:平头末端直接与载体连接,平头末端直接与载体连接,但插入的片段无法回收但插入的片段无法回收 平头两端分别接同聚物尾,平头两端分别接同聚物尾,最好是最好是ATAT同聚物尾,这样重组同聚物尾,这样重组分子可通过加热局部变性和分子可通过加热局部变性和S1S1核酸酶处理回收插入片段核酸酶处理回收插入片段加装人工接头引入酶切口,加装人工接头引入酶切口,以便插入片段回收以便插入片段回收 cDNAcDNA法分离目的基因的基本程序法分离目的基因的基本程序完备分离程序完备分离程序
15、 提提取取细细胞胞总总mRNAmRNA,合合成成总总cDNAcDNA,将将之之全全部部克克隆隆,然然后后借助于合适的筛选手段找到借助于合适的筛选手段找到目的重组子目的重组子 筛筛选选时时,若若使使用用的的是是多多拷拷贝贝载载体体,则则采采用用菌菌落落原原位位杂杂交交法法筛选;若使用的是表达型载体,则采用菌落免疫杂交法筛选筛选;若使用的是表达型载体,则采用菌落免疫杂交法筛选 完备分离程序适用于完备分离程序适用于mRNAmRNA分子数少的目的基因的克隆,分子数少的目的基因的克隆,如人胰岛素基因、干扰素基因、凝血因子如人胰岛素基因、干扰素基因、凝血因子VIIIVIII基因等基因等 cDNAcDNA法
16、分离目的基因的基本程序法分离目的基因的基本程序特异分离程序特异分离程序 提提取取细细胞胞总总mRNAmRNA,琼琼脂脂糖糖凝凝胶胶电电泳泳分分离离,回回收收目目标标mRNAmRNA,由此合成双链由此合成双链cDNAcDNA,然后进行克隆然后进行克隆 特特异异分分离离程程序序较较适适用用于于mRNAmRNA丰丰度度极极高高的的目目的的基基因因克克隆隆如血红蛋白基因等如血红蛋白基因等 cDNAcDNA法分离目的基因的基本程序法分离目的基因的基本程序差异分离程序差异分离程序 利用两组细胞利用两组细胞mRNAmRNA种类的差异,分离克隆差异种类的差异,分离克隆差异mRNAmRNA所对所对应的应的cDN
17、AcDNA,因而这种程序较适用于分离克隆新基因因而这种程序较适用于分离克隆新基因 例如:正常的大鼠例如:正常的大鼠FR3T3FR3T3成纤维细胞中,有些新基因是不能成纤维细胞中,有些新基因是不能自发表达的,需在多瘤病毒感染之后方可转录。任务是要分离克自发表达的,需在多瘤病毒感染之后方可转录。任务是要分离克隆这些新基因,进而研究其生物学功能隆这些新基因,进而研究其生物学功能 差异分离程序差异分离程序 多瘤病毒感染的多瘤病毒感染的FR3T3FR3T3细胞细胞正常的正常的FR3T3FR3T3细胞细胞总总mRNAmRNA总总mRNAmRNAcDNAcDNA双链双链cDNAcDNA单链单链cDNAcDN
18、A提取提取mRNAmRNA合成合成cDNAcDNA合成第二链合成第二链克隆克隆提取提取mRNAmRNA共价交联共价交联上柱上柱原位杂交原位杂交病毒诱导表达的基因病毒诱导表达的基因cDNAcDNA克隆克隆cDNAcDNA法克隆目的基因的局限性法克隆目的基因的局限性并非所有的并非所有的mRNAmRNA分子都具有分子都具有polyApolyA结构结构 细菌或原核生物的细菌或原核生物的mRNAmRNA半衰期很短半衰期很短mRNAmRNA在细胞中含量少,对酶和碱极为敏感,在细胞中含量少,对酶和碱极为敏感,分离纯化困难分离纯化困难仅限于克隆蛋白质编码基因仅限于克隆蛋白质编码基因 C PCRC PCR法法5
19、 5 目的基因的克隆与基因文库的构建目的基因的克隆与基因文库的构建 PCRPCR(Polymerase Chain ReactionPolymerase Chain Reaction)法,又称为法,又称为聚合酶聚合酶链反应链反应或或PCRPCR扩增技术扩增技术,是一种高效快速的体外,是一种高效快速的体外DNADNA聚合程序聚合程序 使用使用PCRPCR法克隆目的基因的前提条件是:已知待扩增目的法克隆目的基因的前提条件是:已知待扩增目的基因或基因或DNADNA片段两侧的序列,根据该序列化学合成聚合反应必片段两侧的序列,根据该序列化学合成聚合反应必 需的双引物需的双引物 PCRPCR法定向扩增目的
20、基因的基本原理法定向扩增目的基因的基本原理5555目的基因目的基因55变性变性加热加热5555引物引物退火退火5555底物底物聚合聚合55555555加热加热变性变性55555555555555555555555555555555555555555555555555退火退火 引物引物底物底物聚合聚合加热加热变性变性引物引物退火退火底物底物聚合聚合112233 由由Taq DNATaq DNA聚合酶扩增的聚合酶扩增的PCRPCR产物中,其产物中,其33末端总是会带有末端总是会带有一个非模板依赖型的突出碱基,而且这个碱基几乎总是一个非模板依赖型的突出碱基,而且这个碱基几乎总是A A,因为因为Taq
21、 DNATaq DNA聚合酶对聚合酶对dATPdATP具有优先聚合活性。由于该突出碱基的具有优先聚合活性。由于该突出碱基的存在,克隆时即可以采取存在,克隆时即可以采取TdTTdT末端加同聚尾的方法与载体拼接,末端加同聚尾的方法与载体拼接,也可以使用专门的也可以使用专门的T T载体载体克隆克隆 PCRPCR克隆目的基因的基本程序克隆目的基因的基本程序5555AAAATTTT5555PCRPCR扩增产物扩增产物T T 载体载体T7T7lacZlacZMCSMCSorioriApAprrD D 化学合成法化学合成法5 5 目的基因的克隆与基因文库的构建目的基因的克隆与基因文库的构建化学合成法的基本战
22、略化学合成法的基本战略化学合成的单元操作化学合成的单元操作DNADNA化学合成的用途化学合成的用途化学合成法的基本战略化学合成法的基本战略全基因合成全基因合成化学合成目的基因的前提条件是基因的化学合成目的基因的前提条件是基因的DNADNA序列已知,有三种战略:序列已知,有三种战略:小片段粘接法:小片段粘接法:混合退火混合退火根据目的基因全序列,分别合成根据目的基因全序列,分别合成12-1512-15碱基长的单链碱基长的单链DNADNA小片段小片段T4-DNAT4-DNA连接酶连接连接酶连接克隆入合适的载体克隆入合适的载体 化学合成法的基本战略化学合成法的基本战略全基因合成全基因合成补钉延长法:
23、补钉延长法:混合退火混合退火根据目的基因根据目的基因两条互补链两条互补链全序列,分别合成全序列,分别合成12-1512-15碱基长的单链碱基长的单链DNADNA小片段以及小片段以及20-3020-30碱基长的单链碱基长的单链DNADNA中片段中片段T4-DNAT4-DNA连接酶连接连接酶连接克隆入合适的载体克隆入合适的载体 KlenowKlenow酶聚合酶聚合化学合成法的基本战略化学合成法的基本战略全基因合成全基因合成大片段酶促法:大片段酶促法:混合退火混合退火根据目的基因根据目的基因的的全序列,分别合成全序列,分别合成40-5040-50碱基长的单链碱基长的单链DNADNA片段片段T4-DN
24、AT4-DNA连接酶连接连接酶连接克隆入合适的载体克隆入合适的载体 KlenowKlenow酶聚合酶聚合化学合成法的基本战略化学合成法的基本战略全基因合成全基因合成 上述三种方法各有利弊:化学合成上述三种方法各有利弊:化学合成DNADNA的的单片段愈短,收率就单片段愈短,收率就愈高,但由于化学合成的份额较大,成本较高;在大片段酶促法合愈高,但由于化学合成的份额较大,成本较高;在大片段酶促法合成目的基因时,虽然化学合成的份额相对较小,成本较低,但大片成目的基因时,虽然化学合成的份额相对较小,成本较低,但大片段化学合成的收率极低,例如,每聚合一个单体的产物收率为段化学合成的收率极低,例如,每聚合一
25、个单体的产物收率为95%95%则合成则合成5050个碱基长的个碱基长的DNADNA单链大片段的总收率只有单链大片段的总收率只有7.7%7.7%化学合成法的基本战略化学合成法的基本战略探针等寡聚核苷酸合成探针等寡聚核苷酸合成 在某些情况下,往往只知道目的基因编码产物的部分氨基酸在某些情况下,往往只知道目的基因编码产物的部分氨基酸序列,而基因序列未知,此时需要从已知的氨基酸序列推测为其序列,而基因序列未知,此时需要从已知的氨基酸序列推测为其编码的编码的DNADNA序列,然后合成探针,筛选由鸟枪法或序列,然后合成探针,筛选由鸟枪法或cDNAcDNA法得到法得到的重组子,最终获得含有目的基因的的重组子
26、,最终获得含有目的基因的目的重组子目的重组子 由于大多数氨基酸拥有由于大多数氨基酸拥有简并密码子简并密码子,故在探针序列的设计时,故在探针序列的设计时必须考虑下列问题:必须考虑下列问题:生物体对简并密码子的生物体对简并密码子的偏爱性偏爱性,合成系列探针合成系列探针探针应具有足够的长度,通常在探针应具有足够的长度,通常在17-2017-20个核苷酸之间个核苷酸之间探针内部不应出现可能的互补区域探针内部不应出现可能的互补区域化学合成法的基本战略化学合成法的基本战略探针等寡聚核苷酸合成探针等寡聚核苷酸合成某段连续的氨基酸序列某段连续的氨基酸序列Cys Met Asp Glu Met Lys Arg
27、Asn IleCys Met Asp Glu Met Lys Arg Asn Ile所有可能的所有可能的DNADNA序列序列TGTTGTATGATGGACGACGAAGAAATGATGAAAAAAAGAAGAAACAACATAATA C T C T G GATG ATG G G G G T T T T C C CGA CGA CGG CGG CGT CGT CGC CGC设计的简并探针序列设计的简并探针序列TGTGT TATGATGGAGAC CGAGAI IATGATGA ATGTGT TATGATGGAGAT TGAGAI IATGATGA ATGTGC CATGATGGAGAC CGAG
28、AI IATGATGA ATGTGC CATGATGGAGAT TGAGAI IATGATGA A A A G G此外还可以参考各种生物体的此外还可以参考各种生物体的ESTEST数据库进行倾向性简并序列设计数据库进行倾向性简并序列设计expressed sequence tagexpressed sequence tag化学合成的单元操作化学合成的单元操作 化化学学合合成成DNADNA的的实实质质是是按按照照序序列列要要求求将将脱脱氧氧核核苷苷酸酸单单体体一一个个个个接接上上去去,每每接接一一个个单单体体就就是是一一个个循循环环反反应应,包包括括:基基团团保保护护、分离分离、缩合缩合、分离分离
29、、去保护去保护五大操作单元。五大操作单元。从反应机理上来讲,从反应机理上来讲,DNADNA化学合成有化学合成有磷酸二酯法磷酸二酯法、磷酸三酯磷酸三酯法法、亚磷酸液三酯法亚磷酸液三酯法;具体操作过程又有;具体操作过程又有液相合成液相合成和和固相合成固相合成两两种形式。前者操作繁琐,基本上已淘汰;后者反应中间物的分离种形式。前者操作繁琐,基本上已淘汰;后者反应中间物的分离程序简便,程序简便,DNADNA合成仪就是根据合成仪就是根据固相亚磷酸液三酯法固相亚磷酸液三酯法原理设计的原理设计的化学合成的单元操作化学合成的单元操作OHGHHHHOCH2ODMTPOMeNCHMeMeCHMeMeHDMTDMT
30、:二甲氧基三苯甲基二甲氧基三苯甲基激活激活缩合缩合氧化氧化脱取代基脱取代基玻璃珠玻璃珠连接臂连接臂DNADNA化学合成的用途化学合成的用途合成天然基因合成天然基因修饰改造基因修饰改造基因 设计新型基因设计新型基因 制备探针、引物、接头制备探针、引物、接头 如生长激素释放抑制素基因、脑啡肽基因、胰岛素基因、干扰素如生长激素释放抑制素基因、脑啡肽基因、胰岛素基因、干扰素如组织型纤溶酶原激活剂基因、尿激酶原基因等如组织型纤溶酶原激活剂基因、尿激酶原基因等 基因等基因等E E 基因文库的构建基因文库的构建5 5 目的基因的克隆与基因文库的构建目的基因的克隆与基因文库的构建基因文库的基本概念基因文库的基
31、本概念基因文库的构建程序基因文库的构建程序基因组文库重组克隆的排序基因组文库重组克隆的排序基因文库的基本概念基因文库的基本概念基因库与基因文库基因库与基因文库基因库(基因库(gene poolgene pool)特定生物体全基因组的集合(天然存在)特定生物体全基因组的集合(天然存在)基因文库(基因文库(gene library or gene bankgene library or gene bank)从特定生物个体中分离的全部基因,这些基因以克隆的形式从特定生物个体中分离的全部基因,这些基因以克隆的形式基因组文库基因组文库(含有全部基因)(含有全部基因)存在(人工构建)。根据构建方法的不同,
32、基因文库分为:存在(人工构建)。根据构建方法的不同,基因文库分为:cDNAcDNA文库文库(含有全部蛋白质编码的结构基因)(含有全部蛋白质编码的结构基因)基因文库的基本概念基因文库的基本概念基因文库构建的基本战略基因文库构建的基本战略用鸟枪法构建基因组文库,用鸟枪法构建基因组文库,材料来自染色体材料来自染色体DNADNA用用cDNAcDNA法构建法构建cDNAcDNA文库,文库,材料来自材料来自mRNAmRNA在高度分化的生物体中,不同组织和细胞在不同时段的在高度分化的生物体中,不同组织和细胞在不同时段的mRNAmRNA种类不同(即基因的表达谱不同),因此同种生物体的种类不同(即基因的表达谱不
33、同),因此同种生物体的cDNAcDNA文库文库一般还有组织细胞的界定,如肝组织一般还有组织细胞的界定,如肝组织cDNAcDNA文库或胚胎组织文库或胚胎组织cDNAcDNA文库等。很显然,文库等。很显然,cDNAcDNA文库的信息量远小于基因组文库文库的信息量远小于基因组文库基因文库的基本概念基因文库的基本概念基因文库的完备性基因文库的完备性基因文库的基因文库的完备性完备性是指:在构建的基因文库中任一基因存在的概是指:在构建的基因文库中任一基因存在的概率,它与基因文库最低所含克隆数率,它与基因文库最低所含克隆数NN之间的关系可用下式表示:之间的关系可用下式表示:N=ln(1 P)/ln(1 f)
34、N=ln(1 P)/ln(1 f)其中:其中:P=P=任一基因被克隆(或存在于基因文库中)的概率任一基因被克隆(或存在于基因文库中)的概率 f=f=克隆片段的平均大小克隆片段的平均大小/生物基因组的大小生物基因组的大小 例如,人的单倍体例如,人的单倍体DNADNA总长为总长为2.9 2.9 x 10 x 1099 bp bp,基因文库中克隆片段基因文库中克隆片段的平均大小为的平均大小为15 15 kbkb,则构建一个完备性为则构建一个完备性为0.90.9的的基因文库至少需要基因文库至少需要4545万个克隆;而当完备性提高到万个克隆;而当完备性提高到0.99990.9999时,基因文库至少需要时
35、,基因文库至少需要180180万个克隆万个克隆基因文库的基本概念基因文库的基本概念基因文库的质量标准基因文库的质量标准除了尽可能高的除了尽可能高的完备性外,完备性外,一个理想的基因文库应具备下列条件:一个理想的基因文库应具备下列条件:重组克隆的总数不宜过大重组克隆的总数不宜过大 以减轻筛选工作的压力以减轻筛选工作的压力载体的装载量最好大于基因的长度载体的装载量最好大于基因的长度 避免基因被分隔克隆避免基因被分隔克隆克隆与克隆之间必须存在足够长度的重叠区域克隆与克隆之间必须存在足够长度的重叠区域 以利克隆排序以利克隆排序克隆片段易于从载体分子上完整卸下克隆片段易于从载体分子上完整卸下重组克隆能稳
36、定保存、扩增、筛选重组克隆能稳定保存、扩增、筛选基因文库的构建程序基因文库的构建程序基因组基因组DNADNA的制备的制备 为了最大限度地保证基因在克隆过程中的完整性,为了最大限度地保证基因在克隆过程中的完整性,用于基因组用于基因组文库构建的文库构建的DNADNA在分离纯化操作中应尽量避免过度的断裂。制备的在分离纯化操作中应尽量避免过度的断裂。制备的DNADNA分子量越大,经切割处理后样品中含有不规则末端的分子量越大,经切割处理后样品中含有不规则末端的DNADNA片段片段的比率就越低,重组率和完备性也就越高的比率就越低,重组率和完备性也就越高AAAAAAAA用常规方法制备的染色体用常规方法制备的
37、染色体DNADNA的长度一般在的长度一般在100 100 kbkb左右左右如果先将细胞固定在低融点凝如果先将细胞固定在低融点凝胶中,然后置入含有胶中,然后置入含有SDSSDS、蛋蛋白酶白酶K K、RNaseRNase的缓冲液中浸泡,可获得的缓冲液中浸泡,可获得1000 1000 kbkb大小的大小的DNADNA片段片段基因文库的构建程序基因文库的构建程序基因组基因组DNADNA的切割的切割 用于基因组用于基因组文库构建的文库构建的DNADNA片段的切割一般采用片段的切割一般采用超声波处理超声波处理和和限制性内切酶限制性内切酶部分酶切部分酶切两种方法,其目的是:两种方法,其目的是:第一,保证第一
38、,保证DNADNA片段之间存在部分重叠区片段之间存在部分重叠区 第二,保证第二,保证DNADNA片段大小均一片段大小均一超声波处理超声波处理后的后的DNADNA片段呈平头末端,需加装人工接头片段呈平头末端,需加装人工接头 部分酶切法部分酶切法一般选用四对碱基识别序列的限制性内切酶一般选用四对碱基识别序列的限制性内切酶,如:如:Sau3AISau3AI或或MboIMboI等,这样等,这样DNADNA酶解片段的大小可控酶解片段的大小可控 连接前,上述处理的连接前,上述处理的DNADNA片段必须根据载体的装载量进行分级片段必须根据载体的装载量进行分级分离,以杜绝不相干的分离,以杜绝不相干的DNADN
39、A片段随机连为一体!片段随机连为一体!基因文库的构建程序基因文库的构建程序载体和受体的选择载体和受体的选择 出于压缩重组克隆的数量,用于出于压缩重组克隆的数量,用于基因组基因组文库文库构建的构建的载体通常选载体通常选装载量较大的装载量较大的l l-DNA-DNA或考斯质粒;对于大型基因组(如动植物和或考斯质粒;对于大型基因组(如动植物和人类)需使用人类)需使用YACYAC或或BACBAC载体载体ll-DNA-DNA 由于绝大多数真核生物的由于绝大多数真核生物的mRNAmRNA小于小于10 10 kbkb,因此用于因此用于cDNAcDNA文库文库构构建的载体建的载体通常选质粒通常选质粒 上述几种
40、上述几种载体的最大装载量如下:载体的最大装载量如下:质粒质粒考斯质粒考斯质粒15 15 kbkb25 25 kbkb45 45 kbkbBACBAC300 300 kbkbYACYAC400 400 kbkb 用于基因用于基因文库构文库构建的受体则根据载体使用大肠杆菌或酵母菌建的受体则根据载体使用大肠杆菌或酵母菌基因文库的构建程序基因文库的构建程序从基因文库中筛选目的基因从基因文库中筛选目的基因 大型基因组大型基因组文库文库一般由数十万甚至上百万个重组克隆组成。除一般由数十万甚至上百万个重组克隆组成。除了一些具有特殊功能的蛋白质编码基因(如抗药性基因、结合蛋白了一些具有特殊功能的蛋白质编码基因
41、(如抗药性基因、结合蛋白编码基因等)可以采用特殊的正选择筛选编码基因等)可以采用特殊的正选择筛选程序(如程序(如抗药性筛选法抗药性筛选法、酵母双杂交技术酵母双杂交技术等)直接筛选外,一般的基因组等)直接筛选外,一般的基因组文库筛选均需多轮文库筛选均需多轮操作步骤操作步骤基因文库的构建程序基因文库的构建程序从基因文库中筛选目的基因从基因文库中筛选目的基因密集铺板(密集铺板(1-101-10万)万)杂杂交交挖挖取取铺铺板板铺铺板板目的重组克隆目的重组克隆基因文库的构建程序基因文库的构建程序基因文库构建的技术性问题基因文库构建的技术性问题在基因组在基因组文库的构建过程中,文库的构建过程中,最应引起重
42、视的问题是:最应引起重视的问题是:严禁外源严禁外源DNADNA片段之间的连接!片段之间的连接!为了避免上述情况的发生,为了避免上述情况的发生,可采取下列措施的组合:可采取下列措施的组合:将待连接的将待连接的DNADNA片段根据载体的装载量分级分离片段根据载体的装载量分级分离用碱性磷酸单酯酶除去用碱性磷酸单酯酶除去DNADNA片段的末端磷酸基团片段的末端磷酸基团 用用TdTTdT酶在酶在DNADNA片段的末端上增补同聚尾末端片段的末端上增补同聚尾末端 基因组文库重组克隆的排序基因组文库重组克隆的排序 大型基因文库(包括人的基因文库)的构建在技术上并不大型基因文库(包括人的基因文库)的构建在技术上
43、并不十分困难,如果一个十分困难,如果一个YACYAC基因文库的插入片段总和为整个基因基因文库的插入片段总和为整个基因组的十倍以上时,一般就能从基因文库中调出任何一段组的十倍以上时,一般就能从基因文库中调出任何一段DNADNA序序列。然而基因文库的克隆都是随机序列,必须将所有的克隆排列。然而基因文库的克隆都是随机序列,必须将所有的克隆排列成一个像天然染色体列成一个像天然染色体DNADNA上所表现出的信息顺序。这项工作上所表现出的信息顺序。这项工作的工作量可能远大于基因组文库的构建,属于基因文库的后期的工作量可能远大于基因组文库的构建,属于基因文库的后期制作制作基因组文库重组克隆的排序基因组文库重
44、组克隆的排序 将单一的将单一的YACYAC克隆插入克隆插入DNADNA片段片段用限制性内切酶分布均匀用限制性内切酶分布均匀地水解成若干片段,末端标记同位素地水解成若干片段,末端标记同位素 然后再用然后再用Sau3AISau3AI或或MboIMboI将末端标记的将末端标记的DNADNA片段降解成碎片段降解成碎片,聚丙烯酰胺凝胶电泳,每片,聚丙烯酰胺凝胶电泳,每1010个个YACYAC克隆走在同一块板上,克隆走在同一块板上,形成形成1010个克隆的特征性个克隆的特征性DNADNA指纹图谱指纹图谱 电脑分析指纹图谱,如发现任何两个克隆电脑分析指纹图谱,如发现任何两个克隆DNADNA的指纹图谱的指纹图
45、谱有部分相同的,则其两个有部分相同的,则其两个YACYAC片段就有互相重叠的可能性,于片段就有互相重叠的可能性,于是这两个是这两个YACYAC克隆的克隆的DNADNA片段克隆在染色体上是排列一起的片段克隆在染色体上是排列一起的 酶切片段末端标记法酶切片段末端标记法酶切片段末端标记法酶切片段末端标记法HHHHS S SSSSSSSSSSSSS SSSS单一克隆指纹图谱单一克隆指纹图谱十克隆指纹图谱十克隆指纹图谱载体载体DNADNA克隆克隆DNADNA基因组文库重组克隆的排序基因组文库重组克隆的排序 将若干将若干YACYAC克隆固定在薄膜上,并复制二十份薄膜;合成克隆固定在薄膜上,并复制二十份薄膜
46、;合成2020种不同序列的短探针,其序列是随机的种不同序列的短探针,其序列是随机的 用用2020种探针随机定位杂交(一对一)种探针随机定位杂交(一对一)2020份份YACYAC克隆薄膜克隆薄膜 如果某两个克隆同时对同一种探针呈现杂交阳性反应,则如果某两个克隆同时对同一种探针呈现杂交阳性反应,则这两个克隆有可能是相互重叠的。若将杂交阳性结果记为这两个克隆有可能是相互重叠的。若将杂交阳性结果记为“1 1”,而阴性结果记为,而阴性结果记为“0 0”,可清晰地列成一张表,最终排出上述,可清晰地列成一张表,最终排出上述YACYAC克隆的排列顺序克隆的排列顺序 随机探针联合杂交法随机探针联合杂交法0101
47、0202030304040505060607070808090910101111121213131414151516161717181819192020AA BB CCDD EE FFGG01010202030304040505060607070808090910101111121213131414151516161717181819192020DDAABBCCEEFFGG1111111111111111111111111111111111111111111111111111111111110101040412120606131314140202141407071919111115150505
48、0808161603031010090920201818DDAABBCCEEFFGG111111111111111111111111111111111111111111111111111111111111FFCCAADDGGEEBB基因组文库重组克隆的排序基因组文库重组克隆的排序 从基因文库中任取一个克隆作为染色体走读的起点,将之从基因文库中任取一个克隆作为染色体走读的起点,将之两端序列分别亚克隆两端序列分别亚克隆,亚克隆片段在亚克隆片段在0.5-2.0 0.5-2.0 kbkb范围内范围内 分别以上述亚克隆分别以上述亚克隆DNADNA片段为探针,杂交同一基因文库,片段为探针,杂交同一基因文库
49、,杂交阳性克隆中的插入杂交阳性克隆中的插入DNADNA片段必定与起点克隆所含的片段必定与起点克隆所含的DNADNA片片段连锁在一起段连锁在一起 然后再以阳性克隆片段的两端序列为探针,进行第二步走然后再以阳性克隆片段的两端序列为探针,进行第二步走读,直至线型染色体读,直至线型染色体DNADNA的端点的端点 染色体走读法(染色体走读法(chromosome walkingchromosome walking)染色体走读法(染色体走读法(chromosome walkingchromosome walking)走读的起点克隆片段走读的起点克隆片段亚克隆旁测序列亚克隆旁测序列探针标记探针标记第一轮杂交第一轮杂交阳性克隆阳性克隆阳性克隆阳性克隆第二轮杂交第二轮杂交第二轮杂交第二轮杂交染色体走读法(染色体走读法(chromosome walkingchromosome walking)走读的起点克隆片段走读的起点克隆片段