资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
第一章 基因工程的基本知识
1.1基因工程的概念
狭义的基因工程仅指用体外重组DNA技术去获得新的重组基因; 广义的基因工程则指按人们意愿设计, 经过改造基因或基因组而改变生物的遗传特性。
简单地讲, 基因工程就是改造基因。
1.2几个基本概念
生物工程( biological engineering) : 应用生命科学及工程学的原理, 借助生物体作为反应器或用生物的成分作工具以提供产品来为社会服务的生物技术。
基因工程( genetic engineering) : 将在体外进行修饰、 改造的脱氧核糖核酸分子导入受体细胞中进行复制和表示的技术。
遗传工程: 用人工手段把一种生物的遗传物质转移到另一种生物的细胞中去, 并使这种遗传物质所带的遗传信息在受体细胞中表示的技术。
DNA重组: 发生在DNA分子内或分子间的遗传信息的重新共价组合过程。
杂交育种: 一般指远缘杂交, 或两个遗传上不相关个体间进行繁殖后代的行为。
蛋白质工程( protein engineering) : 在基因工程的基础上, 结合蛋白质结晶学, 计算机辅助设计和蛋白质化学等多学科的基础知识经过对基因的人工定向改造等手段, 对蛋白质进行修饰, 改造和拼接以生产出能满足人类需要的新型蛋白质的技术。
发酵工程: 采用现代工程技术手段, 利用微生物的某些特定功能, 为人类生产有用的产品, 或直接把微生物应用于工业生产过程的一种新技术。
1.3 DNA重组与核酸杂交
DNA重组( DNA recombination) 指DNA分子内或分子间发生的遗传信息的重新共价组合过程。包括同源重组、 特异位点重组和转座重组等类型, 广泛存在于各类生物。体外经过人工DNA重组可获得重组体DNA, 是基因工程中的关键步骤。
核酸杂交( Hybridization) : 互补的核苷酸序列( DNA与DNA、 DNA与RNA、 RNA与RNA等) 经过Watson-Crick碱基配对形成非共价键, 从而形成稳定的同源或异源双链分子的过程, 称核酸杂交。
两者最大的不同是: 核酸杂交是整条核酸链的重组, 而DNA重组还包括核酸片段的重组。DNA重组技术是基因工程的前提和核心。
第二章 基因工程原理
2.1基因改造的可能性
DNA同源重组( 自然重组) :在生物细胞中自发进行, 需要大量的酶类。
DNA体外重组
优点: 微生物操作简单、 易分析、 成本低。
方法: 从头合成
模仿生物细胞中DNA剪切和连接作用, 利用生物酶类在体外进行DNA重组工作。
2.2以限制酶作用为基础的基因工程的原理
DNA限制性内切酶是指生物体内能识别并切割特异的双链DNA序列的一种内切核酸酶。它能够将外来的DNA切断的酶, 即能够限制异源DNA的侵入并使之失去活力, 但对自己的DNA却无损害作用, 这样能够保护细胞原有的遗传信息。由于这种切割作用是在DNA分子内部进行的, 故名限制性内切酶(简称限制酶)。
30多年前, 当人们在对噬菌体的宿主特异性的限制-修饰现象进行研究时, 首次发现了限制性内切酶。细菌能够抵御新病毒的入侵, 而这种"限制"病毒生存的办法则可归功于细胞内部可摧毁外源DNA的限制性内切酶。首批被发现的限制性内切酶包括来源于大肠杆菌的EcoR I和EcoR II, 以及来源于Haemophilus influenzae的Hind II和Hind III。这些酶可在特定位点切开DNA, 产生可体外连接的基因片段。研究者很快发现内切酶是研究基因组成、 功能及表示非常有用的工具。当限制性内切酶的应用在上世纪七十年代流传开来的时候, 以NEB为代表的许多公司开始寻找更多的限制性内切酶。除了某些病毒以外, 限制性内切酶只在原核生物中被发现。人们正在从数以千计的细菌及古细菌中寻找新的限制性内切酶。而对已测序的原核基因组数据分析表明, 限制性内切酶在原核生物中普遍存在--所有自由生存的细菌和古细菌似乎都能编码限制性内切酶。
根据酶的亚单位组成、 识别序列的种类和是否需要辅助因子, 限制与修饰系统至少可分为四类:
Ⅰ 型( type Ⅰ) 限制与修饰系统的种类很少, 只占 1% , 如 EcoK 和 EcoB 。其限制酶和甲基化酶 ( 即 R 亚基和 M 亚基) 各作为一个亚基存在于酶分子中, 另外还有负责识别 DNA 序列的 S 亚基, 分别由 hsdR 、 hsdM 和 hsdS 基因编码, 属于同一操纵子( 转录单位) 。EcoK 编码基因的结构为 R2M2S 。 EcoB 编码基因的结构为 R2M4S2 。
Ⅱ 型( type Ⅱ) 限制与修饰系统所占的比例最大, 达 93%。Ⅱ 型酶相对来说最简单, 它们识别回文对称序列, 在回文序列内部或附近切割 DNA , 产生带 3'- 羟基和 5'- 磷酸基团的 DNA 产物, 需 Mg2+ 的存在才能发挥活性, 相应的修饰酶只需 SAM 。识别序列主要为 4-6bp, 或更长且呈二重对称的特殊序列, 但有少数酶识别更长的序列或简并序列, 切割位置因酶而异, 有些是隔开的。
Ⅱs 型( type Ⅱs) 限制与修饰系统, 占 5%, 与 Ⅱ 型具有相似的辅因子要求, 但识别位点是非对称, 也是非间断的, 长度为 4-7bp, 切割位点可能在识别位点一侧的 20bp 范围内。
Ⅱ 型限制酶一般是同源二聚体( homodimer) , 由两个彼此按相反方向结合在一起的相同亚单位组成, 每个亚单位作用在 DNA 链的两个互补位点上。修饰酶是单体, 修饰作用一般由两个甲基转移酶来完成, 分别作用于其中一条链, 但甲基化的碱基在两条链上是不同的。在 Ⅱ 型限制酶中还有一类特殊的类型, 该酶只切割双链 DNA 中的一条链, 造成一个切口, 这类限制酶也称切口酶 ( nicking enzyme) , 如 N.Bst NBI 。
Ⅲ 型( type Ⅲ) 限制与修饰系统的种类更少, 所占比例不到 1%, 如 EcoP1 和 EcoP15。它们的识别位点分别是 AGACC 和 CAGCAG , 切割位点则在下游 24-26bp 处。
在基因操作中, 一般所说的限制酶或修饰酶, 除非特指, 均指 Ⅱ 型系统中的种类。
限制酶识别序列的长度一般为 4-8 个碱基, 最常见的为 6 个碱基。当识别序列为 4 个和 6 个碱基时, 它们可识别的序列在完全随机的情况下, 平均每 256 个和 4096 个碱基中会出现一个识别位点( 4^4=256, 4^6=4096) 。以下是几个有代表性的种类, 箭头指切割位置。
4 个碱基识别位点: Sau3AⅠ ↓GATC
5 个碱基识别位点: EcoRⅡ ↓CCWGG
限制酶识别的序列大多数为回文对称结构, 切割位点在 DNA 两条链相对称的位置。 EcoRⅠ 和 HindⅢ 的识别序列和切割位置如下。
EcoRⅠ G↓AATTC HindⅢ A↓AGCTT
CTTAA↑G TTCGA↑A
识别位点为回文对称结构的序列经限制酶切割后, 产生的末端为匹配粘端, 亦即粘性末端( cohesive end) , 这样形成的两个末端是相同的, 也是互补的。若在对称轴 5' 侧切割底物, DNA 双链交错断开产生 5' 突出粘性末端, 如 EcoRⅠ ; 若在 3'-侧切割, 则产生 3' 突出粘性末端, 如 KpnⅠ
NNG↓AATTCNN EcoRⅠ NNG AATTCNN
NNCTTAA↑GNN NNCTTAA GNN
用同一限制酶切割两条不同的DNA链, 它们会产生相同的粘性末端, 利用基因工程的另一种重要的工具酶——DNA连接酶能够能够将链条残链相连。这样, 利用一种或多种限制性内切酶能够获得目的基因, 并可将其连接到载体上。
第三章 目的基因
3.1目的基因的概念
在基因工程上把重组到受体的基因称为目的基因( target) 。
3.2目的基因的来源
( 一) 从细胞核中直接分离
简单的原核生物目的基因可从细胞核中直接分离得到, 但人类的基因分布在23对染色体上, 较难从直接法中得到。
直接分离基因最常见的方法是”鸟枪法”, 又叫”散弹射击法”。这种方法有如用猎枪发射的散弹打鸟, 无论哪一颗弹粒击中目标, 都能把鸟打下来。鸟枪法的具体做法是: 用限制酶( 即限制性内切酶) 将供体细胞中的DNA切成许多片段, 将这些片段分别载入运载体, 然后经过运载体分别转入不同的受体细胞, 让供体细胞所提供的DNA( 外源DNA) 的所有片段分别在受体细胞中大量复制( 在遗传学中叫做扩增) , 从中找出含有目的基因的细胞, 再用一定的方法把带有目的基因的DNA片段分离出来。如许多抗虫, 抗病毒的基因都能够用上述方法获得。
用”鸟枪法”获取目的基因的优点是操作简便, 缺点是工作量大, 具有一定的盲目性。( 二) 染色体DNA的限制性内切酶酶解
II型限制性内切酶可专一性地识别并切割特定的DNA顺序, 产生不同类型的DNA末端。若载体DNA与插入的DNA片段用同一种内切酶消化, 或靶DNA与载体DNA末端具有互补的粘性末端, 能够直接进行连接。
( 三) 人工体外合成
简短的目的基因可在了解DNA一级结构或多肽链一级结构氨基酸编码的核苷酸序列的基础上人工合成。
( 四) 用逆转录酶制备cDNA
大多数的目的基因是由mRNA合成cDNA( 反转录DNA) 得到。从RNA入手, 先从细胞提取总RNA, 然后根据大多数真核mRNA含有多聚腺嘌呤( polyadenylic acid ,polyA) 尾的特点, 用寡聚dT纤维素柱将mRNA分离出, 以mRNA为模板, 在多聚A尾上结合12-18个dT的寡聚dT片段, 作为合适的起始引物, 在逆转录酶作用下合成第一条 图10-39 目的
( 五) 从基因文库中获取
依据: 基因的核苷酸序列, 功能, 在染色体中的位置, 转录产物mRNA, 翻译产物蛋白质性质。
( 六) PCR技术扩增
第四章 载体
4.1载体的来源
天然载体: 包括细菌细胞质的质粒, 噬菌体或某些病毒。
人工载体: 利用基因工程手段对天然载体进行改造, 使其满足操作要求。当前使用的载体几乎全部是人工载体。
4.2载体的要求
①在宿主细胞中能保存下来并能大量复制;
②有多个限制酶切点, 而且每种酶的切点最好只有一个, 如大肠杆菌pBR322就有多种限制酶的单一识别位点, 可适于多种限制酶切割的DNA插入;
③ 含有复制起始位点, 能够独立复制;
④有一定的标记基因, 便于进行筛选。
大肠杆菌的pBR322质粒携带氨苄青霉素坑性基因和四环素抗性基因, 就能够作为筛选的标记基因。原理是插入失活法, 筛选方法是复制平板筛选。
β-半乳糖苷酶筛选系统: 载体上带有一个来自大肠杆菌的lac操纵子的DNA区段, 这一区段编码β-半乳糖苷酶氨基端的一个蛋白片段。IPTG(异丙基-β-D-硫代半乳糖苷)能够诱导该片段的合成, 而该片段能与宿主细胞所编码的β-半乳糖苷酶羧基端的一个蛋白片段互补(α-互补)。故暴露于诱导物IPTG的细菌含有编码lacZ的质粒可同时合成该酶的两种片段, 该菌在其生色底物X-gal(5-溴-4-氯-3-吲哚-β-半乳糖苷)的培养基上生长, 将形成蓝色茵落。将一连串克隆位点克隆入β-半乳糖苷酶氨基端的基因中, 外源DNA插入质粒的多克隆位点后可使β-半乳糖苷酶的氨基端片段灭活, 从而破坏了α-互补作用。因此, 带有重组质粒的细菌将产生白色菌落。利用这种筛选方法可方便地将含目的基因的重组子从空载体中筛选出来。
4.3载体的选择
4.3.1质粒载体
质粒广泛地分布于原核生物细胞中, 也存在于某些真核细胞, 质粒DNA分子量范围为1—200×106Da。
组建理想质粒载体必须具备的条件有: 拷贝数较高, 分子量较小, 带有可供选择的标
记, 带有尽可能多的单一限制性酶切位点, 具有复制起始点(origin, ori)。
常见的质粒载体有
pUC质粒载体: (1)来自pBR322质粒的复制起点(ori); (2)氨卞青霉素抗性基因(Ampr), 但它的DNA核苷酸序列已经发生了变化, 不再含有原来的限制酶的单识别位点; (3)大肠杆菌β-半乳糖苷酶(lacZ)的启动子及其编码该基因氨基端α-肽链的DNA序列,此结构特称为lacZ1基因; (4)多克隆位点(MCS)区段: 位于lacZ 基因中的靠近5’端, 内含十几个单一的限制性内切酶识别切割位点, 使含有不同粘端的目的DNA片段可方便地定向插入载体中。但它并不破坏lacZ 基因的功能。
pGEM系列质粒载体: 总长度为2743bp, 含有一个氨卞青霉素抗性编码基因和一个lacZ’编码基因, 一段含有EcoR I、 Sat I、 Kpn I、 Ava I、 Sma I、 BamH I、 XbaI、 Sall、 AccI、 Hinc I、 Pst II、 Sph I和Hind II等识别序列的多克隆位点, 此序列结构几乎与pUC18克隆载体的完全一样。pGEM具有两个来自噬菌体的启动子, 即T7启动子和SP6启动子, 它们为RNA聚合酶的附着作用提供了特异性的识别位点。由于这两个启动子分别位于Lac z’基因中多克隆位点区的两侧, 故若在反应体系中加入纯化的识别T7或SP6启动子的RNA聚合酶, 便可将已克隆的外源基因在体外转录出相应的mRNA。
4.3.2噬菌体载体
λ噬菌体是感染大肠杆菌的溶源性噬菌体, 在感染宿主后可进入溶源状态, 也可进入裂解循环。基因组长48502bp, DNA是线状双链分子带有单链的互补末端, 末端长12个核苷酸, 称为粘性末端, 简写cos, 12个碱基的序列为5'-GGGCGGCGACCT-3'。当噬菌体感染宿主细胞后, 双链DNA分子经过cos而成环状。
基因组分为几个不连续的区域, 三个片段组成
λ噬菌体载体: 野生型噬菌体具有大而复杂的基因组, 必须经过改造才能用作载体: ①现在用的λ载体大都减少或增加某些限制性内切酶的酶切位点: 野生型有65种限制酶酶切点, 除ApaⅠ、 NaeⅠ、 NarⅠ、 NheⅠ、 Sna BⅠ、 XbaⅠ和XhoⅠ等7种限制酶各有一个切点外, 其余都多于2个。有些酶切点在λ增殖所必须的基因区域内。②将λ噬菌体的非必须区做部分切除③插入了某种报告基因。
4.3.2柯斯质粒
1978年Collins和Hohn构建一种新型的大肠杆菌克隆载体, 命名为cosmid(柯斯质粒), 又叫粘粒。柯斯质粒( cosmid) = cos序列+质粒。它的大小一般 5-7kb 左右, 用来克隆大片段 DNA 克隆的最大 DNA 片段可达45kb①质粒复制起点( colE1) 象质粒一样转化和增殖②抗性标记ampr③ cos位点④有的粘粒载体含有两个cos位点。
柯斯质粒优越性① 能象λ-DNA一样体外包装, 并高效导入受体细胞; ②能够装载比质粒或λ-DNA大得多的外源DNA片段, 如cos区及附近顺序长为1.7 kb, 质粒长为3.3kb, 则该柯斯质粒最大可装载46.5kb的外源DNA; ③ 由于携带质粒的选择标记, 便于筛选; ④ 由于质粒上的多种单一酶切位点, 便于克隆。
4.3.3 M13 噬菌体载体
M13噬菌体是单链DNA噬菌体( 一类丝状的大肠杆菌噬菌体, 由单链环状DNA分子外面包裹上一层蛋白质外壳而成) 。
M13噬菌体作为载体具有几个重要的特点: ①M13噬菌体的感染与释放不会杀死宿主菌, 仅导致宿主菌生长缓慢; ②M13噬菌体DNA在宿主菌内既能够是单链也能够是双链, 经过感染或转化的方法能将M13噬菌体DNA导人宿主菌中; ③M13噬菌体的包装不受DNA大小的限制, 其噬菌体颗粒的大小可随DNA的大小而改变, 即使DNA的大小比本身DNA的大小超出6倍, 仍能进行包装。④M13噬菌体在用作载体时是利用其双链状态的RF DNA: 单链DNA的酶切和连接是比较困难的。⑤外源片段插入位点在基因Ⅱ和基因Ⅳ之间的508bp间隔区----M13不像λ噬菌体基因组那样含有较大的可替代区。它的基因组中绝大多数为必须基因, 只有两个间隔区可用来插入外源DNA( 基因Ⅱ/Ⅳ和基因Ⅷ/Ⅲ之间) 。
4.3.4动物基因工程载体
质粒和噬菌体载体只能在细菌中繁殖, 不能满足真核DNA重组需要。感染动物的病毒可改造用作动物细胞的载体。由于动物细胞的培养和操作较复杂、 花费也较多, 因而病毒载体构建时一般都把细菌质粒复制起始序列放置其中。使载体及其携带的外来序列能方便地在细菌中繁殖和克隆, 然后再引入真核细胞。当前病毒载体常见者有改造来自猴肾病毒SV40( Simian Virus 40) 、 逆转录病毒和昆虫杆状病毒等, 使用这些病毒载体的目的多为将目的基因或序列放入动物细胞中表示或作基因治疗等。
反转录病毒载体
反转录病毒载体是常见的病毒载体之一。反转录病毒的DNA基因组的两端各有一个长末端重复序列(5'—LTR和3'—LTR), 有一个包装病毒颗粒时必须的非编码序列ψ+, 同时有三个编码蛋白质的基因gag、 pol和env。反转录病毒载体能够容纳外源DNA的长度在10 kb左右, 以很高的转染率感染宿主细胞, 特别是分裂中的细胞。转入宿主的细胞后, 反转录病毒载体随即整合到宿主细胞基因组内, 这种整合的位点是随机的。反转录病毒载体在构建时, 删去了poi、 env基因和gag基因的3’端, 但保留了病毒颗粒所需的ψ+序列。其目的是在于提高载体的安全性, 防止反转录病毒进入宿主细胞后进行增殖并包装成病毒颗粒对宿主细胞造成可能的伤害。这样, 在制备反转录病毒载体时, 就必须有一个辅助细胞系, 这种细胞内有缺陷型病毒能够提供包装用的外壳蛋白, 但自身没有包装信号。这样, 反转录病毒载体就可利用这些外壳蛋白包装成病毒颗粒在辅助细胞系内大量扩增。
腺病毒载体
腺病毒是线状双链DNA病毒, 基因组中有14个基因。共同特点是都带有倒置的末端重复( ITR) , 在病毒的复制过程中起非常重要的作用。
腺病毒载体的构建: 用同源重组的方法插入外源基因。①删除腺病毒DNA一些非必须区。如E1或E3区, 增加插入能力。②构建质粒载体。含有E1或E3区两侧的同源序列, 并在同源序列之间插入外源基因和选择标记基因。③把质粒切成线性④共同转染细胞。在细胞中发生同源重组, 把外源DNA加到病毒基因组中, 并包装成重组病毒颗粒。
重组腺病毒DNA在细胞中的生存: 以游离的附加体形式存在于细胞中。不能整合到细胞基因组中。基因表示时间短。E1是腺病毒繁殖的必须区。缺失E1的重组腺病毒必须在已经被腺病毒( 辅助病毒) 感染的细胞中繁殖。E3区对腺病毒的繁殖不是必须的。缺失E3的重组腺病毒不需要辅助病毒。
腺病毒的优点: 比较安全, 无致病、 致癌、 致畸作用。宿主范围广: 不但能感染有分裂能力的细胞, 也能感染不能分裂的细胞( 如神经细胞) 。能够在呼吸道和肠道中繁殖, 能够经过口服或喷雾的方式感染。载体中的插入片断可达7.5kb ( 有包装容量限制) 。腺病毒容易制备、 纯化。基因组结构和功能了解得清楚。
4.3.5植物基因工程载体
用人工的方法, 从不同生物中提取外源基因片段及载体DNA, 经过体外切割、 拼接和重组, 然后采取某种方法, 把重组后的带有外源基因的载体DNA引入植物细胞, 并使其在植物细胞内进行复制和表示, 以达到预期的改变受体植物细胞遗传特性的目的.此种过程即称为植物基因工程。当前使用的植物基因工程载体多是植物病毒。
Ti质粒 Ti plasmid 为植物根癌土壤杆菌( Agrobactertium tumef-aciens) 菌株中存在的质粒, 其特定部位与植物核内DNA组合来表示信息, 使植物细胞肿瘤化。即此质粒既有在细菌中表示的基因, 又有在高等植物中表示的基因, 这是很独特的。
当前已从动物、 植物、 病毒及微生物中分离到许多适用于植物的启动子。根据作用方式及功能可将启动子分为3 类: 组成型启动子、 诱导型启动子和组织特异型启动子。诱导型启动子是能被诱导表示的基因启动子。该启动子能被诱导物直接激活, 或诱导物与启动子上的阻遏物结合, 从而间接激活该启动子的转录。阻遏型启动子系统建立在阻遏蛋白与转录因子在空间构型相互作用的基础之上。当诱导物不存在时, 激活蛋白与阻遏蛋白结 合, 基因正常转录; 添加诱导物后, 诱导物与激活蛋白结合或阻止其与阻遏蛋白结合, 阻遏蛋白则与启动子上的某些顺式作用元件结合, 抑制 基因转录, 如以四环素抑制子为基础的四环素抑制系统(tTA)。Love等用包含四环素抑制子的启动子Topl0与报告基因GFP相连转化拟南芥, 发现 用100 ng/mL的四环素即可抑制GFP的表示, 而且改变培养基中四环素的浓度, 可调节GFP的表示水平。在抑制型启动子系统中, 抑制基因转录所需诱导物的量往往超出植物适应的范围, 而且在真核生物中激活基因比 抑制基因转录更容易, 近年发展了一些激活型启动子系统, 如地塞米松诱导的GR系统、 雌二醇诱导的ER系统、 杀虫剂诱导的EcR系统等。激活型 启动子系统的优点是只有当诱导物存在时才能启动基因表示, 去除诱导物后, 基因表示很快被关闭, 这样就能够人为地精确、 快速控制基因的表示。
4.3.6 人工染色体
人工染色体(英文: artificial chromosome)指人工构建的含有天然染色体基本功能单位的载体系统。包括酵母人工染色体( YAC) 、 细菌人工染色体( BAC) 、 P1派生人工染色体( PAC) 、 哺乳动物人工染色体( MAC) 和人类游离人工染色体( HAEC) 。人工染色体为基因组图谱制作、 基因分离以及基因组序列分析提供了有用的工具。
酵母人工染色体( Yeast artificial chromosomes YACs) YAC 人工染色体载体是利用酿酒酵母的染色体的复制元件构建的载体, 其工作环境也是在酿酒酵母中。YAC 载体为能够满足自主复制、 染色体在子代细胞间的分离及保持染色体稳定的需要, 必须含有端粒重复序列、 着丝粒、 自主复制序列、 标记基因等原件。YAC 载体主要是用来构建大片段 DNA 文库, 特别用来构建高等真核生物的基因组文库, 并不用作常规的基因克隆。
细菌人工染色体( BAC)是以细菌F因子为基础构建的细菌克隆载体。BAC克隆容量能够达300kb, 能够经过电穿孔导入细菌细胞。拷贝数低, 进入细菌后形成超螺旋比较稳定, 其核酸比细菌大得多固易分离。
第五章 宿主( 受体、 对象)
5.1基因工程的对象
带有目的基因的载体导入细菌或动植物细胞中, 目的基因进行克隆和表示, 可是不改变接受体的生命本质。我们把接受体称为目的基因受体或宿主。
5.2 作为宿主的条件
生物学背景清晰, 需了解宿主的遗传特性、 基因表示调节机制等等。
容易操作、 成本低, 便于大规模工业化生产。
具有分泌系统和蛋白后加工修饰体系。
5.3大肠杆菌表示系统
大肠杆菌是一种革兰氏阴性细菌, 其遗传背景清楚, 目标基因表示的水平高, 培养周期短。当前大多数外源基因都是以大肠杆菌为受体系统进行表示的, 是当前应用最广泛的基因表示系统。
5.3.1与其它表示系统相比, 大肠杆菌表示系统所具有的优越性:
①经过长期研究, 人们已经掌握了十分丰富的有关大肠杆菌基础生物学、 遗传学以及分子生物学等方面的背景知识, 特别是对其基因表示调控的分子机理有了深刻的了解;
②大肠杆菌已被发展成为一种安全的基因工程实验体系, 拥有各类适用的寄主菌株和不同类型的载体系列;
③实验已经证明, 许多克隆的真核基因, 例如抑制生长素基因和胰岛素基因等, 都能够在大肠杆菌细胞中实现有效的、 高水平的表示;
④大肠杆菌培养方便、 操作简单、 成本低廉, 易于进行工业化批量生产。
5.3.2大肠杆菌基因表示载体可分为3个系统:
( 1) DNA复制及重组载体的选择系统
复制子:大肠杆菌基因表示载体一般是质粒表示载体, 含有能在大肠杆菌中有效复制的复制子。
选择标记:目的使转化体产生新的表型, 将转化了的细胞从大量的菌群中分离出来。
在基因克隆中采用的质粒载体的选择标记记号, 包括有新陈代谢特性、 对大肠杆菌素E1的免疫性, 以及抗菌素抗性等多种。而绝大多数的质粒载体都是使用抗菌素抗性记号, 而且主要集中在氨苄青霉素抗性、 四环素抗性、 链霉素抗性、 氯霉素抗性以及卡那霉素抗性等少数几种抗菌素抗性记号上。其原因一方面是由于许多质粒本身就是带有抗菌素抗性基因的抗药性R因子; 另一方面则是因为抗菌素抗性记号具有便于操作、 易于选择等优点。
( 2) 外源目的基因的转录系统
这一系统包括启动子、 抑制物基因和转录终止子。
启动子和终止子因宿主的不同而有差别, 往往在不同的宿主中表示的效率也不一样, 特别是原核生物和真核生物宿主间完全不同, 相互间不能通用。
启动子( promotor) : 是一段能被宿主RNA聚合酶特异性识别和结合并指导目的基因转录的DNA序列, 是基因表示调控的重要元件。外源目的基因转录的起始是基因表示的关键步骤。选择可调控的强启动子是构建一个理想的表示系统首先要考虑的问题。
启动子位于基因的上游, 其序列的长度因生物的种类而异。当RNA聚合酶定位并结合到启动子序列上时, 便可启动基因的转录。启动子具有序列特异性、 启动的方向性、 作用位点的特异性和种属特异性等特征。在大肠杆菌细胞中大多数基因的启动子与转录起始位点间的距离为6~9bp, 但对于要表示的外源基因来说, 启动子与转录起始位点的最佳距离还有待实验来确定。
外源基因在强启动子的控制下容易发生转录过头的现象, 形成长短不一的mRNA混合物, 而过长的转录产物不但会影响到mRNA的翻译效率, 同时也会使外源基因的转录速度大大降低。因此, 在构建表示载体的时候一般采用强的启动子和强的终止子, 以达到高效表示的目的。
抑制物基因的产物是一种控制启动子功能的蛋白质, 对启动子的起始转录功能产生抑制作用。在适当的诱导条件下可使抑制物失活, 启动子功能重新恢复。
经过抑制物基因产物可使目的基因在宿主培养到最佳状态时进行转录, 从而保证转录的有效进行, 特别是表示产物对宿主有害时, 控制转录的时机特别重要。理想的可调控的启动子在细胞生长的初期往往不表示或低水平表示, 而当细胞增殖到一定的密度后, 在某种特定的诱导因子( 如光、 温度或化学药物等) 的诱导下, RNA聚合酶才开始启动转录, 合成mRNA。
转录终止子( terminator) : 是一段终止RNA聚合酶转录的DNA序列。转录终止子可分为本征终止子和依赖终止信号的终止子两类。
转录终止子的功能不同于启动子, 但它对基因的正常表示同样有着重要的意义。一方面, 它使转录在目的基因之后立即停止, 避免多余的转录以节省宿主内RNA的合成底物, 提高目的基因的转录量; 另一方面, 正常转录终止子的存在能够防止产生不必要的转录产物, 有效地控制目的基因mRNA的长度, 提高mRNA的稳定性, 避免质粒上其它基因的异常表示。
( 3) 蛋白质的翻译系统
在原核生物中影响翻译起始的因素有: 起始密码子、 核糖体结合位点( SD序列) 、 起始密码子于SD序列之间的距离和碱基组成、 mRNA的二级结构、 mRNA上游的5′端非翻译序列和蛋白编码区的5′端序列等。
核糖体结合位点: 是指原核基因转录起始位点下游的一段DNA序列, 即Shine-Dalgarno序列( 简称SD序列) 。SD序列与核糖体16S rRNA特异配对而与宿主核糖体结合, 它对mRNA的翻译起着决定性的作用。核糖体与mRNA的结合程度越强, 翻译的起始效率越高, 而核糖体与mRNA 的结合程度主要取决于SD序列与核糖体16S rRNA碱基的互补性, 因此, 在构建表示载体时, 要尽可能使SD序列与16S rRNA序列互补配对。
影响mRNA翻译效率的因素: 包括SD序列、 翻译的起始密码子和SD序列与翻译起始密码子之间的距离和碱基组成等。
大肠杆菌SD序列的碱基组成为5 ′AGGAGG 3 ′,其中以GGAG四个碱基最为重要, 这四个碱基中的任何一个发生突变都会引起翻译效率的大幅度下降。
SD序列与起始密码子之间的距离对保证准确和高效翻译也很重要。SD序列与起始密码子之间的距离一般为6~8bp, 多数情况下为7bp, 此间的碱基多一个或少一个都会影响翻译的起始效率。
SD序列与起始密码子之间的碱基组成也影响翻译的起始效率。研究表明, SD序列后面的碱基为AAAA或UUUU时, 翻译的起始效率最高, 而当序列为CCCC或GGGG时, 翻译的起始效率分别为最高值的50%和25%。有的载体的启动子后接有SD序列, 而另一些载体的启动子后没有接SD序列, 那么则需要目的基因上游带进SD序列。若在大肠杆菌中表示真核基因或本身所含核糖体结合位点较弱的原核基因, 则必须从外部同时提供启动子和有效的核糖体结位点。
起始密码子是翻译的起始位点, 一般为AUG( ATG) , 编码甲硫氨酸( MET) , 是首选的起始密码子。也有极少数生物利用其它密码子作为翻译的起始位点, 如GUG、 UUG等。
翻译终止密码子翻译终止密码子与核糖体相遇时, 能使核糖体从mRNA模板上脱落下来, 终止蛋白质的翻译过程。在大肠杆菌中, 合成多肽链的释放由RF1和RF2两个释放因子所调控, RF1识别终止密码UAA和UAG, 而RF2识别终止密码UAA和UGA, 由于UAA同时为两个释放因子所识别, 一般被选作翻译的终止密码。在实际应用中, 为了保证翻译的有效终止, 一般将几个终止密码串连在一起。具报道, 在大肠杆菌中以四个核苷酸组成的顺式序列UAAU作为终止密码, 可有效地终止多肽链的合成。不同生物基因组甚至是同种生物不同蛋白质的基因, 所用的密码子都具有一定的选择性。有的密码子在一种基因组中使用的频率高, 被称为主密码子, 而在另一种基因组中使用的频率较低, 被称为罕用密码子。
如果外源目的基因mRNA的主密码子和受体细胞基因组的主密码子相同或接近, 则该基因的表示效率就高; 反之, 若外源基因含有较多的罕用密码子, 其表示水平就低。因此, 在构建大肠杆菌表示载体时, 要考虑所表示基因的种类和性质, 或对外源基因的碱基进行适当置换, 或对克隆载体上的调控序列进行适当的调整。
5.3.3宿主菌
重组异源蛋白在大肠杆菌中不稳定的原因:
大肠杆菌缺乏复杂的翻译后加工和蛋白质折叠系统; 大肠杆菌不具备类似真核细胞的亚细胞结构和表示产物稳定因子; 大量的异源重组蛋白在大肠杆菌细胞中形成高浓度的微环境, 导致蛋白质分子之间的作用增强。
5.3.4外源基因在大肠杆菌表示的形式
包涵体蛋白: 包涵体是指在一定条件下, 外源基因的表示产物在大肠杆菌中积累并致密地集中在一起形成无膜的裸露结构, 这种结构称为包涵体。
融合蛋白是将外源蛋白基因与受体菌自身蛋白基因重组在一起, 但不改变两个基因的阅读框, 以这种方式表示的蛋白称为融合蛋白。
融合蛋白与单独表示的外源蛋白相比具有以下优点: ①稳定性好; ②表示效率高; ③较易于分离纯化。
寡聚型外源蛋白: 在构建外源蛋白表示载体时, 将多个外源目的蛋白基因串连在一起, 克隆在质粒载体上, 以这种方式表示的外源蛋白称为寡聚型外源蛋白。
整合型外源蛋白: 将要表示的外源基因整合到染色体的非必须编码区上, 使之成为染色体结构的一部分而稳定地遗传, 以此种方式表示的外源蛋白即为整合型外源蛋白。
分泌型外源蛋白: 外源基因的表示产物, 经过运输或分泌的方式穿过细胞的外膜进入培养基中, 即为分泌型外源蛋白。
5.3.5高效表示外源基因须考虑的基本原则
优化表示载体的设计;提高稀有密码子tRNA的表示作用;提高外源基因mRNA的稳定性;
提高外源基因表示产物的稳定性;优化发酵过程。
5.4 酵母表示系统
酵母yeast是一类以芽殖或裂殖进行无性繁殖的单细胞真核生物, 是外源基因最理想的真核生物基因表示系统。
酵母菌的特点: 基因表示调控的机制比较清楚, 遗传操作相对简便, 并于1996年完成了对酿酒酵母基因组全序列的测定; 具有原核生物所不具备的蛋白质翻译后加工和修饰系统; 可将外源基因表示产物分泌到培养基中; 对人体和环境安全, 不含毒素和特异性病毒;
可进行大规模的发酵, 工艺简单而成熟, 成本低廉。
5.4.1 酵母基因表示载体
酵母克隆和表示载体是由酵母野生型质粒、 原核生物质粒载体上的功能基因( 如抗性基因、 复制子等) 和宿主染色体DNA上自主复制子结构( ARS) 、 中心粒序列( CEN) 、 端粒序列( TEL) 等一起构建而成。酵母基因表示系统的载体一般是一种穿梭质粒, 能在酵母菌和大肠杆菌中进行复制。
DNA复制起始区 在大肠杆菌中复制的复制起始序列 在酵母菌中引导进行自主复制的序列
选择标记包括营养缺陷型选择标记: 它与宿主的基因型有关。显性选择标记: 可用于各种类型的宿主细胞, 并提供直观的选择标记。
表示盒由启动子、 分泌信号序列和终止子等组成, 是酵母表示载体的重要元件。
启动子的长度一般在1~2kb, 其上游含各种调控序列( 如上游激活序列、 上游阻遏序列、 组成型启动子序列等) , 下游存在转录的起始位点和TATA序列( TATA序列可被质转录因子蛋白识别、 结合并形成转录起始复合物) 。一般在构建表示载体时须组入强启动子, 如酵母磷酸甘油酯激酶( PGK) 基因启动子、 甘油醛磷酸脱氢酶( GAPDH) 基因启动子等。
分泌信号序列是前体蛋白N端一段长为17~30个氨基酸残基的分泌信号肽编码区, 主要功能是引导分泌蛋白从细胞内转移到细胞外, 并对蛋白质翻译后的加工起重要作用。常见的分泌信号序列有: α因子前导肽序列、 蔗糖酶信号肽序列、 酸性磷酸酯酶信号肽序列等。
终止子序列相对较短, 是决定酵母中mRNA3′端稳定性的重要结构。与高等真核生物类似, mRNA的3 ′端需经过前体mRNA的加工和多聚腺苷化反应。
5.4.2 酵母基因表示载体的种类
自主复制型质粒载体( yeast replicating plasmid, YRP)
该载体含有酵母基因组的DNA复制起始区、 选择标记和基因克隆位点等元件, 能够在酵母细胞中进行自我复制。在酵母细胞中的转化效率较高, 每个细胞中的拷贝数可达200个, 但经过多代培养后, 子细胞中的拷贝数会迅速减少。
整合型质粒载体( yeast integration plasmid, YIP)
整合型质粒载体不含酵母DNA复制起始区, 不能在酵母中进行自主复制, 但含有整合
展开阅读全文