资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
策划生物催化的第三次浪潮
来源: 生物谷 日期: 09月13日
生物催化是在合成化学中应用酶和微生物, 将天然催化剂用于酶尚未进化到的新目的。经过几次技术研究和创新浪潮, 生物催化领域现被证明已经达到了工业化水平。
第一次生物催化浪潮始于一个多世纪前, 科学家意识到活体细胞的某些成分能够用于有用的化学转化( 与此不同的是, 发酵过程早已经成为常事上千年了) 。比如, Rosenthaler使用从植物中提取的苯甲醛和氢氰酸合成了(R)-苯乙醇腈( 维生素B17的有效成分之一) , 人们也已经知道微生物体内进行着甾体的羟基化反应。更近的例子是, 蛋白酶被用于洗衣液中, 葡萄糖异构酶被用于将葡萄糖转化为更甜的果糖, 盘尼西林G酰基转移酶被用于生产半合成抗生素。这些应用主要面临的挑战在于生物催化剂有限的稳定性, 但这些缺陷首先由酶的固定化得以克服, 该方法还易化了酶的重复利用。
第二次生物催化浪潮介于二十世纪八十至九十年代, 最初的蛋白质工程技术, 典型的是基于结构的, 拓宽了酶的底物范围从而能够合成非常见的合成中间物上。这一改变使得生物催化扩展至药物中间体和精细化学生产领域。这方面的例子包括: 脂肪酶催化拆分手性前体用于合成地尔硫卓( 一种降压药) 的手性前体, 醇腈裂解酶催化合成除草剂的中间体, 羰基还原酶催化合成纯化对映体醇用于生产降低胆固醇的沙汀类药物, 脂肪酶催化合成酯化腊, 如化妆品的添加物肉豆蔻醇肉豆蔻酸酯或鲸蜡醇蓖麻油酸酯, 腈水合酶( 提取自玫瑰红红球菌) 催化丙烯腈水合生成丙烯酰胺用于形成聚合物。除了酶的固定化, 现有的挑战还包括为非天然底物优化生物催化剂。
现在这第三次生物催化浪潮始于Pim Stemmer和Frances Arnold在二十世纪九十年代中后期的工作。她们开创性地借助分子生物学的方法经过体外版的达尔文进化快速而广泛的改变生物催化剂。现在这种方法一般被称为定向进化, 尽管该词从1972年的全细胞实验后一直在使用。这项技术最开始的做法包括: 将蛋白质中氨基酸的随机突变经过重复循环累积起来, 然后选择或筛选所得到的文库, 最终得到稳定性更高、 底物更专一、 手性选择性更好的变体。我们在此讨论的接下来的改进将注意力集中在了提高定向进化的效率上, 它们力求创造出更聪明的文库。工业规模的生物催化过程主要涉及到水解酶、 少量酮还原酶、 辅助因子的再生和蛋白质在有机溶剂中保持稳定。在一些实例中, 代谢通路被优化。比如, 将各种各样的天然菌种的基因结合后在新的宿主中生产1,3-丙二醇( 聚酯纤维单体) , 这使得将给料从丙三醇变为更方便获得的葡萄糖成为可能。
由于当前这次生物催化浪潮所取得的进展, 现在我们已经能够改造酶使其获得不同寻常的新的能力, 比如接受先前为无效的底物( 一种用于合成孟鲁司特的KRED, 或者一种用于合成西她列汀的转氨酶) 或者改变形成的产物的性质( 适合不同萜的萜环化酶变体或氨基酸代谢生产作为生物燃料的乙醇) 。今天, 我们还需要新的酶用于将生物质能转化为第二和第三代生物燃料、 材料和化学制品。使这第三次浪潮成为可能的关键的发展有: 高级蛋白质工程( 包括定向进化) , 基因合成, 序列分析, 生物信息学工具和电脑建模以及观念的进步( 现在认为, 酶的改进程度能够比之前所预计的更显着) 。改造后的酶能够在含有有机溶剂的60摄氏度的溶液中保持稳定, 能够接受新的底物, 并能够催化新的非天然反应。这种改造可能现在只需耗时几个月, 因此极大地扩展了潜在的应用。在过去, 是围绕酶的缺陷来设计基于酶的流程, 而现在, 酶被人为改造以适合流程规范。
大约 前, 《自然》和《科学》上的文章回顾了第一和第二波生物催化浪潮并给第三次浪潮可能会带来什么以一窥。现在, 正是评估这第三次浪潮所产生的影响并猜测下一个十年可能会带来什么的时候。尽管生物催化涉及代谢工程和合成生物学, 本综述主要集中于酶和全细胞反应。
改造酶以适合生产流程
为了使成本最小化, 化学生产需要稳定的, 有选择性的, 以及富有成效的催化剂, 而且这种催化剂要在人们希望的流程条件下运作。要为这样一种流程改造酶, 首先要定义设计目标, 如增加稳定性, 选择性, 底物范围, 或典型地, 是它们的组合。在 , 第三次浪潮之前, 只有少数可用的策略来实现这些目标。酶的固定化能够增加蛋白质的稳定性, 可是这只是适度地增加了稳定性, 对大多数的化学转化而言一般是不够的。定向进化也是可能的, 但依然很慢因为它需要构建和筛选大的文库, 但文库所包含的大多数是退化的甚至无活性的变体。有猛烈进步的实例又很少与工业相关。这种缓慢的步伐意味着进化后的蛋白只包括少数改变, 而且因此酶的性质也只是略微地改变了。尽管几百种酶促过程已经有工业用途, 大多数涉及的酶和全细胞在遗传上只是少量地被改变了。
在过去十年间, 我们对蛋白质的认识和可用的定向进化的策略的数目都增长了, 这使得对酶的性质作出大的改变成为可能。总的来说, 酶工程将继续成为从众多可能的方法中选择其一加以应用解决手头的问题的案例研究汇总, 而不是像土木工程, 电机工程, 软件工程或化学工程那样有一种定量的方法。将这些案例研究转化为改造原则需要使用自由能将设计目标与所需的结构改变结合起来。性质上大的改变需要大的自由能的改变。例如, 稳定性上大的改变需要折叠-去折叠平衡中大的自由能的改变( 即使是不可逆的蛋白质去折叠也起始于一种可逆的部分去折叠) 。对蛋白质分子水平的理解提示了可被用于改进的策略。例如, 负责折叠-去折叠平衡的表面残基以及向环内添加脯氨酸残基都将降低去折叠形式的熵。这些策略用更小更集中的蛋白质文库代替了大的随机变异的文库( 大多数带有更劣质的性质) , 其中小文库含有很高比例的有活性且潜在可能已改进的变体。最后, 经过估计各种各样的相互作用力的强度( 表面离子对或添加一个脯氨酸残基对熵的贡献) , 研究者能够估计为达到目标所需作出的改变。现在, 很少有研究者明确地使用基于自由能的测量来规划蛋白质工程的策略, 可是将案例研究转化为工程原则则需要定量的方法。
新的改进的方法学
在过去的十年间, DNA技术和生物信息学的巨大进步为生物催化领域提供了关键性的支持。这些工具促进了从自然资源中发现新的酶并大大加速了对存在的生物催化剂的重新改造。
改良的DNA技术
下一代的DNA测序技术使大规模的平行序列分析成为可能, 而且大幅度降低成本。尽管在 人类基因组序列分析的花费预计在大约70,000,000美元, 到 其已缩水了1,000多倍, 为少于10,000美元。LifeTechnologies, Illumina和Oxford Nanopore Technologies已宣布为在几个小时内测完整个人类基因组而设计的测序仪器在 晚些时候将能够实现, 而且将会把每个基因组的成本降至少于1,000美元。来自不同环境的有机体的全基因序列以及环境中的DNA样品, 其包括难以培养的生物( 元基因组) , 创造了一种丰富的资源, 使得能够而且将来也继续能够从中寻找新的生物催化剂。使用Illumina的大规模高通量( > 10,000,000基因序列) 测序技术同样易化了探索和认知蛋白质序列-功能的相互关系。
低成本的DNA合成已代替分离基因组DNA作为蛋白质工程的起始点。全基因DNA合成进一步允许为宿主生物优化密码子并在适宜的位点引入分子构筑结构如启动子、 终止子、 增强子、 限制性内切位点等等。这种DNA合成使用传统的磷酰胺化学法, 可是优化了的反应条件提高了耦合效率, 增加了总体质量和聚合物的数量使得序列长达200-250个核苷酸。使用照相平版印刷法和喷墨打印技术的平行DNA合成技术进一步降低了成本, 加快了合成的速度。DNA合成被用于为代谢通路工程合成整条染色体DNA甚至完整的基因组。全基因合成还能够被用于生成高质量的DNA文库, 这些文库包括从小而专的位点饱和文库到大而全的基因集合。定做的基因甚至基因文库已变成大宗生产型化学品, 和今天在研究实验室中见到的试剂和溶剂一样。
生物信息学中的新工具
作为实验进展的补充, 生物信息学工具已成为现代蛋白质工程中不可缺少的一部分。跨越大的酶家族的多序列对比和同源序列查找已发现了有相似催化活性的基因, 并引出了新的、 强效的生物催化剂。相同的序列信息使得能够重构古代的生物催化剂, 它们可能拥有更广的底物范围和催化多功能性( 见下文) 。多序列对比识别出了每个位点上最常见的氨基酸( 共有序列) 和能产生稳定功能的酶的氨基酸替代。这些数据有助于设计含有高比例的催化活性变体的小文库。这些文库被用于发现稳定性增强、 催化功能提高以及立体选择性改变了的生物催化剂。
与基于序列的蛋白质工程所取得的进展相应的, 结构导向的方法获益于储存在RCSB蛋白质数据银行( ) 中的蛋白质结构类似物的快速增长。在过去十年间, 存储库增加了450%有余, 包含超过77,000个蛋白质结构。这既便利了理性蛋白质设计又易化了定向进化, 因为相关蛋白的结构对比有助于识别显着的相似性和差异性从而引导设计更可靠的突变文库。
两种不同的方法显示了小文库的效用, 这两种方法增加了一种酯酶分辨甲基-3-溴-2-甲基丙酸( 一种手性合成纤维) 时的手性选择性。使用随机突变并从上千个变体中筛选出了200个变体, 该酶的E值( 酶对一种对映体较另一种对映体的选择性) 从12增加到了19。认识到要产生一种有用的酶( E > 30) 两种对映体在自由能差异( ΔΔΔG) 上的相对小的增加( 0.5千卡/摩尔) 是需要的这一点, 突变就集中在了活性位点上。一个包含了4个位点上所有可能的单突变( 76个变体) 的文库产生了一个E值为61的酶( ΔΔΔG = 0.96) 。理解了要解决的问题的本质, 酶的优化方法就集中在了小文库上并产生了更大的进步。在这种情况下, 还值得一提的是连续定向进化的一种新的方法, 该方法使用了噬菌体感染系统和大肠杆菌的突变质粒的结合。
用于工业生物催化的工程化酶的实例
正如Schmid等人在她们 的前瞻性的综述中所预言的那样, 在过去十年间, 辅因子的连续再生和更广范围的酶已被报道。然而, 预言的生物芯片和组合生物催化的应用还没有成为现实。非代谢细胞的生物催化应用被证明比预想的更困难, 人们的倾向也就转移到了以粗制和半纯化形式使用的工程化酶。尽管历史上全细胞曾为辅因子的再生提供了一种简单和有效的可选办法并增强了酶的稳定性, 现在蛋白质工程和使用单酶被认为更经济和实用。分离酶的使用还有其它优点: 它们更容易被移除( 添加量更少因为单位质量的活性更高) , 它们耐受更严酷的条件, 它们消除了由细胞膜引起的潜在的扩散限制, 而且它们更容易在全球范围内运输。例如, 基于KRED的流程现已替代了全细胞还原和基于金属配基的化学催化, 后者在过去十年间曾是工业标准。一个例外是一种全细胞过程将外消旋的乙内酰脲转化为旋光性纯的非天然的α-氨基酸。同时表示海因酶、 氨甲酰水解酶和消旋酶的重组的大肠杆菌被认为是一种简单而有效的生产系统, 用于代替原来的反应流程, 原来的反应流程是基于在连续固定床反应器上的三种固定化酶。另外, 全细胞过程不需要代谢通量控制而且反应过程中没有不受欢迎的副反应。
KRED和其它的酶被广泛地研究用于药物手性中间体的生产, 如阿伐她汀, 立普妥的活性成分, 一种降脂药物, 在 的时候全球销量为11,900,000,000美元。现已开发了7种酶促法用于生产阿伐她汀, 它们不但在酶的选择和起始材料上有区别, 而且在产物是原材料( 含一个手性中心) 还是改进的中间体( 含两个手性中心) 上也有区别。在所有的这些案例中, 成功需要蛋白质工程将反应速率、 立体选择性、 高底物浓度( 高达3 M, 如腈水解酶流程) 或高溶剂浓度( 在KRED流程中乙酸丁酯含20%) 下的稳定性进行提高或促进。除了高活性的生物催化剂, 低成本过程还需要廉价的原材料和简单的分离来获得高产量的纯化产物。一种现今的流程使用3步生物催化来生产改进的中间体: 首先, 将KRED和葡萄糖脱氢酶结合; 其次, 将上述结合物与卤醇脱卤酶结合以 > 100 tyr -1的速率生成(R)-4-氰基-3-羟基丁酸乙酯中间体; 第三, 酶促还原生成改进的二醇中间体。
最近的改造将转氨酶的底物范围扩展至含两个巨大的取代基的酮。该酶的改造始于一种小的底物酮, 在活性位点创造了更多的空间并使用了越来越大的酮。几轮定向进化将活性提高了约40,000倍并产生了一种工程化转氨酶胺以代替西她列汀生产中的过渡金属基氢化催化剂。始于ATA-117, 一种野生型酶的接近的同系化合物, 对底物没有可测得的活性, 第一个变体对前西她列汀只有很低的活性( 10 g/l的酶对2 g/L的底物只有0.2%的转化率) , 最后一种变体能将200 g/l的酮转化为对映体过量值为99.95%产率为92%的西她列汀。生物催化过程不但减少了总废物消除了所有的过渡金属, 而且与金属催化过程相比总体产量和生产率增加了53%。无数的生物催化过程为药物生产扩大了规模, 这证实了它们和传统的化学过程相比所具有的竞争性。
源于优化研究的酶的变体是将来项目起点的一个独特的来源。经过使用为一个过程改造过的更稳定的酶, 下一个优化项目将会更快。例如, 改造合成R3HT的KRED时创造了很多稳定的酶的变体包括一些由于低的空间选择性而不适合的变体。然而, 这些不适合的变体中的一种却是改造DCFPE的KRED的起始酶。接着, DCFPE酶中的一种又是孟鲁司特KRED的起点, 孟鲁司特KRED中的一种又接着是度洛西汀KRED的起点。相似的, 在前西她列汀转氨酶的进化中产生的转氨酶能够生成其它的胺, 也能够为胺合成的新的工程化酶作为起点。因此始于一个已经在一种流程中起效的非天然的稳定的酶变体以始料未及的方式加速了催化剂和过程的发展。
同时设定两个立构中心的酶促转化是合成复杂分子的特别有效的方式。例如, 由KRED催化的酮还原反应设定了乙醇的立构中心。然而, 如果酮羰基旁的第二个立构中心在溶液中快速地外消旋而且KRED对一种结构有高度的选择性, 那么还原反应就能够在一步中设定两个立构中心。实例包括青霉烯中间体、 假麻黄碱和苯肾上腺素, 以及手性胺相类似的流程。同样, 醛缩酶现被用于后续反应步骤来产生多个手性中心, 例如在合成她汀类药物中间体中。单个酶的级联反应如由醛缩酶催化的反应已被进一步扩展成多酶级联反应, 例如在体外合成2'-脱氧肌苷或者在体内合成复杂的分子如青蒿素或紫杉醇。
生物催化过程的环境优势
在对化学生产的环境方面抱有忧虑的情况下, 生物催化提供了一种有吸引力的选择。美国环境保护局在每年的美国总统绿色化学挑战奖中颁发5个奖项。提名强调了12项绿色化学原则, 原则对环境因素以及可再生原料的使用、 能量效能以及工人的安全性给予了考虑。运用酶技术或者全细胞的生物催化自 以来共获得了16个奖项。生物催化剂是由可再生资源合成的而且是生物可降解以及无毒的, 它们高度的选择性简化了反应操作并提供了更高产量的产品。生物催化过程还很安全因为它们一般在环境温度、 环境压力和中性pH下进行。因此, 这就不奇怪为什么如此多的奖项都颁给了生物催化。
表2中所示的奖项的广阔范围展现了生物催化剂在非制药工业中的应用。几项应用涉及聚合物, 特别是聚酯纤维。乳酸的优化发酵是内布拉斯加州一家聚乳酸工厂的基础, 每年有141,000吨的产能, 而且一条新的非天然的代谢途径使得能够合成1,3-丙二醇用于合成SORONA聚合物。1,4-丁二醇发酵产生了另一种聚合物的组成部分, 斯潘德克斯弹性纤维。在聚羟基脂肪酸酯的合成过程中, 生物催化剂不但催化了单体的合成而且还催化了其聚合。Yang及其合作者最近工程化了这些聚羟基脂肪酸酯合酶以将乳酸聚合成聚乳酸。几项其它的奖项包括用于生产生物燃料的新的代谢通路。例如, LS9有限公司将大肠杆菌改造后以生产生物柴油。向大肠杆菌中加入植物的硫酯酶基因将正常的脂肪酸生物合成途径转化为合成适合于生物柴油的几种脂肪酸。添加酶的基因以生产乙醇, 然后另一种酶将乙醇和脂肪酸偶联以形成脂肪酸乙酯, 该物质可被用于生产生物柴油。生物柴油的产量比商业可行的流程至少低了10倍, 但进一步的改造很可能会增加产量。
蛋白质工程中的新概念
酶的性质的大的改变一般需要多个氨基酸的替代因为这对蛋白质结构产生更大的改变。然而, 多个氨基酸同时替代给测试带来了指数级多的变体。在一个200个氨基酸的蛋白质的任意位点进行2个替代可产生7,183,900种可能, 进行3个替代可产生9,008,610,600种可能。这些变体中很多都是没有活性的, 要么所有的变体都会被创造出来并加以测试以发现改进的变体, 或者对文库仅进行部分筛选并需要在接下来的几轮进化中逐渐改进。
这个问题最简单的解决方法是采用更有效的筛选。底物特异性的改变能够由高通量的方法来监测, 如荧光活化细胞分拣, 它能够在短时间内筛选成千上万的变体。Whittle和Shanklin对一个脂肪酸去饱和酶的活性位点中的6个位置同时进行了替代然后筛选其在另一种底物上的生长情况。只有改变了底物特异性的那些变体才能够生长。Seeling和Szostak使用了很大的随机文库( 高达1013个变体) , 从中她们能够基于产物对柱子的结合情况筛选催化RNA连接的变体, 而不是从起始物质开始。
现在, 创造多突变的最佳的方法是同时添加但经过统计或生物信息学的方法限制可选项。Codexis研究者使用的一种基于ProSAR( 蛋白质结构活性关系) 算法的统计相关性的方法将卤醇脱卤酶的反应速率提高了4,000多倍。研究者在脱卤酶中进行随机的氨基酸替代( 大约10个) 并测量了变体的催化速率。然后用统计方法识别一个特定的替代是否是有益的。例如, 在186位上用Tyr替代Phe的变体平均而言比那些不做替代的要好。一些包含了这样一种替代的变体并不是有益的, 这是由于其它的替代产生了有害的影响。但统计分析发现, 平均而言, 186位上用Tyr替代Phe是一个有益的突变。最后改进的酶在它的254个氨基酸中包含了35个氨基酸替代。
γ-蛇麻烯合酶经过阳离子中间体催化法呢基二磷酸的环化生成γ-蛇麻烯仅有45%的产量, 另外生成较少量的51种其它倍半萜烯。Keasling及其合作者一步一步地在活性位点替代氨基酸残基并识别每一个对产物分布的贡献。将多个替代结合以更有利于另一种倍半萜烯的合成。例如, 一种3个替代创造了一种能形成78% 的sibirene的酶, 天然的酶只能形成23%的sibirene。
另一种方法是将改变的位置限制在活性位点上, 从序列对比得知, 变化的种类一般发生在这些位点上。Jochens和Bornscheuer使用了这种方法来增加荧光假单胞菌酯酶的立体选择性。同时改变接近活性位点的底物的4个氨基酸可产生160,000( 204) 种方法。研究者对比了超过2800个相关酶的氨基酸序列来识别这些位点上哪些氨基酸是最常见的。这些分析将可能性限制到了几百个变体, 然后对这几百个变体进行测试以发现具所需选择性的含两个或三个突变的变体。另一项可产生多突变的重要进展是认识到突变一般使蛋白质变得不稳定, 因此从一个很稳定的蛋白质开始可使其耐受更大数目和范围的改变。
因为筛选包括多突变的大文库的工作量随文库大小的增加而呈指数级增长, 大多数的研究者以有益突变一般具有加和性而协同效应则很少除非是接近的改变为工作假设。事实上, 将单个有益突变结合一般产生加和性的进步( 例如, 增加来自枯草杆菌的酯酶对有机溶剂的稳定性或增加来自绿脓假单胞菌的脂肪酶的立体选择性) 。然而, 一般这些贡献并不会精确地相加或拥有始料未及的表现。例如, 突变A和突变B自身可能都是有害的, 可是合起来后她们可能就是有益的。Weinreich及其合作者研究了β-内酰胺酶向更高的活性进化过程中的这些协作式的相互作用。突变A增加了反应速率但却使β-内酰胺酶变得不稳定, 总体效果是仅有轻微的益处。突变B不影响速率但却能够稳定β-内酰胺酶, 单独来看它并没有什么效果。将突变A和突变B放在一起后却是高度有益的因为β-内酰胺酶变得更快并维持了其稳定性, 但如果将突变逐步地添加很可能将会错过这种协同的例子。Reetz和Sanchis在测试逐步添加突变来增加立体选择性时得到了相似的结论。当其中一个突变是稳定突变且当这些突变彼此靠得很近时协同作用是很重要的。稳定突变造成的不可添加性这一难题能够经过在开始突变前将蛋白质稳定使其最小化, 可是临近突变引起的不可添加性难题是最常见也是很难轻易避免的。
结果, 在蛋白质改进过程中产生的有用的改变的程度在过去十年间急剧增长。在 早期, 1-5个突变是典型的, 而到了 , 30-40个氨基酸的替代都不是罕见的。例如, 生产阿伐她汀( 立普妥) 侧链的卤醇脱卤酶的定向进化至少改变了254个氨基酸残基中的35个( > 14%) , 生产西她列汀的转氨酶的定向进化改变了330个氨基酸中的27个( 8.2%) 。相似地, 逆醛缩酶的计算机设计需要在起始酶中进行8或12个氨基酸替代( 4-6%) , 起始酶是一种含197个氨基酸的木聚糖酶。
在过去十年间研究过的第二种方法是创造新的, 一般是非天然的, 催化活性。这种新的活性的起始点一般是一种催化多功能性反应。催化多功能性指的是一个活性位点催化超过一种反应类型的能力。典型地, 酶催化一种正常反应和几种额外的副反应, 这可能涉及常见的催化步骤。新的反应类型不只是一个取代基添加到底物上去, 还包括一种不同的转化状态和/或形成不同类型的化学键。例如, 丙酮酸脱羧酶一般将丙酮酸转化为乙醛和二氧化碳。然而, 丙酮酸脱羧酶的多能催化活性中的一种活性是将乙醛和另一种醛在偶姻缩合中偶联。这样一种非天然的丙酮酸脱羧酶催化的乙醛和苯甲醛的缩合是BASF于1920年代开发的生产麻黄素药物前体的工业方法的基础。最近的蛋白质工程增强了丙酮酸脱羧酶催化偶姻缩合的多能催化能力。正常反应需要有质子转移, 可是多能催化反应不需要。单氨基酸替代移除质子供体会失去天然活性但使多能催化活性增强大约5倍。
用无效不需要的通路来增强需要的产物的通量的方法在第三次飞跃中进一步得到了发展--代谢通路工程。这使得来自次级代谢的更复杂的通路能被转移到新的有机体中, 并能创造出完全新的生化通路来生产药物中间体和生物燃料。萜烯、 氨基酸和脂肪酸的正常代谢已被重新改造来生产碳氢化合物、 乙醇和聚酯纤维以作为燃料、 散装化学品和塑料( 见上文) 。
生物催化剂改造仍面临的挑战
纵使有显着进展, 但要完全利用生物催化的优势仍存在巨大的挑战。酶工程较十年前已经变快了许多, 但改变30-40个氨基酸并从成千上万个候选物中进行筛选仍需要一个很大的研究团队。很多, 如果不是所有的话, 改造策略会产生改进了的变体, 但有一些会产生更好的变体并能更快地找到它们。至今还不清楚哪些是更好的策略。对同样的问题在策略间直接进行比较并测试不同策略背后的假设将会发现那些最有效的策略。
第一个假设是使用酶工程能够实现目标。涉及非天然底物的反应的热力学可能要较那些涉及天然底物的反应更不利, 而且特定的酶活性的获得可能在热力学上是不可能的。扩散效应给反应速率设定了一个上限。在设计新的过程时, 非常需要的是, 将热力学和生物催化过程发展进行更密切的整合。
蛋白质工程一般依赖于知晓酶的四级结构, 因为在蛋白质-蛋白质界面上的残基对稳定性有贡献。研究者假设在反应条件下( 低酶浓度, 高底物浓度, 有机溶剂等) 酶的结构与结晶酶( 高酶浓度, 无底物和/或有机溶剂) 的结构非常相似。因为大量实验发现蛋白质只有在很苛刻的条件下才能结晶, 在溶液中, 它们很可能采取很多种构象, 包括在晶体结构中看到的那些。另外, 我们对蛋白质动力学的了解依然很有限, 这使得预测变得困难。
第三, 酶工程假设个体的突变具有加和性。尽管突变一般不会有相互作用, 可是很多有相互作用的突变非常有用却难以研究。识别协作效应的一种方法涉及使用ProSAR算法进行统计分析, 可是要在蛋白质工程早期预测哪些额外突变有可能是加和性的而哪些是死路一条还需要更好的技术。
第四, 电脑设计新酶的活性不够精确。设计依然需要测试10-20种预测物且一般产生的是低活性的酶, 这些低活性的酶还需要大量的进一步改进。例如, 最早的基于计算机设计的用于生产西她列汀的酶每天只能转化0.1底物分子, 然而从晶体结构衍生来的计算机模型中底物与酶的活性位点吻合得正好。新的酶能够被设计出来以催化在自然界中找不到的反应( Kemp消除反应, 新狄尔斯-阿尔德反应) , 但这样的活性对实际应用当前还太低。还需要对酶催化的机械、 动力和结构方面有更好的了解。
技术上的困难同样限制了生物催化。现有的DNA合成方法已接近它们的效能极限, 但每个碱基仍需耗费大约0.35美元( 每1000个核苷酸的基因大约耗费300美元) , 这对于需要上千个基因的大规模应用而言实在太高。更长以及更廉价的DNA片段将使实验得到简化和加速。下一代的DNA合成方法可能涉及用密码子( 三核苷酸) 合成寡脱氧核苷酸而不是单个的核苷酸。这种方法首先在二十年前被提出但从未成为过主流, 很可能是由于设备的限制( 合成始于64个亚磷酰胺三核苷酸) 。尽管如此, 这一观念最近已用于全基因在一次合成中快速装配和制备高质量的突变文库, 因此似乎现在已经可行。
在复杂的多酶装配体中将生物催化剂与纳米设备整合的新想法具有广阔的前景。酶的固定化自生物催化的早期起已是一种策略, 但如果生物催化剂的表面转向能被控制的话这种策略能够更有效。相似地, 在多酶通路中使用蛋白质和核酸骨架来控制酶的数量和方向的方法同样能够改进效能。个别地, 如碳纳米管和量子点之类的功能性基质能够代替复杂的生物电子转移系统, 提供半导体作为氧化还原催化剂和界面酶再生的新方法。尽管如此, 用非生物基质和纳米材料整合酶并作为代谢工程的一部分仍是效率低下的。将来的蛋白质工程不得不解决在代谢通路或支持基质中单个生物催化剂和其它蛋白质界面上出现的麻烦。
蛋白质工程解决了之前的生物催化剂的弱点: 低稳定性、 对非常规底物低活性。大量的蛋白质被用于补偿低活性, 这引起了乳胶状妨害了设备降低了产量。高活性的酶解决了这一问题因为蛋白质用量少时乳胶状不再形成。在生物催化和化学催化两个领域中都对化学家进行训练将帮助她们在每个案例中选择最佳的解决方案。改进后的酶有更长的保存期限, 在有机溶剂中有更好的活性和稳定性, 这样的酶将会帮助生物催化深入传播至工业实验室。
蛋白质工程最近的进展已达到相当于将小鼠蛋白转化为人蛋白的水平。小鼠和人的相似蛋白的氨基酸序列一般有大约13%的差异。今天的高级蛋白质工程在将野生型的酶转化为适合化学方法应用的酶时所做的改变与此相似。这一蛋白质工程相当于将从早期哺乳动物到现代的小鼠和人类的75,000,0 进化压缩成了几个月的实验室工作。和这些蛋白质中更广泛的改变一致的是, 其性质也发生了更戏剧性的改变。酶的催化特性在数量上已提高了几千至几百万倍, 而且改造后的酶能够在非常严酷的条件下起作用。在第三次生物催化浪潮中建立的对蛋白质工程的理解使酶的表现得以有戏剧化的改进, 同时需要这些催化剂的化学合成过程也得到了发展, 这使得生物催化将发展成化学合成中越来越重要的一种工具。
说明: 本文原文在线发表Nature 485, 185–194 (10 May ) doi:10.1038/nature11117
本文由蒋淑霞翻译, 仅供学习参考, 相关信息请以原文为准。
展开阅读全文