收藏 分销(赏)

基于多因素耦合参数拟合蛋白质折叠速率_李兰.pdf

上传人:自信****多点 文档编号:275753 上传时间:2023-06-26 格式:PDF 页数:6 大小:1.99MB
下载 相关 举报
基于多因素耦合参数拟合蛋白质折叠速率_李兰.pdf_第1页
第1页 / 共6页
基于多因素耦合参数拟合蛋白质折叠速率_李兰.pdf_第2页
第2页 / 共6页
基于多因素耦合参数拟合蛋白质折叠速率_李兰.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、103李兰等基于多因素耦合参数拟合蛋白质折叠速率第 2 期第 42 卷 第 2 期2023 年 4 月内蒙古工业大学学报(自然科学版)Journal of Inner Mongolia University of Technology(Natural Science Edition)Vol.42 No.2Apr.2023文章编号:1001-5167(2023)02-0103-06基于多因素耦合参数拟合蛋白质折叠速率李兰,张颖(内蒙古工业大学 理学院,呼和浩特 010051)Protein folding rate fitting based on multi-factor coupled pa

2、rametersLI Lan,ZHANG Ying收稿日期:2022-10-17基金项目:内蒙古自治区自然科学基金项目(2022LHMS03014);内蒙古自治区直属高校基本科研业务费项目(JY20220069)第一作者:李兰(1996),女,2020 级硕士研究生,主要从事生物信息统计计算研究。E-mail: 通信作者:张颖(1973),女,博士,副教授,主要从事计算生物学研究。E-mail:(School of Science,Inner Mongolia University of Technology,Hohhot 010051,China)Abstract:The four para

3、meters including the number of regular secondary structures,the weighted long-range order of amino acid types,the radius of gyration per unit chain length and the nematic order were extracted from the sequence and structure of the native state of the protein.These parameters characterize the size,to

4、pology,amino acid composition,geometry and the ordered degree of secondary structure arrangement of the protein,respectively.The four parameters were coupled together to construct a power-law dependence equation between the coupling parameters and the folding rate.On an experimental data set contain

5、ing 155 protein folding rates,the parameters to be determined for the equations were determined using maximum likelihood estimation.The results show that the coupling parameter achieves an 80%goodness of fit to the folding rate and that 95%of the protein folding rates are within 50-fold of the predi

6、cted value,and for the folding rate data spanning nine orders of magnitude,the coupling parameter captures the major factors affecting the folding rate.Key words:protein folding rate;coupling parameter;power-law;maximum likelihood estimation摘 要:从蛋白质天然态的序列和结构中,提取了规则二级结构数、氨基酸类型加权长程序、单位链长回转半径和向列序等 4 个参

7、数,这些参数分别表征了蛋白质的大小、拓扑、氨基酸组成、几何形状和规则二级结构排列有序性。将 4 个参数耦合在一起,构建了耦合参数与折叠速率之间的幂律依赖方程。在包含 155 个蛋白质折叠速率的实验数据集上,采用极大似然估计确定了方程的待定参数。结果表明:耦合参数实现了对折叠速率 80%的拟合优度,而且95%的蛋白质折叠速率在预测值的 50 倍以内,对于跨越 9 个数量级的折叠速率数据,耦合参数捕获了影响折叠速率的主要因素。关键词:蛋白质折叠速率;耦合参数;幂律;极大似然估计中图分类号:Q 03 文献标志码:A 蛋白质折叠问题被广泛讨论超过 50 年1,但基于现有知识仍不能精确地预测出蛋白质的折

8、叠时间。目前已测量的 150 多个单结构域水溶性球蛋白质(包括人工合成肽)体外折叠实验数据表明,其折叠时间从 10-6 s 到 103 s 跨越 9 个数量级2。尽管蛋白质折叠非常迅速(常常是 ms 量级),但却可准确到达其原子细节天然结构,其中机制令人着迷。最近以 AlphaFold23和 RoseTTAFold4为代表的深度学习模型,在预测蛋白质三维结构方面取得了前所未有的成功,但这些模型还仅是基于知识的最终状态的准确预测。OUTEIRAL C 等5分析了包括 AlphaFold2 和 RoseTTAFold 在内的 8 个结构预测模型,发现当前的机器学习模型尽管捕获了一些关于折叠路径的信

9、息,但所产生的折叠轨迹与实验可观测值如折叠速率无关,表明这些模型没有学习到蛋白质折叠的物理学,也就是说,蛋白质折DOI:10.13785/ki.nmggydxxbzrkxb.2023.02.001104内蒙古工业大学学报(自然科学版)2023 年叠问题尚未解决6-7。到目前为止,对蛋白质折叠速率的研究还没有通用的物理规律可供遵循,因此凭借直觉和经验探索一些唯象规则成为现阶段的主要研究方法。尽管影响蛋白质折叠动力学的因素可能纷繁复杂,但折叠动力学并不对序列的细节过分敏感,而是主要由决定蛋白质总体特性的参数特征来决定1。折叠动力学可以用简单的、经验的、基于序列和结构的规则来预测,表明折叠的基本物理

10、学可能是简单的。这与最近 HU J L 等8在群落动力学研究中所证明的结论“只需掌握少量群落尺度控制变量,就可以预测复杂生态系统的行为”有异曲同工之处。早在 1995 年 THIRUMALAI D9基于玻璃动力学模型指出,折叠速率可以用蛋白质链长来估计,其后许多学者对蛋白质链长与折叠速率的关系进行了详尽研究10-16,这些研究表明,蛋白质大小(链长9-12、二级结构数13-15、累积扭角16)是决定折叠速率的主要因素。考虑到在折叠早期局域二级结构快速形成而不构成折叠限速因素13,因此,相比于链长,以二级结构为折叠单元,以二级结构数度量蛋白质大小,对折叠速率预测更有效14-15。1998 年 P

11、LAXCO K W 等17发现小的二态蛋白质折叠速率与一个简单结构拓扑参数显著负相关,从而引发了结构拓扑与折叠速率关联性的一系列研究18-20,其中,由 GROMIHA M M 等19基于天然态残基间非局域相互作用定义的长程序参数(long-range order,LRO),与二态和多态蛋白质折叠速率均有较好相关性21,这些结果突出了天然接触在确定蛋白质折叠机制中的重要性,表明最终结构的拓扑结构是独立于其大小的另一个蛋白质折叠机制的重要决定因素。除了大小和拓扑外,还有一些因素也值得关注。首先是蛋白质单点突变有时会导致折叠速率明显变化,这既不能用基于大小的因素也不能用基于拓扑的因素来解释22,表

12、明蛋白质序列信息在折叠速率预测中不应被忽视23-24,因此,在折叠速率预测模型中纳入序列信息可能是一个有前途的方向。其次,IVANKOV D N 等25分析表明,大小相似的蛋白质,椭球形比球形折叠更快。再者,LAN P D 等26发现二级结构片段的排列整齐度与折叠自由能显著相关。可见,蛋白质的整体几何形状,以及构成这个形状基本单元的排列都会对折叠动力学产生影响,因此,在折叠速率预测模型中吸收几何形状和折叠单元排序信息,对改善折叠速率可预测性是可期的。事实上,蛋白质本身具有了折叠所需的全部信息。如能将已知影响折叠速率的多种因素有效综合在一起,构造一个简单参数来最大程度地模拟蛋白质将所有折叠信息集

13、合于一身的特性,可能会显著改善现有单一因素模型的不足,进而大幅提高对折叠速率的拟合精度。基于这个想法,对给定蛋白质采用二级结构数表征大小,氨基酸加权长程序表征拓扑和氨基酸组成,回转半径表征形状,向列序表征规则二级结构排序。将这些因素耦合在一起,定义了耦合参数。相比已有的一些典型单因素模型,耦合参数模型大幅提高对折叠速率的拟合精度超过 10%,结果对于理解复杂的折叠机制提供了帮助。1 材料与方法1.1 蛋白质折叠速率数据集收集整理了包含 155 个蛋白质和多肽的非冗余折叠速率数据集。145 个蛋白质数据源于 PFDB 数据库(http:/lee.kias.re.kr/bala/PFDB)2,其余

14、数据源于文献 11 和文献 14。数据集中二态蛋白质96 个,多态蛋白质 59 个。折叠速率记为 kf,单位为 s1。蛋白质结构数据下载自 PDB(https:/www.rcsb.org/)数据库 27,二级结构用 DSSP 程序28分配。1.2 耦合参数模型1.2.1 二级结构数用天然态规则二级结构 螺旋和 股的片段数来表征蛋白质的大小特性,记为 N。考虑到 DSSP程序的误差,计数时遵循以下原则:1)两个连续的 螺旋片段必须间隔二个及以上残基,否则记为一个片段;2)股片段长度大于二个残基,否则不计。1.2.2 氨基酸类型加权长程序用氨基酸类型加权的长程序表征蛋白质拓扑结构和组分特异信息,记

15、为 W。长程序19的原始定义中每对氨基酸接触均计数为 1,然而不同氨基酸的折叠动力学贡献是不同的23。跟随文献 23 的方案,以耦合参数与折叠速率相关系数的最大化为目标,采用穷举法将 20 种氨基酸分为 3 个集合,折叠减慢型 S=GKLPSY,折叠加快型 F=CFIV和常规型 N=ADEHMNQRTW。为了体现组分特异性信息,当 3 个集合内或集合间氨基酸发生长程接触时赋以不同接触权值。W 定义为105李兰等基于多因素耦合参数拟合蛋白质折叠速率第 2 期 (1)式中:L 为蛋白质链长即氨基酸总数;当第 i 个残基与第 j 个残基的 C原子距离小于 8 且|ij|12 时,ij=1,否 则 i

16、j=0;w(ai,aj)为 第 i 个残基 ai与第 j 个残基 aj的接触权;记号 ai S/F aj F/S 表示残基 ai属于集合 S 且残基 aj属于集合 F,或残基 ai属于集合 F 且残基 aj属于集合 S,其他类似。1.2.3 单位链长回转半径用单位链长回转半径表征蛋白质几何形状,记为 R。不考虑每个氨基酸内部原子布置细节,粗粒度地用 C原子位置代表氨基酸位置,R 定义为式中:L 为蛋白质链长;mi为第 i 个氨基酸质量;ri为第 i 个氨基酸 C原子的坐标向量;rc为质心坐标向量。从球状到棒状 R 取值范围为 0.050.5。1.2.4 向列序参数用向列序参数表征规则二级结构排

17、列的有序程度,记为 S。以每个规则二级结构单元 螺旋或 股的两个端点残基的 C原子位置构成一个矢量,则 S 定义为 式中:为每个二级结构单元矢量 u 与指向矢量(director)d 的夹角;表示对所有二级结构单元取平均;指向矢量是排序矩阵 Q 最大特征值的特征向量,Q 的第 a 行和第 b 列矩阵元为 这里:N 为蛋白质规则二级结构单元数;ui为第 i个二级结构单元的单位矢量;a,b=1,2,3 为单位矢量三个空间维度序号;ab为克罗内克 函数。图 1 直观地解释了向列序的含义。图 1 中 4 个二级结构单元用向量 u1到 u4表示,指向矢量用 d 表示,图中给出了 u3与 d 的夹角 3。

18、当所有二级结构单元平行或反平行排列时,有=0。或 180。,此时向列序参数 S 取得最大值为 1,当所有二级结构单元随机杂乱排列时(二级结构单元足够多),向列序参数 S 取得最小值为 0。1.2.5 耦合参数将以上参数组合为一个耦合参数,记为 Cp。参数 Cp综合了蛋白质的大小、拓扑、氨基酸组成、几何形状以及二级结构排序等属性,它尽可能地模拟了一个蛋白质将所需折叠信息集于一身的特性。耦合参数 Cp定义为 (5)1.2.6 折叠速率预测模型假设折叠速率满足以下幂律模型 (6)式中:k0和 为拟合常数,其中 k0可视为基元折叠速率,为幂的指数。1.3 模型参数的极大似然估计如果将未包括在耦合参数

19、Cp中且对折叠速率有贡献的其他所有因素(如实验条件等),视为零均值高斯分布 XN(0,2),方程(6)可重新建模 方程(7)意味着 kf为对数正态分布,位置和尺度参数分别为 ln(Cp)和。在数据集上对 lnkf值进行 Shapiro-Wilk 正态性检验,所得 p 值为 0.63,大于 0.05,表明折叠速率 kf满足对数正态分布。由对数正态分布的概率密度函数可得似然函数 L式中:n 为数据集中样本总数;kfi和 Cpi为数据集中|12 1(,)-2.5 ,3 ,0.5 ,(,)2 0.5 LijijijijijijijijiWw a aLa aa aa aw a aaaa-=FSNS/F

20、F/S-0.5 jijaaa|S/N N/SF/N N/F23cos12S-=132NabiaibabiQu uN=-图 1 向列序参数示意图Fig.1 Diagram of the nematic order parameterpC(1/1/)/2=+NWRS0p(C)v=fkk0pln(/)ln(C)v=+fkkX211111()/LLiiCiiiLLCi iiiiRmmLmm=-|=|rrrr(2)Cp(8)(3)(4)(7)106内蒙古工业大学学报(自然科学版)2023 年第 i 个蛋白质的折叠速率和耦合参数。基于似然函数 L 的最大化,不但可以估计方程(6)的待定常数k0和,而且可以

21、估计拟合宽度。极大似然法也提供了一个通过似然比进行严格模型比较机制12。2 结果与讨论2.1 耦合参数捕获了影响折叠速率的关键因素基于耦合参数模型方程(6)或(7),在包含 155个蛋白质折叠速率实验值的数据集上,采用极大似然估计方法确定了模型待定参数,结果如图2 所示。图 2 横纵坐标均为常用对数尺度。图 2 结果表明,耦合参数的对数与折叠速率的对数呈线性负相关,拟合优度达 R2=0.80,证明由方程(6)所给出 kf与 Cp的幂律依赖假设正确。模型待定参数之一基元折叠速率 k0=5.60107 s-1,与实验测定的肽末端之间的接触形成时间约 1050 ns29-30非常接近,从一个侧面折射

22、出耦合参数可能捕获了影响折叠速率的核心因素。标准差=1.96,意味着有 68.3%的蛋白质其折叠速率实验值与方程(6)给出的预测值相差在 e7 倍以内,而 95.4%的蛋白质相差在 e250 倍以内。也就是说耦合参数模型可以在 50 倍以内实现对 95%的蛋白质的折叠速率的准确预测。注意到当前数据集给出的折叠速率范围是从 5.4106 s-1到 1.010-3 s-1,跨越了 9 个数量级。因此拟合宽度结果再次表明,耦合参数捕获了影响折叠速率的主要因素。此外,为了说明耦合参数的优势,以组成耦合参数的 4 个要素为独立参数,分别采用多元线性回归(multiple linear regressio

23、n,MLR)和两种机器学习算法,支持向量回归(support vector regression,SVR)31和随机森林回归(random forest regression,RFR)32模 型 对 折 叠 速 率 进 行 拟 合,结 果 表 明MLR,SVR 和 RFR 三种方案的预测值与实验值的拟合优度分别为 0.78、0.77 和 0.77,均略低于耦合参数模型的结果。2.2 与单一因素模型的比较耦合参数模型具有出色的折叠速率拟合性能,这与模型综合了多个影响折叠速率关键因素直接相关。为了直观地展现耦合参数模型的优越性能,选择 6 个典型的单因素模型与耦合参数模型进行性能比较。6 个模型分

24、别是链长平方根 L1/2模型9、折叠链有效长度 Leff模型13、接触序(contact order,CO)模型17、绝对接触序(absolute contact order,ACO)模型18、长程序 LRO 模型19和有效长度ne模型23,这些模型不仅在折叠速率预测研究过程的不同时间节点上具有突出的理念性价值,而且其预测性能也具有代表性。以各模型给出的参数建立类似方程(7)的线性回归方程,即 (9)式中:x=L1/2,(Leff)0.1,CO,ACO,LRO,ln(ne)为各模型参数;和 为拟合常数。采用极大似然方法估计各模型的标准差以及似然值。表 1 分别给出了Cp模型与 6 个模型似然比

25、、标准差、拟合优度、皮尔森相关系数以及相关系数差异性检验 p 值。由表 1 可见,耦合参数模型与各单因素模型的似然比均远远大于 102(通常 102或更大的似然比被认为是显著的),表明现有折叠速率数据更好地支持了 Cp模型。耦合参数模型的标准差也是最小的,Cp模型可以在一个数量级精度内对 95%的蛋白质折叠速率做出正确预测,而其他模型要到二个甚至更高数量级。Cp模型的拟合优度为 0.80,明显图 2 耦合参数模型对折叠速率的拟合结果Fig.2 Fitted results for folding rates by coupling parameter modelln(/)=+fkxX表 1 在

26、当前数据集上耦合参数与单因素模型预测性能比较Table 1 Comparison of prediction performance between coupling parameter model and single-factor models on the current dataset模型似然比LRa标准差拟合优度 R2皮尔森相关系数 r相关系数差异性检验 p 值aln(Cp)1.001.960.800-0.894 71.00(Leff)0.1 132.9310142.650.698-0.835 7 3.8010-2ln(ne)231.1010172.520.669-0.817 8 1

27、.0210-2ACO 184.6810222.750.609-0.780 1 5.0210-4L92.4910252.860.576-0.758 6 8.2010-5LRO 193.9010272.950.547-0.739 6 1.5810-5CO 171.2810544.380.040-0.063 00.00注:a似然比和相关系数差异性检验结果均为耦合参数模型与各个单因素模型的比较。107李兰等基于多因素耦合参数拟合蛋白质折叠速率第 2 期高于其他单因素模型超过 10 个百分点。Cp模型与折叠速率的皮尔森相关系数为 0.89,分别与其他6 个模型的成对独立相关系数的差异性检验结果显示,p

28、值均小于 0.05,表明 Cp模型的皮尔森相关系数显著大于其他模型。表 1 的综合结果表明,耦合参数模型在现有数据集上具有明显优于 6 个单因素模型的折叠速率预测性能。另一方面,通过比较模型预测值与实验值之间的偏差,也可以作为衡量模型质量的一个标准。基于各参数的线性回归模型,采用留一法(leave-one-out,LOO)对折叠速率的自然对数值进行预测。当预测值与实验值之差的绝对值小于给定阈值时,认为是一个正确预测。在某一阈值下,预测正确率定义为在数据集上速率被正确预测的蛋白质数量百分比。显然,当阈值从 0 逐渐增大时,各模型的预测正确率会逐渐增大。不同阈值下各模型预测精度的比较见图 3,图

29、3 中阈值选取截止到 7,因为在此阈值下多数模型的预测精度已达到或接近 100%。由图 3 可见,每个阈值下 Cp模型总是具有最大的预测正确率。举例来说,阈值为 2 时,Cp模型预测正确率已超过 70%(具体值为 72%),而其他模型在此阈值下预测正确率还不足 60%,当阈值为 5时 Cp模型预测正确率已达到 100%,而其他模型(除 CO 模型外)直到阈值为 7 时才接近 100%。结果表明耦合参数模型明显优于其他单因素模型。2.3 耦合参数构成方案的评价为了理解耦合参数 Cp的构成,对式(5)右边逐项进行分析。第一项 NW,把 W 的定义式代入这个乘积并把 N 放到分母上,这时分母为平均每

30、二级结构的氨基酸数 L/N,分子为加权非局域接触数,则第一项的含义为一个二级结构中平均每个 氨基酸残基拥有的加权非局域接触数,也就是说二级结构间的平均相互作用强度是决定折叠速率的一个核心因素,这与文献 14 所提出的折叠子漏斗模型的观点一致。第二项 1/R+1/S,蛋白质的整体几何形状参数 R 与形状内的单元排序参数 S 是两个独立的平行因素,当二者共同起作用时,总的效果类似于两个电阻的并联。第一项与第二项以加和的形式组合,意味着二者之间存在协同效应而并不完全独立。去掉几个极端点后,R 与 S 的皮尔森相关系数仅为 0.26,而第一项与第二项的相关系数为0.75,统计结果证实了以上观点。此 外

31、,折 叠 减 慢 GKLPSY 和 折 叠 加 快CFIV 共 10 个氨基酸对折叠动力学是重要的,这个结果与 CHANG L 等23统计得到的折叠动力学重要氨基酸集 GDLPSYCTWV(粗体为二者共有氨基酸)有 7 个氨基酸相同。若折叠减慢型氨基酸相互接触,赋了正的较大权值,意味着这些氨基酸接触时找到正确天然态构象耗时较长,如脯氨酸 P的顺反式异构化速率就非常慢33。而折叠加快型氨基酸相互接触,赋了负的较大权值,表明这些氨基酸接触时有利于形成天然态构象,典型的如两个半胱氨酸 C 接触容易形成二硫键而显著增加结构的稳定性。CRUZEIRO L 等34的统计结果表明,氨基酸IVCFW具有形成结

32、构的倾向,其中IV有强倾向。因此,方程(1)给出的氨基酸类型加权值具有合理性。3总结当前尽管对蛋白质结构的预测已经取得了突破性进展,但对折叠动力学的了解仍十分有限。本文分析了影响蛋白质折叠速率的主要因素,构造了一个简单的耦合参数,可以部分地模拟了蛋白质将所需折叠信息集于一身的特性。耦合参数不仅仅是单个因素的简单叠加,还应该捕获了一些因素间的协同机制信息,这也是采用耦合参数形式而不采用多元回归方案的原因。耦合参数方法描绘了一幅多种因素是如何相互纠缠作用,进而影响蛋白质折叠动力学的直观图景,提供了一种可行的认知途径来帮助理解蛋白质折叠机制。参考文献1 NASSAR R,DIGNON G L,RAZ

33、BAN R M,et al.The protein folding problem:the role of theoryJ.Journal of Molecular Biology,2021,433(20):167126.2 MANAVALAN B,KUWAJIMA K,LEE J.PFDB:a standardized protein folding database with temperature correctionJ.Scientific Reports,2019,9(1):1588.图 3 不同模型预测精度的比较Fig.3 Comparison of prediction accu

34、racy of various models108内蒙古工业大学学报(自然科学版)2023 年3 JUMPER J,EVANS R,PRITZEL A,et al.Highly accurate protein structure prediction with AlphaFoldJ.Nature,2021,596(7873):583-589.4 BAEK M,DIMAIO F,ANISHCHENKO I,et al.Accurate prediction of protein structures and interactions using a three-track neural net

35、workJ.Science,2021,373(6557):871-876.5 OUTEIRAL C,NISSLEY D A,DEANE C M.Current structure predictors are not learning the physics of protein foldingJ.Bioinformatics,2022,38(7):1881-1887.6 MOORE P B,HENDRICKSON W A,HENDERSON R,et al.The protein-folding problem:not yet solvedJ.Science,2022,375(6580):5

36、07.7 ROBSON B.De novo protein folding on computers.Benefits and challengesJ.Computers in Biology and Medicine,2022,143:105292.8 HU J L,AMOR D R,BARBIER M,et al.Emergent phases of ecological diversity and dynamics mapped in microcosmsJ.Science,2022,378(6615):85-89.9 THIRUMALAI D.From minimal models t

37、o real proteins:time scales for protein folding kineticsJ.Journal de Physique I,1995,5(11):1457-1467.10 NAGANATHAN A N,MUOZ V.Scaling of folding times with protein sizeJ.Journal of the American Chemical Society,2005,127(2):480-481.11 GARBUZYNSKIY S O,IVANKOV D N,BOGATYREVA N S,et al.Golden triangle

38、for folding rates of globular proteinsJ.Proceedings of the National Academy of Sciences,2013,110(1):147-150.12 LANE T J,PANDE V S.Inferring the rate-length law of protein foldingJ.PLoS One,2013,8(12):e78606.13 IVANKOV D N,FINKELSTEIN A V.Prediction of protein folding rates from the amino acid sequen

39、ce-predicted secondary structureJ.Proceedings of the National Academy of Sciences,2004,101(24):8942-8944.14 ROLLINS G C,DILL K A.General mechanism of two-state protein folding kineticsJ.Journal of the American Chemical Society,2014,136(32):11420-11427.15 徐素杰,吕军,张颖.耦合二级结构数和非局域相互作用预测蛋白质折叠速率 J.内蒙古工业大学学

40、报,2021,40(2):92-100.16 LI Y R,ZHANG Y,LV J.An effective cumulative torsion angles model for prediction of protein folding ratesJ.Protein and Peptide Letters,2020,27(4):321-328.17 PLAXCO K W,SIMONS K T,BAKER D.Contact order,transition state placement and the refolding rates of single domain proteinsJ

41、.Journal of Molecular Biology,1998,277(4):985-994.18 IVANKOV D N,GARBUZYNSKIY S O,ALM E,et al.Contact order revisited:influence of protein size on the folding rateJ.Protein Science,2003,12(9):2057-2062.19 GROMIHA M M,SELVARAJ S.Comparison between long-range interactions and contact order in determin

42、ing the folding rate of two-state proteins:application of long-range order to folding rate predictionJ.Journal of Molecular Biology,2001,310(1):27-32.20 WANG J,PANAGIOTOU E.The protein folding rate and the geometry and topology of the native stateJ.Scientific Reports,2022,12(1):6384.21 KUWAJIMA K.Th

43、e molten globule,and two-state vs.non-two-state folding of globular proteinsJ.Biomolecules,2020,10(3):407.22 郝冬磊.蛋白质单点突变折叠速率改变的统计分析 D.呼和浩特:内蒙古工业大学,2016.23 CHANG L,WANG J,WANG W.Composition-based effective chain length for prediction of protein folding ratesJ.Physical Review E,2010,82(5 Pt 1):051930.

44、24 CASIER R,DUHAMEL J.Blob-based predictions of protein folding times from the amino acid-dependent conformation of polypeptides in solutionJ.Macromolecules,2021,54(2):919-929.25 IVANKOV D N,BOGATYREVA N S,LOBANOV M Y,et al.Coupling between properties of the protein shape and the rate of protein fol

45、dingJ.PLoS One,2009,4(8):e6476.26 LAN P D,KOUZA M,KLOCZKOWSKI A,et al.A topological order parameter for describing folding free energy landscapes of proteinsJ.The Journal of Chemical Physics,2018,149(17):175101.27 BURLEY S K,BHIKADIYA C,BI C X,et al.RCSB protein data bank:celebrating 50 years of the

46、 PDB with new tools for understanding and visualizing biological macromolecules in 3DJ.Protein Science,2022,31(1):187-208.28 TOUW W G,BAAKMAN C,BLACK J,et al.A series of PDB-related databanks for everyday needsJ.Nucleic Acids Research,2015,43(Database issue):D364-D368.29 LAPIDUS L J,EATON W A,HOFRIC

47、HTER J.Measuring the rate of intramolecular contact formation in polypeptidesJ.Proceedings of the National Academy of Sciences,2000,97(13):7220-7225.30 KRIEGER F,FIERZ B,BIERI O,et al.Dynamics of unfolded polypeptide chains as model for the earliest steps in protein foldingJ.Journal of Molecular Bio

48、logy,2003,332(1):265-274.31 VAPNIK V N.The Nature of statistical learning theoryM.New York:Springer,1995.32 B R E I M A N L.R a n d o m f o r e s t s J .M a c h i n e Learning,2001,45(1):5-32.33 BHATIA S,UDGAONKAR J B.Heterogeneity in protein folding and unfolding reactionsJ.Chemical Reviews,2022,122(9):8911-8935.34 CRUZEIRO L,GILL A C,EILBECK J C.Statistical evidence for a helical nascent chainJ.Biomolecules,2021,11(3):357.

展开阅读全文
相似文档
猜你喜欢
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们     诚招英才     服务填表     联系我们

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服