资源描述
同步辐射晶体学衍射同步辐射晶体学衍射董宇辉董宇辉BSRF,IHEP,CAS什么是同步辐射?o接近光速运动的电子或正电子在改变运动方向时放出的电磁辐射,因为是在同步加速器上发现的,所以称为同步辐射。o这种辐射强度高、覆盖的频谱范围广,可以任意选择所需要的波长且连续可调,因此成为一种科学研究的新光源。同步辐射装置示意图Booster储存环储存环三种发光元件弯转磁铁扭摆器(Wiggler)波荡器(undulator)同步辐射的作用同步辐射的作用o同步辐射的加入,大大提高了结构测定的速度。PDB(Protein Data Bank)同步辐射促进了蛋白质结构的解析同步辐射促进了蛋白质结构的解析o1980-1990年,获得解析的蛋白质数量大幅度增加;o1980左右,同步辐射开始应用到蛋白质结构解析中,1990年各种技术趋于成熟,同步辐射大规模应用于生物大分子结构解析。SR vs NMRo80%以上的蛋白质结构由同步辐射晶体学衍射方法解析;o大约15%的结构由NMR(核磁共振)方法得到;o同步辐射解析结构所占的份量在不断的增加。生物学家的评论生物学家的评论o生物大分子结构测定影响了生物学几乎所有的领域。o几乎每个星期都有激动人心的结构发表在如Science和Nature这样的杂志上。o生物大分子晶体学已经比其他任何学科更多地得益于同步辐射的应用。-Steven E.Ealick,Cornell Univ.生物大分子晶体生物大分子晶体o衍射能力很弱:大部分原子为C、N、O、S;o晶体质量差;o相位问题解决困难。同步辐射的高亮度、准直性好、能量可调正好提供了适合的光源为什么要使用同步辐射o高亮度:衍射弱的晶体可以得到好的信号;o准直性好:质量差的晶体可以进行实验;o能量可调:可以进行多波长反常衍射实验(解决全新结构的有效方法)。衍射数据衍射数据MR:CNS,CCP4SIR/MIR/SAD/MAD:Solve/Resolve,shelxd,SnB,CNS,Hyss,OASIS,CCP4,sharp数据处理:数据处理:HKL2000,Automar,mosflm,XDS建模:建模:ARP/wARP,ResolveO,Xtalview模型修正:模型修正:CNS模型检验:模型检验:CNSCCP4解析结构的流程收集衍射数据的目的o确定出准确的结构因子F(hkl)。收集单晶衍射数据的方法o回摆法:最常用o旋进法o魏森堡法回摆法:rotation(oscillation)method入射X光单晶绕某个轴旋转探测器(CCD、IP)晶体的安装方式毛细管:无法冷却毛细管:无法冷却loop:冷却:冷却蛋白质晶体的衍射单晶样品冷冻o使用液氮冷却的干燥空气(防止结冰)来冷冻样品。o实践证明可以大大延长蛋白质晶体耐受同步辐射辐照的时间。o对于花费时间长的实验(如MAD)是必不可少的。o一般用100K的温度就可满足要求。收集衍射数据的策略o是否需要冷冻?o为了减少辐射衰减,需要冷冻。但是冷冻可能导致晶体损坏,往往需要防冻剂(有些晶体生长时使用的沉淀剂本身就有防冻效果)。o防冻剂需要尝试。(花费大量时间和精力的工作!)o不要破坏晶体,不出现冰的衍射(不结冰)。选取冷冻条件o可能晶体本身就有抗冻能力。o安装晶体时尽量减少(生长晶体所用的)母液。o最简单的方法:把母液中部分水替换成甘油或蔗糖。o先找出没有结冰的替换条件,再尝试晶体是否不被破坏。o使用Hampton提供的防冻剂。o使用矿物油。是否为需要的蛋白晶体o生长出来的晶体可能是其他成分,特别是结晶所使用的小分子试剂的晶体(盐晶)。o在衍射上可以判断:蛋白质晶体晶胞很大,起码有几十埃,衍射点很多,盐晶最大只有十几埃,衍射点很少。o蛋白晶体偏光弱,感觉很软(像果冻);盐晶偏光强,感觉很硬(像盐粒)。晶体的单晶性o如果要顺利的解析出结构,晶体的单晶性要好;o仔细观察衍射点的形状和衍射的上限:衍射点要圆而锐利,能达到的衍射上限不要低于3埃,否则结构解析就难了。o出现两个点很靠近的情况要小心:这可能不是单晶(孪晶),也会是晶胞某个轴特别长(移动探测器距离,处理一下衍射图)。一定要排除孪晶的可能性。适合衍射的晶体o得到适合衍射的晶体是一件相当花费时间和精力的任务。o首先要得到大量的纯净蛋白质(分子生物学表达重组蛋白,生化手段纯化);o寻找可能的结晶条件:如用Hampton公司的筛选试剂盒Index,Screen I和Screen II。o优化结晶条件:可能优化的条件很多,如沉淀剂浓度,盐浓度,离子强度,pH值,蛋白浓度等等等等。o得到大量的、衍射能力好的晶体。o筛选合适的防冻剂。o每一步都可能遇上困难。探测器距离的设置o距离近可以收集到的衍射分辨率高,但是衍射点可能重叠(overlap);o距离远可以使信噪比提高,衍射点分辨得好,但是能收集的分辨率降低。o经验:晶体中最长的晶胞长度数值(以埃为单位)=晶体到探测器距离数值(以毫米为单位)。o或者探测器最外面正好达到衍射分辨率上限。o高、低分辨率数据可能要分别收集(如果晶体分辨率极高)。回摆角度、画面张数、曝光时间o回摆角度一般取1度。但是晶胞很大的情况下需要减少角度。不要出现回摆角度过大导致衍射点重叠。o需要收集的画面张数取决于晶体的对称性,至少要覆盖一个独立衍射区。当然在时间许可的情况下,越多越好。o曝光时间取决于晶体衍射能力,尽量使探测器的动态范围得到利用,也要考虑晶体的辐射耐受能力。波长选择o波长越长,衍射强度会大(l3);但是吸收效应不好处理。o同步辐射上还是需要较短的波长,除非反常衍射需要调节特定的波长。o一般的束线能量优化在1埃左右,选择最优强度的波长最好。o短的波长使得衍射点间距减少,可以考虑探测器距离加大一些。晶体尺寸和外形o同步辐射由于强度高,不需要大的晶体。其实太大的晶体不容易冷冻。一般100-200微米即可。o好看的晶体衍射不一定好:衍射说了算。安装晶体的方位o一般不需要考虑:由于处理技术的发展,随机取向的晶体就可以了。o选择特殊取向可以减少衍射盲区(即收集不到的衍射点区域),但是也会导致盲区增加。有时候反常衍射需要选择特殊的取向。o除非有精确调节晶体取向的衍射仪(三圆衍射仪),一圆衍射仪是随机取向装样的。经验表明,一旦晶体取向的某个轴和入射光太接近,会导致数据处理困难。相位问题的解决解决相位问题的主要方法o同晶差值付里叶法o分子置换法o同晶置换法o反常衍射法反常衍射o如果得到的晶体中含有重金属(蛋白本身含有、硒代引入、浸泡重元素引入的都可以),采集数据时就可以考虑作反常衍射。o现在利用单波长反常衍射(SAD)解析结构的数目已经接近或超过MAD。所以多数情况下一个波长的反常衍射已经足够了。MADo选择吸收边附近的几个波长,相当于几个不同的完全同晶的置换。o分子生物学提供了硒代的手段,对于解析全新结构非常有利。波长选择f1f2f3f4四个波长of1:peak,f最大;of2:inflection,f最大;of3:high energy remote;of4:low energy remote。o流行做法:一边收集数据,一边解析结构。一般完成f1数据的收集,进行f2数据收集时就完成相位解析了。数据o同晶置换:I_native(native晶体的衍射强度),I_h(同晶置换晶体的衍射强度);o反常衍射:I+,I-(Friedel对的强度)。寻找重原子位置o同晶置换法得到的晶体可以看成在原有的晶胞内的原子(位置在xi,yi,zi,一共N个)外,加入了某些重原子(位置在xhj,yhj,zhj,一共M个)。oAB*,A*B由于重原子和其他原子之间位置没有相干关系,这一项求和的结果接近于零。所以IH-Inative主要是重原子的贡献。o通过差值patterson图可以得到重原子位置,然后根据F的关系求出native的相位来。o反常衍射也是类似处理:I+和I-主要是反常散射原子的贡献。o得到反常散射中心的位置后,在求解相位。o反常衍射可以看作完全同晶的置换。总结:o同晶置换和反常衍射解相位的一般步骤:o差值Patterson图寻找重原子;o精修重原子位置;o解出相位。oSolve:自动化较好的程序,以上步骤自动完成;oCNS:需要一步一步来进行。S vs Mo单对同晶置换或者单波长反常衍射都存在相位双解问题。以前是利用多对同晶置换或者多波长反常衍射解决的。o现在通过与直接法的结合,不需要这么做了。o直接法可以计算出两个解的概率,选取概率大的那个作为真实解。oSolve:双解中利用sim概率选一个可能性较大的解,得到电子密度图后,利用溶剂平滑改善。oOASIS:再加上cochran概率,选取的解更接近真实解,其结果比solve好。例子:Se-MADo大肠杆菌(escherichia coli,E.coli)的巯基化酶II(thioesterase ii)。oSe-MAD收集了peak,inflection,low energy remote,high energy remote的数据,分辨率为2.5A。o利用solve解决相位问题。solve/resolve软件包o由LANL的Tom Terwilliger开发的解析SAD/MAD/SIR/MIR的软件包。o运行方式:编辑一个script(脚本),里面包含了需要读入的数据文件,格式,需要进行的运算等。script#!/bin/csh-f#setenv CCP4_OPEN UNKNOWNsetenv SOLVEDIR/usr/local/lib/solve#solve solve.logtitle 4-wavelength MAD dataset !a title for this dataset solve.setup !get our standard information read in logfile mad.logfile !write out most information to this file.!summary info will be written to solve.prt mad_atom se !the anomalously scattering atom is selenium refscattfactors !do not refine scattering factors(you can if !you want as long as the data is good)readdenzo !data is from scalepack.Note:for best results !use no merge original index in scalepack !Alternative to readdenzo is readformatted premerged !data have not been merged to the asymm unit !Alternative to unmerged is premerged script lambda 1 !info on wavelength#1 follows label Peak Wavelength !a label for this wavelength rawmadfile./jia_peak.sca !datafile for lambda 1;raw Intensities wavelength 0.9787 !wavelength value fprimv_mad -5.9 !f value at this wavelength fprprv_mad 4.1 !f value at this wavelength o四个波长的数据都输入。of和f的值不用很准确,solve会拟合这两个值。scriptnres 570 !approx#of residues of protein in asymmetric unit nanomalous 8 !approx#of anomalously scattering atoms in a.u.SCALE_MAD !read in and localscale the data ANALYZE_MAD !run MADMRG and MADBST and analyze all the Pattersons SOLVE !Solve the structure Exito这里告诉solve程序的内容包括晶体的空间群(在solve.setup中),数据格式(denzo处理的数据,已经scale过了),数据文件名,蛋白中的氨基酸数目,反常散射原子数目等。o然后运行solve。结果:重原子位置-TOP SOLUTION FOUND BY SOLVE (=0.56;score=48.66)-X Y Z OCCUP B HEIGHT/SIGMA 1 0.239 0.094 0.150 0.536 19.1 27.6 1 0.807 0.423 0.156 0.612 25.4 28.3 1 0.244 0.080 0.098 0.689 32.4 28.1 1 0.800 0.433 0.102 0.646 30.2 27.9 1 0.156 0.410 0.243 0.669 36.3 24.4 1 0.198 0.118 0.251 0.619 36.5 24.4 1 0.613 0.461 0.185 0.771 43.3 24.9 1 0.428 0.060 0.182 0.724 35.9 24.5 TIME REQUIRED TO OBTAIN THIS SOLUTION:33 MIN重原子结构双解o通过Patterson函数得到的重原子(反常散射原子)结构是双解:真实解和对映体的解。(如在solve得出的另一个文件solve_inverse.xyz)。o解决方法是分别给予这两个重原子结构计算相位,比较电子密度图,符合程度好的那个即为正确解。CCP4中的程序abs也可以解决这个问题。相位o相位包含在输出的文件solve.mtz中。o计算的细节输出在一个log文件中,一般设为solve.log(用户定义)。其他软件oshelxd,sharp,CCP4,CNS都可以做同样的工作。o里面涉及的计算方法非常多,很难判断那个方法更好,往往需要在不同阶段使用不同软件。o目前最好的应该是OASIS 2004。相位改进:phase improvemento无论是MR,还是MIR/SIR,MAD/SAD,初始的相位还是很粗糙的。需要做相位改进。o溶剂平滑(solvent flattening)是最有效的方法之一。CCP4的dm程序,resolve,CNS都可以完成这个工作。o可以在solve/resolve的网站下载脚本的例子。谢谢谢谢谢谢谢谢!
展开阅读全文