1、D O I:1 0.3 9 6 9/j.i s s n.1 0 0 3-0 9 7 2.2 0 2 4.0 1.0 1 2 文章编号:1 0 0 3-0 9 7 2(2 0 2 4)0 1-0 0 7 2-0 9禾谷炭疽菌中剪接因子S R蛋白的生物信息学分析及基因克隆张艺美,代亚锋,叶云英,陈 震,宫安东*(信阳师范大学 生命科学学院/河南省茶树生物学重点实验室,河南 信阳4 6 4 0 0 0)摘 要:S e r i n e/a r g i n i n e-r i c h(S R)蛋白参与前体mR NA剪接及mR NA代谢等多种生理生化活动。以裂殖酵母(S c h i z o s a c c
2、 h a r o m y c e sp o m b e)中两个典型S R蛋白序列为基础,利用B l a s t p和关键词对禾谷炭疽菌蛋白质数据库进行比对分析,明确该菌中具有2个S R蛋白C g S r p 1和C g S r p 2;通过S MA R T保守结构域分析,明确C g S r p 1和C g S r p 2蛋白的N端都含有R NA识别结构域,C端含有丝氨酸/精氨酸二肽序列;利用N C B I中B L A S T p程序与其他物种进行相似性分析,构建系统进化树,并通过氨基酸序列比对发现S R蛋白在植物和真菌之间的差异性;同时,通过对C g S r p 1和C g S r p 2蛋白
3、的理化性质、疏水性、亚细胞定位及二、三级结构等进行生物信息学分析,明确C g S r p 1和C g S r p 2都是亲水性蛋白质,二者均定位于细胞核,含有螺旋、折叠和无规则卷曲三种结构;以野生型禾谷炭疽菌C g M 2为模板,成功克隆了C g S R P1和C g S R P2基因片段,明确C g M 2存在C g S R P1和C g S R P2基因。关键词:禾谷炭疽菌;S R蛋白;剪接因子;生物信息学;基因克隆中图分类号:S 4 3 2.1 文献标识码:A开放科学(资源服务)标识码(O S I D):B i o i n f o r m a t i c sA n a l y s i s
4、o nS p l i c i n gF a c t o rS RP r o t e i na n dG e n eC l o n i n g i nC o l l e t o t r i c h u mG r a m i n i c o l aZ H A N GY i m e i,D A IY a f e n g,Y EY u n y i n g,C H E NZ h e n,G O N GA n d o n g*(C o l l e g eo fL i f eS c i e n c e s/H e n a nK e yL a b o r a t o r yo fT e aP l a n tB
5、 i o l o g y,X i n y a n gN o r m a lU n i v e r s i t y,X i n y a n g4 6 4 0 0 0,C h i n a)A b s t r a c t:S e r i n e/a r g i n i n e-r i c h(S R)p r o t e i n,a sas p l i c i n gf a c t o r,p l a y sac r u c i a l r o l e i nm a n yp h y s i o l o g i c a la n db i o c h e m i c a l p r o c e s s
6、 e s,e s p e c i a l l y i np r e c u r s o rmR NAs p l i c i n ga n dmR NAm e t a b o l i s m.B a s e do n t w o t y p i c a lS Rp r o t e i ni nS c h i z o s a c c h a r o m y c e sp o m b e,t os e a r c h S R p r o t e i ns e q u e n c ef r o m t h ep r o t e i n d a t a b a s eo fC o l l e t o t
7、 r i c h u mg r a m i n i c o l aw i t hB l a s t pa n dk e y w o r d s,t w oS Rp r o t e i n sC g S r p 1a n dC g S r p 2w e r ei d e n t i f i e di nC o l l e t o t r i c h u mg r a m i n i c o l a.C g S r p 1a n dC g S r p 2c o n t a i nt h eN-t e r m i n a lR NA R e c o g n i t i o n M o t i fd
8、o m a i na n ds e r i n e/a r g i n i n ed i p e p t i d e st o w a r d st h eC-t e r m i n u s w i t h S MA R T a n a l y s i s.B L A S T pi n N C B I w a su s e dt op e r f o r mh o m o l o g ya n a l y s i sa n dc o n s t r u c tp h y l o g e n e t i ct r e e s w i t ho t h e rs p e c i e s.S e q
9、 u e n c ev a r i a t i o no fS Rp r o t e i n sw a sd i s c o v e r e db e t w e e np l a n t sa n d f u n g i b ya m i n oa c i d s a l i g n m e n t.M e a n w h i l e,b i o i n f o r m a t i c s a n a l y s i so nS Rp r o t e i nw a sm a d e i n c l u d i n g t h ep h y s i c a l a n dc h e m i c
10、 a l p r o p e r t i e s,h y d r o p h o b i c i t y,s u b c e l l u l a r l o c a l i z a t i o n,t h es e c o n d a r ya n dt e r t i a r ys t r u c t u r e.I t i ss h o w e dt h a tC g S r p 1a n dC g S r p 2w e r eh y d r o p h i l i cp r o t e i n s,b o t ho f t h e m 收稿日期:2 0 2 1-1 0-2 5;修回日期:
11、2 0 2 3-0 5-2 3;*.通信联系人,E-m a i l:x y n u y m1 6 3.c o m;g o n g a d x y n u.e d u.c n 基金项目:国家自然科学基金项目(2 2 2 0 8 2 7 6);河南省科技计划项目(2 3 2 1 0 2 1 1 0 2 0 2,2 1 2 1 0 2 1 1 0 4 7 7);河南省自然科学基金项目(2 2 2 3 0 0 4 2 0 5 1 9)作者简介:张艺美(1 9 8 8),女,河南漯河人,讲师,博士,主要从事真菌致病机制研究;宫安东(1 9 8 4),男,山东威海人,副教授,博士,主要从事微生物的功能筛选
12、、代谢产物分析及作用机制研究。引用格式:张艺美,代亚锋,叶云英,等.禾谷炭疽菌中剪接因子S R蛋白的生物信息学分析及基因克隆J.信阳师范学院学报(自然科学版),2 0 2 4,3 7(1):7 2-8 0.Z HAN GY i m e i,D A IY a f e n g,Y E Y u n y i n g,e ta l.B i o i n f o r m a t i c sA n a l y s i so nS p l i c i n gF a c t o rS RP r o t e i na n dG e n eC l o n i n gi nC o l l e t o t r i c h
13、 u m G r a m i n i c o l aJ.J o u r n a lo fX i n y a n g N o r m a l U n i v e r s i t y(N a t u r a lS c i e n c eE d i t i o n),2 0 2 4,3 7(1):7 2-8 0.27信阳师范学院学报(自然科学版)J o u r n a l o fX i n y a n gN o r m a lU n i v e r s i t y第3 7卷 第1期 2 0 2 4年1月N a t u r a l S c i e n c eE d i t i o nV o l.3 7
14、N o.1J a n.2 0 2 4l o c a t e d i nt h en u c l e u sa n dc o n t a i n e d-h e l i x s,-s h e e t sa n dr a n d o mc o i l.C g S R P1a n dC g S R P2g e n ef r a g m e n t sw e r es u c c e s s f u l l yc l o n e du s i n gw i l d-t y p eC o l l e t o t r i c h u mg r a m i n i c o l aC g M 2D NAa s
15、t e m p l a t e,i n d i c a t i n gt h ep r e s e n c eo fC g S R P1a n dC g S R P2g e n e s i nC g M 2.K e yw o r d s:C o l l e t o t r i c h u mg r a m i n i c o l a;S Rp r o t e i n;s p l i c i n gf a c t o r;b i o i n f o r m a t i c s;g e n ec l o n i n g0 引言玉米是我国三大主粮之一,其种植面积和总产量仅次于水稻和小麦,在保证我国粮
16、食安全方面发挥着不可替代的作用。近年来,随着气候和农耕方式的变化,玉米炭疽病(M a i z ea n t h r a c n o s e)已成为威胁全球粮食安全的新兴病害1。玉米炭疽病是一种真菌性病害,在玉米种植区普遍发生,早期主要危害玉米叶片,出现梭形病斑,后期病斑融合致叶片枯死;发病严重时,危害茎秆,引起玉米茎基腐,造成玉米大量减产2。禾谷炭疽菌(C o l l e t o-t r i c h u mg r a m i n i c o l a)是引起玉米炭疽菌病的病原物,该病菌还能侵染小麦、高粱等禾本科作物引起炭疽 病,给各国农 业生产造成 巨大的经 济损失3-4。目前对玉米炭疽病的防治
17、主要依赖苯并咪挫类化学药剂,而化学防治易带来病原抗药性、农药残留和环境污染等问题5。从长远角度考虑,深入解析禾谷炭疽菌致病相关因子,可以为开发安全有效的新型药剂提供特异性靶标,为作物抗病育种提供新理论依据和思路。前体mR NA剪接是真核生物大多数基因表达的基础,并且可变剪接使单一基因产生多样蛋白,丰富 了 高 等 真 核 生 物 的 蛋 白 多 样 性6。S R(s e r i n ea n da r g i n i n e-r i c h)蛋 白 对 真 核 生 物 前 体mR NA的组成型剪接及可变型剪接都起重要作用7。S R蛋白是一类具有高度保守结构域的剪接因子,N端 含 有 一 个 或
18、 两 个R NA识 别 结 构 域(R NAr e c o g n i t i o nm o t i f,R RM),C端含有重复数量不同、排列可变的精氨酸/丝氨酸二肽结构域(A r g i n i n e/S e r i n er i c hd o m a i n)8。剪接复合体E的形成依赖S R蛋白和外显子加强子(E S E)的互作9-1 0;复合体E转变为复合体A主要是通过R S结构域和磷酸二酯骨架的非特异性结合,进而促进U 2s n R N P和分支点序列碱基的紧密结合1 1。S R蛋白 在 复 合 体A招 募U 4/U 6-U 5三 联 体 形 成“B-l i k e”复合体以及复合
19、体C的活性催化方面都有作用1 2-1 3。同时,S R蛋白还调节转录的延伸以及剪切和转录的共偶联活动1 4-1 6。除此之外,S R蛋白还参与mR NA的其他代谢活动,如mR NA的核输出,mR NA的衰减和翻译等1 7。在真菌中,目前关于S R蛋白的研究相对较少。酿酒酵母的S R蛋白N p l 3是减数分裂时期调控基因剪接所必需的,并且对于减数分裂细胞周期的正确执行是必不可少的1 8。F g S g h 1和F g S r p 1都能调控禾谷镰刀菌的生长、分生孢子的产生、植物侵染及mR NA的剪接1 9-2 0。在模式生物稻瘟菌中,M o S r p 1的缺失导致病原菌生长速率减慢、产孢量下
20、降、分生孢子畸形、致病力显著下降等表现及菌丝时期上千基因的可变剪接发生异常并进一步发现M o S r p 1直接结合R NA的GUAG基序2 1。作为全球十大植物病原真菌,炭疽菌属寄主 广 泛,可 侵 染 多 种 重 要 粮 食 作 物 和 经 济 作物2 2-2 3。迄今为止,在炭疽属真菌中还未发现关于S R蛋白家族的生物信息学研究报道,严重制约S R蛋白的功能研究。裂殖酵母(S c h i z o s a c c h a r o m y c e sp o m b e)作为真核模式生物,体内存在2个S R蛋白2 4-2 5。本研究基于裂殖酵母2个S R蛋白的氨基酸序列,利用禾谷炭疽菌的蛋白数
21、据库通过B l a s t p比对分析及关键词搜索,获得与裂殖酵母S R蛋白同源的序列,并通过生物信息学分析明确保守结构域、理化性质、疏水性、二级和三级结构预测、亚细胞定位及核定位信号预测等特征,为进一步开展禾谷炭疽菌中S R蛋白的功能研究、同属炭疽菌但其基因组序列尚未公布的其他炭疽菌的研究,提供重要的理论指导。1 材料与方法1.1 材料数据库 信 息:根 据 真 菌 模 式 生 物 裂 殖 酵 母S c h i z o s a c c h a r o m y c e sp o m e数据库(h t t p:/f u n g i.e n s e m b l.o r g/S c h i z o
22、s a c c h a r o m y c e s_p o m b e/I n f o/I n d e x)中含有的2个经典S R蛋白氨基酸序列,利用禾谷炭疽菌C o l l e t o t r i c h u m g r a m i n i c o l a蛋白质数据库(h t t p:/f u n g i.e n s e m b l.o r g/C o l l e t o t r i c h u m_gr a m i n i c o l a/I n f o/I n d e x)在 线B l a s t p比对,参数选择为默认值,获得C o l l e t o t r i c h u mg r
23、 a m i n i c o l a中含有的S R蛋白,明确此菌内编码37张艺美,代亚锋,叶云英,等.禾谷炭疽菌中剪接因子S R蛋白的生物信息学分析及基因克隆S R蛋白的基因登录号和蛋白登录号信息。真菌菌株:禾谷炭疽菌C g M 2(C o l l e t o t r i c h u mg r a m i n i c o l a)由信阳师范学院生命科学学院应用与环境微生物学实验室提供,存于-8 0冰箱。P D A培养基:土豆2 0 0g,葡萄糖2 0g,琼脂1 5g,U P水定容至1L,用于禾谷炭疽菌的培养。C T A B提取液:C T A B8g,0.5m o l/LE D T A(p H
24、8.0)1 6m L,0.5m o l/LT r i s-HC l(p H 8.0)8 0m L,N a C l 3 2.7 2g,U P水定容至4 0 0m L。引物设计与合成:参考h t t p s:/f u n g i.e n s e m b l.o r g/C o l l e t o t r i c h u m_g r a m i n i c o l a/I n f o/I n d e x数 据 库 的 序 列 信 息,设 计C g S R P1和C g S R P2基因序列的特异性引物。引物由安徽通用生物股份有限公司合成。1.2 方法1.2.1 保守结构域预测利用S MA R T网站
25、在线分析禾谷炭疽菌中S R蛋白 所 具 有 的 保 守 结 构 域 特 征,同 时,利 用C l u s t a l X对上述S R蛋白进行保守结构域分析。1.2.2 系统进化树构建为了分析C g S R P1和C g S R P2基因的系统进化,利用N C B I数据库进行蛋白序列比对,在果生炭疽菌(C o l l e t o t r i c h u mf r u c t i c o l a)、粗糙脉孢菌(N e u r o s p o r ac r a s s a)、球 孢 白 僵 菌(B e a u v e r i ab a s s i a n a)、禾谷镰刀菌(F u s a r i
26、u mg r a m i n e a r u m)、黑曲霉(A s p e r g i l l u sn i g e r)、构巢曲 霉(A s p e r g i l l u sn i d u l a n s)、粟 酒 裂 殖 酵 母(S c h i z o s a c c h a r o m y c e s p o m b e)、禾 柄 锈 菌(P u c c i n i a g r a m i n i s)、玉 米 黑 粉 菌(U s t i l a g om a y d i s)等 真 菌 蛋 白 数 据 库 及 小 麦(T r i t i c u ma e s t i v u m)、水
27、稻(O r y z as a t i v a)、高粱(S o r g h u mb i c o l o r)和玉米(Z e am a y s)等植物蛋白数据库中分别 找 到C g S r p 1和C g S r p 2的 同 源 蛋 白,利 用ME GA 7软件建立C g S r p 1和C g S r p 2系 统 进 化树,多序列比对采用C l u s t a l W,构建进化树采用N e i g h b o r-J o i n i n gT r e e。1.2.3 蛋白质理化性质预测利用蛋白质数据库(h t t p:/www.e x p a s y.c h/t o o l s/p r o
28、 t p a r a m.h t m l)在线对禾谷炭疽菌中S R蛋白的分子质量、等电点及氨基酸组成等特征进行分析预测。1.2.4 蛋白质疏水性预测利用P r o t s c a l e程序(h t t p:/w e b.e x p a s y.o r g/p r o t s c a l e)对禾谷炭疽菌中S R蛋白在线分析。1.2.5 蛋白质亚细胞定位分析利用C e l l-P L o c(h t t p:/www.c s b i o.s j t u.e d u.c n/b i o i n f/C e l l-P L o c-2/)对禾谷炭疽菌中的S R蛋白进行在线亚细胞定位预测;并利用核定
29、位预测网站N L S t r a d a m u s(h t t p:/www.m o s e s l a b.c s b.u t o r o n t o.c a/N L S t r a d a m u s/)对S R蛋白进行在线分析。1.2.6 蛋白质二、三级结构预测利用P S I P R E D(h t t p:/b i o i n f.c s.u c l.a c.u k/p s i p r e d/)在线预测禾谷炭疽菌中S R蛋白的二级结构;利用P h y r e 2(h t t p:/www.s b g.b i o.i c.a c.u k/p h y r e 2/h t m l/p a
30、 g e.c g i?i d=i n d e x)预测S R蛋白的三级结构,并用P D B(h t t p s:/www.r c s b.o r g/#C a t e g o r y-v i s u a l i z e)对S R的三级结构的预测结果进行3 D视图。1.2.7 C g M 2基因组D NA的提取将存于-8 0 冰箱的C g M 2活化于P D A平板上,2 8 静置培养4d后,挑取气生菌丝到6 5 0LC T A B中,加入等体积的C I溶液(氯仿和异戊醇的体积比为2 41)和钢珠1粒打磨菌丝。待菌丝充分打磨后,1 20 0 0r/m i n离心7m i n,吸取上清液到1.5
31、m L无菌离心管内,并加入5 0L的3m o l/LN a A c和5 0 0L的异丙醇,混匀后静置3 0m i n,1 20 0 0r/m i n离心1 0m i n,弃上清,加入5 0 0L7 5%的乙醇洗涤沉淀,离心弃上清,通风条件下吹干沉淀,加入5 0L无菌水将白色沉淀溶解,此即禾谷炭疽菌C g M 2的基因组D NA,存于-2 0冰箱备用。1.2.8 C g S R P1和C g S R P2基因的克隆用p r i m e r 5软 件 设 计 克 隆C g S R P1和C g S R P2基因的引物,其引物序列见表4。以1.2.7步骤中 提 取 的C g M 2基 因 组D NA
32、为 模 板,以C g S R P1-F/R和C g S R P2-F/R为 引物分别扩 增C g S R P1和C g S R P2基因片段。2 结果与分析2.1 禾谷炭疽菌中含有2个S R蛋白通过比对禾谷炭疽菌蛋白质数据库,发现该菌中存在2个候选的S R蛋白,其I D分别是G L R G_0 9 2 0 5-1和G L R G_0 8 7 6 0-1(表1)。根据S.p o m e中S R蛋 白 的 命 名 规 则 分 别 将 禾 谷 炭 疽 菌 中G L R G_0 9 2 0 5和G L R G_0 8 7 6 0命名为C g S r p 1和C g S r p 2。经过S MA R T
33、分析和与裂殖酵母S R蛋白序列比对发现,C g S r p 1蛋白序列的N端含有一47第3 7卷 第1期信阳师范学院学报(自然科学版)h t t p:/j o u r n a l.x y n u.e d u.c n2 0 2 4年1月个保守的R NA结合结构域,C端含有丝氨酸/精氨酸二肽结构域(图1,表1);C g S r p 2蛋白序列的N端含有2个保守的R NA结合结构域,C端含有2个精氨酸/丝氨酸区二肽结构域(图1,表1)。2.2 2个S R蛋白系统进化树及差异序列分析通过C g S r p 1和C g S r p 2的系统进化树发现,禾谷炭疽菌与同是炭疽菌属的果生炭疽菌亲缘关系最近,与
34、担子菌门的玉米黑粉菌亲缘关系较远,与植物的亲缘关系最远(图2 a和2 b)。通过蛋白序列分析发现,S R蛋白在上述几个物种中较为保守,特别是R NA结合结构域高度保守,在不同中物种序列基本一致,这与S R蛋白能识别结合R NA,促进前体mR NA的剪接功能相符合。尽管S R蛋白在不同物种中其序列有较高的相似性,但在真菌和植物内其序列还存在一定的差异性。红色方框内分别显示S r p 1和S r p 2蛋白序列在真菌中是一样的,但与植物的序列存在较大差异或在植物中不存在类似的序列(图2 c和2 d)。图1 禾谷炭疽菌中S R蛋白保守结构域分析F i g.1 C o n s e r v e dd o
35、 m a i no fS Rp r o t e i n i nC o l l e t o t r i c h u mg r a m i n i c o l a表1 禾谷炭疽菌中S R蛋白基本信息及保守结构域分布T a b.1 B a s i c i n f o r m a t i o na n dc o n s e r v e dd o m a i nd i s t r i b u t i o no fS Rp r o t e i ni nC o l l e t o t r i c h u mg r a m i n i c o l a数据库中I D蛋白质I D蛋白长度结构域名称结构域位置E值名
36、称G L R G_0 9 2 0 5-1E F Q 3 4 0 6 11 9 5a aR RM78 0a a1.61 0-3C g S R P 1G L R G_0 8 7 6 0-1E F Q 3 3 4 8 13 1 2a aR RM 187 3a a3.5 21 0-1 0R RM 21 0 41 7 3a a4.21 0-8C g S R P 2 注:a.S r p 1的系统进化树;b.S r p 2的系统进化树;c.S r p 1的在真菌和植物之间的显著差异序列;d.S r p 2的在真菌和植物之间的显著差异序列。图2 S R蛋白系统进化树及真菌与植物S R蛋白差异位点分析F i g
37、.2 P h y l o g e n e t i c t r e ea n da n a l y s i so fd i f f e r e n t s e q u e n c e s i nf u n g i a n dp l a n t so fS Rp r o t e i n57张艺美,代亚锋,叶云英,等.禾谷炭疽菌中剪接因子S R蛋白的生物信息学分析及基因克隆2.3 蛋白质理化性质分析对C o l l e t o t r i c h u mg r a m i n i c o l a中的2个S R蛋白的理化性质预测发现,因C g S r p 1和C g S r p 2所含氨基酸数目不同,
38、它们的相对分子质量、分子式及原子数量均差别较大。二者相比,含氨基酸数量较多的C g S r p 2相对分子质量、原子数量最大。C g S r p 1和C g S r p 2的理论等电点分别是9.3 2和9.3 8,均属于碱性氨基酸,而蛋白质内正负电荷氨基酸残基数量的多少影响等电点,当正电荷氨基酸残基多于负电荷氨基酸残基时,其等电点偏向于碱性(表2)。C g S r p 1和C g S r p 2的半衰期均为3 0h,尽管两个S R蛋白的稳定系数相差较大,但均大于4 0,都属于不稳定蛋白;总平均亲水性均为负值(表2),表明C g S r p 1和C g S r p 2均属于亲水性蛋白。表2 禾谷
39、炭疽菌中S R蛋白的基本理化性质T a b.2 B a s i cp h y s i c a l a n dc h e m i c a l p r o p e r t i e so fS Rp r o t e i n i nC o l l e t o t r i c h u mg r a m i n i c o l a名称相对分子质量/k D a理论等电点正电荷残基数目负电荷残基数目分子式半衰期/h不稳定系数脂肪系数总平均亲水性C g S r p 12 3.0 0 38 89.3 24 74 3C9 6 1H1 5 1 7N3 3 9O3 1 8S33 07 5.3 53 4.6 2-1.7
40、4 5C g S r p 13 5.9 2 66 09.3 85 75 0C1 5 6 3H2 3 8 9N4 9 3O4 7 6S73 04 8.1 43 8.7 8-1.3 1 62.4 蛋白质疏水性分析利用P r o t s c a l e程序分别对C g S r p 1和C g S r p 2蛋白进 行疏水性分 析,氨基酸标 度选择默 认的H p h o b./K y t e&D o o l i t t l e,计算窗口数值设置为9,采用线性加权模型,输出结果显示C g S r p 1中位于1 3 0位的精氨酸(R)亲水性最强,4 7位的亮氨酸(L)疏水性最强;C g S r p 2中
41、位于2 3 1位的丝氨(S)亲水性 最 强,1 6 9位 的 精 氨 酸(R)疏 水 性 最 强;C g S r p 1、C g S r p 2的 亲 水 性 氨 基 酸 总 和 分 别 为-3 4 6.6 4 2、-4 1 5.8 0 7;疏水性氨基酸总和分别为8.2 7 6、1 2.8 6 6(图3)。C g S r p 2蛋白的总平均亲水性是-1.7 3 5。尽管C g S r p 1和C g S r p 2在亲水性最强氨基酸、疏水性最强氨基酸、亲水性氨基酸残基数值总和、疏水性氨基酸残基数值总和等结果不相同,但它们均为亲水性蛋白。经计算,C g S r p 1和C g S r p 2蛋
42、白 的 总 平 均 亲 水 性 分 别 是-1.7 3 5、-1.2 9 1,与利用p r o t p a r a m程序计算的结果-1.7 4 5、-1.3 1 6相近,说明此分析结果可信度较高。图3 禾谷炭疽菌S R蛋白疏水性情况F i g.3 H y d r o p h o b i c i t yo fS Rp r o t e i n i nC o l l e t o t r i c h u mg r a m i n i c o l a2.5 亚细胞定位及核定位信号分析将S R蛋白的f a s t a格式的氨基酸序列提交到C e l l-P L o c 2.0的E u k-m P L o
43、 c 2.0内,结 果 显 示C g S r p 1和C g S r p 2均定位于细胞核。进一步利用核定位信号预测网站N L S t r a d a m u s在线预测S R蛋白内的核定位信号,将P r e d i c t i o nC u t o f f设置为0.9,C g S r p 1蛋白序列的1 0 11 1 8A P R R S S P R R GR S P S P R R S是核定位信号。将P r e d i c t i o nC u t o f f设 置 为0.5,C g S r p 1蛋 白 序 列 的9 51 5 4G R D R E R A P R R S S P R R
44、 G R S P S P R R S T R D Y S P KKD D R R D R D R D Y D R S D R R D T R E R S R S P D R R是核定 位 信 号。将P r e d i c t i o n C u t o f f设 置 为0.5,C g S r p 2蛋白序列的1 8 81 9 8A R S R S P G G G R R是核定位信号,P r e d i c t i o nC u t o f f设置为0.9时,没有核定位序列,说明C g S r p 1具有更强的核定位信号,其蛋白定位很可能定位在细胞核。2.6 S R蛋白的二级结构中无规则卷曲所占
45、比例较高利用P S I P R E D在线预测S R蛋白的二级结构,发现C g S r p 1蛋白有3个螺旋、5个折叠和一些无规则卷曲结构(图4 a);C g S r p 2蛋白有4个螺旋、9个折叠和一 些无规则卷 曲结构(图4 b)。分析发现,在C g S r p 1蛋白中,螺旋和折叠所占比例都是1 2.8%,无规则卷曲结构较多,占比为7 4.4%(图4 c);螺旋占C g S r p 2的氨基酸比例是1 2.5%,折叠所占比例是1 4.1%,无规则卷67第3 7卷 第1期信阳师范学院学报(自然科学版)h t t p:/j o u r n a l.x y n u.e d u.c n2 0 2
46、 4年1月曲结构较多,所占比例为7 3.4%(图4 c)。结果表明,虽然C g S r p 1和C g S r p 2的氨基酸长度不相同,但螺旋、折叠和无规则卷曲等二级结构所占比例相差不大。注:a.C g S r p 1的二级结构情况;b.C g S r p 2的二级结构情况;c.C g S r p 1和C g S r p 2所含的螺旋、折叠和无规则卷曲在各自二级结构中所占比例情况。图4 禾谷炭疽菌S R蛋白二级结构特征F i g.4 T h e s e c o n d a r y s t r u c t u r ec h a r a c t e ro f t w oS Rp r o t e
47、i n s i nC o l l e t o t r i c h u mg r a m i n i c o l a2.7 S R蛋白的三级结构用P h y r e 2预测C g S r p 1和C g S r p 2的三级结构,图5分别是C g S r p 1的第21 1 2位氨基酸的三级结构图,置信值是9 9.9%;和C g S r p 2的第51 7 9位氨基酸三级结构图,置信值是1 0 0%,其余的氨基酸 是 无 序 区 域,不 能 预 测 其 三 级 结 构。用P D B对C g S r p 1和C g S r p 2的 三 级 结 构 进 行3 Dv i e w发现,C g S r
48、p 1蛋白有3个螺旋、6个折叠和一些无规则卷曲结构,C g S r p 2蛋白有5个螺旋、9个折叠和一些无规则卷曲结构。C g S r p 2氨基酸残基的第9 0、9 1位都是天冬酰胺,这二者之间的连接方式未能预测出来,因此,C g S r p 2三级结构展示图是不连续的两个区域(图5)。注:C g S r p 1的三维坐标是:X:4 7.9 4 3,Y:4 0.8 5 1,Z:3 7.5 1 0;C g S r p 2的三维坐标是:X:7 7.8 7 3,Y:4 1.6 3 6,Z:5 9.9 0 0;蛋白质N端到C端的顺序依彩虹颜色而定。图5 禾谷炭疽菌S R蛋白三维模型F i g.5 T
49、 h e t h r e ed i m e n s i o n sm o d e l o fS Rp r o t e i n s i nC o l l e t o t r i c h u mg r a m i n i c o l a77张艺美,代亚锋,叶云英,等.禾谷炭疽菌中剪接因子S R蛋白的生物信息学分析及基因克隆2.8 C g S R P1和C g S R P2的基因克隆以C g M 2为 模 板,分 别 以C g S R P1-F/R和C g S R P2-F/R为 引 物P C R扩 增C g S R P1和C g S R P2的基因片段,此片段包括基因5 和3 端的转录非编码序列(
50、表3)。琼脂糖凝聚电泳结果显示,P C R扩增出来的C g S R P1和C g S R P2基因片段大小与预期一致,如图6所示,经D NA测序验证扩增出来的基因片段序列与禾谷炭疽菌数据库 中 的 碱 基 序 列 是 一 致 的(h t t p s:/f u n g i.e n s e m b l.o r g/C o l l e t o t r i c h u m_g r a m i n i c o l a/I n f o/I n d e x),说明禾谷炭疽菌基因组中存在C g S R P1和C g S R P2基因。表3 引物信息T a b.3 P r i m e r i n f o r m