1、生物信息学课程设计实验报告典型的生物信息学分析182020年4月19日文档仅供参考 搜索感兴趣的基因找出自己想要的基因片段 找出FASTA格式的基因序列,复制下来,保存在文本文档中水稻瘤矮病发生与危害 水稻瘤矮病于1976年在广东湛江地区发现,局部县市危害严重,近年在两广陆续有此病危害的报告,且有逐年加重的趋势,中国广东茂名地区曾大面积发生危害,近年在福建福州以南的一些县零星发生。症状识别 水稻瘤矮病是由电光叶蝉、黑尾叶蝉和二点黑尾叶蝉传播的一种病毒病。病苗明显矮缩,叶色深绿,叶背和叶鞘长有淡黄绿色近球形小瘤状突起,有时沿叶脉连成长 条,叶尖卷转,个别新叶的一边叶缘灰白坏死,形成2-3个缺刻。
2、病株根细弱,抽穗迟、细小、空粒多。 水稻瘤矮病感病植株病原及发病条件 为水稻瘤矮病毒 Rice gall dwarf Virus (RGDV)。病毒粒体球状,直径65nm,由单一粒体组分和十二个片段的双链RNA组成。此病可由电光叶蝉、二条黑尾叶蝉;二点黑尾叶蝉、黑尾叶蝉和 马来亚黑尾叶蝉以持久性方式传播,也能经过二条黑尾叶蝉的卵传给下一代。国内以电光叶蝉和二点黑尾叶蝉为有效介体。二点黑尾叶蝉亦可经卵传播。防治方法:1)治虫防病,力争将传毒媒介昆虫电光叶蝉、二条黑尾叶蝉;二点黑尾叶蝉、黑尾叶蝉和马来亚黑尾叶蝉消灭在传毒前。杀虫药剂可用25%喹硫磷或40%乐果1000-1500倍稀释液,或菊酯类农
3、药5000倍稀释液喷雾。2)及早毁除病株,或踩入泥土,或集中烧毁,以防止蔓延。3)如插后不久发病,还可立即补苗。4)稻株大胎期用“九二0”纯品50000倍稀释液喷雾,使病株提早抽穗,可减轻为害。5)每亩用10%叶蝉散可湿性粉剂200克;或每亩用25%速灭威可湿性粉剂150克;每亩用50%杀螟松乳油 + 40%稻温净乳油各50毫升均加水50千克喷雾 搜索对应的蛋白质序列 Proparam软件分析蛋白质理化性质从分析结果可知:RGDV p8 各个氨基酸所占的比重,如上图。分子质量为47422da,氨基酸数目为426,正负电荷残基总数30/30,分子式为C2126H3316O623S15 ,在M-1
4、 cm-1单位在280海里的水里测量的消光系数为48610和48360,脂肪指数为92.68,组氨酸His (H)最少为 0.5%,丝氨酸含量最多Ser (S) 9.9%。疏水性分析:氨基酸的疏水性=各种氨基酸的疏水性甘氨酸的疏水性疏水性氨基酸在蛋白质的内部,由于其疏水性的像相互作用,在保持蛋白质三级结构的形成和稳定中起着重要的作用。 疏水性分析结果由图可知在P8蛋白C端位置有一个典型的疏水区域。 Bioedit 分析结果跨膜区域分析膜蛋白是一类结构独特的蛋白质,执行着重要的细胞生物学功能。蛋白质序列含有跨膜区,提示她可能作为膜受体起作用,也可能定位在膜上的锚定蛋白或离子通道蛋白。对膜蛋白的跨
5、膜螺旋进行预测是生物信息学的重要应用。 对RGDV P8蛋白使用TMHMM的跨膜区域分析结果1信号肽预测 从分析结果能够看出,剪切位点分值24,信号肽分值为3,综合剪切位点的分值4Coil 区分析 卷曲螺旋主要是控制蛋白质寡聚化的元件,含有卷曲结构的蛋白质主要是一些转录因子 经过分析发现,在P8蛋白在三种不同的窗口下尽然没有非常高的置信值,说明没有卷曲重复序列和七肽重复区。 亚细胞定位 1、经过分析可知最终预测的叶绿体转运肽,线粒体导肽,信号肽的其它类型的分值分别为0.178、0.066,0.148,0.660。信号的定位可能是她们中的最高值。2、“Loc”表示上面分值所预测的可能定位,C表示
6、定位于叶绿体,可能是cTP;M表示定位于线粒体,可能是mTP;S表示分泌通路,即分泌到细胞周质,可能是SP;_表示除前面三处外的其它位置。3、“RC”是可靠性级别,分为五级。表示输出结果最高值与次高值之间的差异大小,具体五级如下:1. Diff0.800;2. 0.800diff0.600;3.0.600diff0.400;4.0.400diff0.200;0.200diff.4.TPlen的预测剪切位点的序列长度。 有结果可知目的蛋白P8的分泌途径为_型,定位在其它细胞器,预测剪切位点序列为0个氨基酸。结构域的分析及motif的搜索 常见的结构域的5种类型:全平行结构域、反平型结构域、结构域
7、、结构域及其它结构域类型。结构域是蛋白质的功能结构和进化单元,结构功能域分析对于蛋白质的结构的分类和预测由重要的作用。结果解读:综合上诉结果可知,RGDV p8蛋白的第1426位之间是个高度保守的结构功能域Phytoerto_P8,即Phytoerto_P8家族成员共有的典型结构域,该结构功能域由多个植物呼肠孤病毒属外层衣壳蛋白P8序列组成,具有结构分子活性。Motif 搜索蛋白质二级结构预测预测结果如下:CCHHHHHHHHHHHHHHHHHEEECCCCCEEEEEHCCHHHHHHHHHHHEEHCCCECCCCCCCHHHHHHHHHHHHCCHHHHHHHECCCCCCCCCCCCC
8、CCCCHHHHEECCCCCCCCHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCHHHHHHCCCCCCCHHHHHHCCCCCHHHHCCCEEEECCCEEEEEECCCCCCCCCCEEEECCCCHHEEEECCEEEEEECCCCCEEEEEEEEEEECCCCCEEEEEECCCCCCCCCCCCCEEEEECCCCEEEEEEEECCCCEEEEEECCEEEEECCCCCEEEEEEEEECCCECCCCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEECCHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHCCEECCC 其中C表示coil无规则卷曲,H表示heilx(-螺旋),E表示extended(折叠)蛋白质三级结构预测同源建模三级结构预结果对三级结构的全局模式质量分析和局部模式质量分析,分析的结果