资源描述
实验名称:蛋白质构造与功能生物信息学研究
实验目:1.掌握运用BLAST工具对指定蛋白质氨基酸序列同源性搜索办法。
2.掌握用不同工具分析蛋白质氨基酸序列基本性质
3掌握蛋白质氨基酸序列进行三维构造分析
4.熟悉对蛋白质氨基酸序列所代表蛋白修饰状况、所参加代谢途径、互相作用蛋白,以及与疾病有关性分析。
实验办法和流程:
一、 同源性搜索
同源性从分子水平讲则是指两个核酸分子核苷酸序列或两个蛋白质分子氨基酸序列间相似限度。BLAST工具能对生物不同蛋白质氨基酸序列或不同基因DNA序列极性比对,并从相应数据库中找到相似或相似序列。对指定蛋白质氨基酸序列进行同源性搜索环节如下:
↓
登录网址
↓
输入序列后,运营blast工具
↓
序列比对图形成果显示
序列比对图形成果:用相似性区段(Hit)覆盖输入序列范畴判断两个序列相似性。如果图形中包括低得分颜色(重要是红色)区段,表白两序列并非完全匹配。
↓
匹配序列列表及得分
可选取不同比对工具
各序列得分
备注: Clustal是一款用来对()软件。可以用来发现特性序列,进行蛋白分类,证明序列间同源性,协助预测新序列二级构造与三级构造,拟定PCR引物,以及在分子进化分析方面均有很大协助。Clustal涉及Clustalx和Clustalw(前者是图形化界面版本后者是命令界面),是生物信息学惯用多序列比对工具。
该序列比对成果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.
↓
详细比对序列排列状况
第一种序列匹配率为100%
第一种匹配序列
Score表达打分矩阵计算出来值,由搜索算法决定,值越大阐明匹配限度
越大。
Expect是输入序列被随机搜索出来概率,该值越小越好。
Identities是相似限度,即匹配率,100%表达序列所有匹配。
Method:代表不同打分矩阵办法,选取不同打分矩阵会得到不同打提成果。
显示成果按越背面匹配率越低。
二、 分析蛋白质氨基酸序列基本性质
ProParam是计算氨基酸理化参数惯用工具,提供计算蛋白质分子量、理论等电点、氨基酸构成、原子构成、消光系数(extinction coefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。
↓
登录网址:并输入序列号
↓
↓
蛋白质氨基酸构成、相对分子质量、等电点和原子构成。
成果1:该蛋白质序列氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子构成,共有19180个原子。
↓
消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)
成果2:消光系数反映了蛋白在特定波长下吸取可见光或不可见光能力,可用来测蛋白浓度。由上图知,该序列在280nm波长下,假设所有成对半胱氨酸残基形成胱氨酸,则该序列消光系数1.003;假设所有半胱氨酸残基都减少了,改序列消光系数为0.976。半衰期为30小时(哺乳动物网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,提示该蛋白质不稳定。脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质热稳定性,为82.35. 蛋白质疏水性预测可以依照GRAVY值来预测。GRAVY值范畴在2 与-2之间,正值表白此蛋白为疏水性蛋白,负值表白为亲水蛋白。该蛋白GRAVY值为-0.247,因而预测该蛋白为亲水蛋白。
↓
运用ProtScale工具对蛋白质进行亲疏水性分析
↓
登录网址并输入序列号
↓
↓
GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸标度值。Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高打分值(>0值表达疏水性,<0值表达亲水性。从图可看出,标度值<0区域比>0较为密集,因而,结合上面GRAVY值为-0.247,预测该蛋白为亲水蛋白。
↓
运用TMPred工具对该蛋白进行跨膜区构造预测
登录网址
↓
最优拓扑构造:2种模型都预测有4个蛋白质跨膜区。
↓
用TMHMM预测与否存在跨膜区
登录网址
↓
↓
成果
提示有2个蛋白质跨膜区。其跨膜区比TMpred预测成果少了2个。少了序列前面2个位置跨膜区。
三、 蛋白质三维构造分析
↓
登录网址,输入相应序列号
↓
↓
建模某些成果
↓
有A、B、C、D四条晶体构造单链阵线。
四、蛋白质序列修饰状况、所参加代谢途径、互相作用蛋白,以及与疾病有关性分析
↓
登录
在database里面找到string工具。
↓
↓
输入序列号
↓
成果:
所输入序列代码。
所输入序列代码
互相作用蛋白网络图
序列基本信息
由成果可知,该蛋白质序列互相作用蛋白有10个。所输入序列代码为ERBB2。依照基本信息可知,ERBB2是表皮生长因子受体( EGFR)家族成员之一
是白血病病毒致癌基因同族体2。蛋白酪氨酸激酶(ERBB2基因表达产物)是几种细胞表面受体复合物一某些,但这需要一种coreceptor配体结合。Neuregulin受体复杂重要构成某些,尽管neuregulin不单独与之交互。GP30是一种潜在配体受体。调节产物和周边稳定微管(MTs)。
总结:该蛋白质序列比对成果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195. 该蛋白质序列氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、S五种原子构成,共有19180个原子。该序列在280nm波长下,假设所有成对半胱氨酸残基形成胱氨酸,则该序列消光系数1.003;假设所有半胱氨酸残基都减少了,改序列消光系数为0.976。半衰期为30小时(哺乳动物网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,成果提示该蛋白质不稳定。脂肪系数为82.35.该蛋白GRAVY值为-0.247,通过亲疏水性分析得出该蛋白为亲水蛋白。三级构造分析显示该运用TMPred工具对该蛋白进行跨膜区构造预测得到4个跨膜区,而用TMHMM预测则存在2个跨膜区。该蛋白质序列由4条链构成,通过互相作用分析得,该蛋白质序列互相作用蛋白有10个,是表皮生长因子受体( EGFR)家族成员之一,参加细胞膜表面受体构成,与白血病发生关于。
展开阅读全文