资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二讲 蛋白质序列分析与预测,生物信息学,原理与方法,目录,一、基本方法,二、,在线工具-,ExPASy,系统简介,一、基本方法,二、,ExPASy,系统简介,1.,Protein identification and characterization,蛋白质识别与特证描述,2.,DNA-Protein,将,DNA,序列,翻译成,蛋白,质,序列,3.,Similarity searches,序列类似性检索(已讲),4.,Pattern and profile searches,模式,的,搜索,5.,Post-translational modification prediction,翻译后修饰预测,6.,Topology prediction,空间结构预测,7.,Primary structure analysis,一级结构分析,8.,Secondary structure prediction,二级结构预测,9.,Tertiary structure,三,级结构预测,10.,Sequence alignment,序列比,对(已讲),11.,Biological text analysis,生物,学文本,分析(,不讲,),1.,Protein identification and characterization,蛋白质识别与特证描述,2.,DNA-Protein,将,DNA,序列,翻译成,蛋白,质,序列,2-1,Translate,-,将,DNA,序列翻译成蛋白质序列。,2-2,Transeq,使用,EMBOSS,软件包将,DNA,序列翻译成蛋白质序列。,2-3,Graphical Codon Usage Analyser,以图形方式显示密码子偏向性,2-4,BCM search launcher,以六种框架翻译,DNA,序列,2-5,Backtranslation,将蛋白质序列翻译成,DNA,序列,2-6,Genewise,比较蛋白质序列与基因组的,DNA,序列,允许内含子和读框错误,2-7,FSED,读框错误检测,2-8,LabOnWeb,-,使用,Compugen LEADS clusters,延伸,EST,、,表达模式及,ESTs,序列分析。,2-9,List of gene identification software sites,列出基因识别的软件。,3.,Similarity searches,相似,搜索,3-1,BLAST,3-2,Bic ultra,-,Smith/Waterman,序列,搜索,3-3,MPsrch,-,EBI,的,Smith/Waterman,序列比,对,。,3-4,DeCypher,Smith/Waterman,序列,搜索,3-5,Fasta3,EBI,的,FASTA version 3,3-6,FDF,-,Smith/Waterman,序列,搜索,3-7,PropSearch,使用氨基酸组成来进行结构同源搜索。,4.,Pattern and profile searches,模式,的,搜索,4-1,InterPro Scan,-,在,PROSITE,Pfam,PRINTS,及其他家族和功能域数据库中集成检索。,4-2,ScanProsite,-,对,PROSITE,或,Swiss-Prot,和,TrEMBL,的模式序列进行搜索。,4-3,MotifScan,-,对蛋白质模式数据库中的序列,(,包括,PROSITE),进行搜索。,4-4,Frame-ProfileScan,-,对蛋白质模式数据库中的序列,(,包括,PROSITE),进行短的,DNA,序列搜索。,4-5,Pfam HMM search,-,在,Washington University,及,Sanger Centre,对,Pfam,数据库进行搜索。,4-6,FingerPRINTScan,-,对,PRINTS,数据库进行蛋白质指纹搜索。,4-7,FPAT,-,蛋白质数据库中的表达搜索。,4-8,PRATT,-EBI,及,ExPASy,的识别蛋白质保守模式,4-9,PPSEARCH,-EBI,的对,PROSITE,进行序列搜索。,4-10,PROSITE scan,PBIL,的对,PROSITE,进行序列搜索。,4-11,PATTINPROT,-,在,PBIL,搜索一段蛋白质序列或蛋白质数据库中的模式。,4-12,SMART,EMBL,的简单分子结构研究工具。,4-13,TEIRESIAS,-IBM,的从不匹配的(,unaligned,),蛋白质或,DNA,序列生成蛋白质模式。,4-14,Hits,蛋白质序列与,motifs,的关系。,5.,Post-translational modification prediction,翻译后修饰预测,5-1,ChloroP,-,叶绿体转换肽的预测,。,5-2,LipoP,-Gram,阴性细菌脂蛋白质和信号肽的预测,5-3,MITOPROT,预测线粒体的目标序列,。,5-4,PATS,预测,apicoplast,的目标序列,5-5,PlasMit,-,预测,Plasmodium falciparum,的线粒体转换肽,5-6,Predotar,预测线粒体和质体的目标序列,5-7,PTS1,预测,peroxisomal targeting signal 1 containing proteins,5-8,SignalP,预测信号肽剪工切位点。,5-9,NetOGlyc,预测哺乳动物粘蛋白的糖化位点。,5-10,NetNGlyc,预测人类,N,型蛋白质糖化位点。,5-11,DictyOGlyc,预测粘菌,O,型蛋白质糖化位点。,5-12,YinOYang,-,真核生物蛋白质序列的,O-beta-GlcNAc,的粘附位点。,5-13,big-PI Predictor,-,预测,GPI,的修饰位点,5-14,DGPI,-,预测,GPI,的锚合点和剪刀切位点,(,鏡像站,),。,5-15,NetPhos,-,预测真核生物蛋白质上,Ser,Thr,及,Tyr phosphorylation,位点。,5-16,NetPicoRNA,-,预测,picornaviral proteins,上蛋白质剪切位点。,5-17,NMT,预测,N-terminal N-myristoylation,5-18,Sulfinator,预测酪胺酸硫化位置。,5-19,SUMOplot,预测,SUMO,蛋白质附着位置。,6.,Topology prediction,空间结构预测,6-1,PSORT,预测蛋白质,次细胞的位置。,6-2,TargetP,-,预测蛋白质,次细胞的位置。,6-3,DAS,-,利用,Dense Alignment Surface,法预测原核生物的跨膜区。,6-4,HMMTOP,-,预测蛋白质的跨膜螺旋及空间结构。,6-5,PredictProtein,-,预测蛋白质的跨膜螺旋及空间结构。,6-6,SOSUI,-,预测跨膜区。,6-7,TMAP,基于多序列比对的跨膜区预测。,6-8,TMHMM,-,预测蛋白质的跨膜螺旋。,6-9,TMpred,-,预测蛋白质的跨膜区及蛋白质方向。,6-10,TopPred 2,-,膜蛋白的空间结构预测。,7.,Primary structure analysis,一级结构分析,7-1,ProtParam,-,蛋白质序列的物化性质分析,(,氨基酸、原子组成、等电点,.,等,),7-2,Compute pI/Mw,-,以,Swiss-Prot,或,TrEMBL,条目或用户的序列计算理论的等电点和分子量。,7-3,MW,pI,Titration curve,计算等电点及组成并可见其滴定曲线图。,7-4,REP,搜索蛋白质重复片段。,7-5,REPRO,检测蛋白质序列的重复片段。,7-6,Radar,-,检测蛋白质序列的重复片段。,7-7,SAPS,蛋白质序列的统计学分析。,7-8,Coils,蛋白质的卷曲预测。,7-9,Paircoil,蛋白质两级卷曲螺旋预测。,7-10,Multicoil,蛋白质两级或三级卷曲螺旋预测。,7-11,2,ZIP,-,亮氨酸拉链的预测。,7-12,PESTfind,PEST,区域的预测。,7-13,HLA_Bind,预测,MHC type I(HLA)peptide binding,。,7-14,SYFPEITHI,-,预测,MHC type I and II peptide binding,。,7-15,ProtScale,氨基酸比例图(疏水性及其相关参数等),7-16,Drawhca,蛋白质序列疏水性聚类分析,HCA(Hydrophobic Cluster Analysis),点阵图,7-17,Protein Colourer,给氨基酸序列着色工具,7-18,Three To One,将三码的氨基酸序列转换成一码氨基酸序列工具。,7-19,Colorseq,将所选择的蛋白质序列以红色突出。,7-20,HelixWheel,/,HelixDraw,用蛋白质片段表示环状螺旋结构,7-21,RandSeq,随机蛋白质序列生成器,8.,Secondary structure prediction,二级结构预测,8-1,AGADIR,预测肽链螺旋结构算法。,8-2,APSSP,高级蛋白质二级结构预测服务器。,8-3,GOR,Garnier,1996,年开发的蛋白质二级结构预测。,8-4,HNN,神经网络方法预测蛋白质二级结构。,8-5,Jpred,趋同法预测蛋白质二级结构。,8-6,JUFO,神经网络法从序列预测蛋白质二级结构。,8-7,nnPredict,-,蛋白质二级结构预测。,8-8,PredictProtein,-,蛋白质二级结构预测。,8-9,Prof,利用,Cascaded Multiple Classifiers,进行蛋白质二级结构预测。,8-10,PSA,-,蛋白质二级结构预测。,8-11,SOPMA,-,蛋白质二级结构预测。,8-12,SSpro,利用双向重复神经网络预测蛋白质二级结构。,9.,Tertiary structure,三,级结构预测,9-1,三级结构分析(,Tertiary structure analysis,),9-1-1,iMolTalk,一个交互式的蛋白质结构分析服务器,9-1-2,MolTalk,一个结构生物信息学计算环境,9-2,比较建模(,Comparative modeling,),9-2-1,SWISS-MODEL,一个自动基于知识的蛋白质建模服务器。,9-2-2,3,Djigsaw,基于已知结构同源蛋白的三级结构建模。,9-2-3,CPHmodels,基于同源蛋白自动神经网络建模服务器。,9-2-4,ESyPred3D,采用神经网络的自动同源建模程序。,9-2-5,Geno3d,蛋白质三维结构自动建模。,9-2-6,SDSC1,蛋白质同源结构建模服务器。,9-3,穿过建模(,Threading,),9-3-1,3D-PSSM,采用经过二级结构信息,(,Foldfit),处理的一维和三维序列模式进行蛋白质折叠识别。,9-3-2,Fugue,序列结构同源识别。,9-3-3,Libellula,采用神经网络方法评价折叠识别结果。,9-3-4,LOOPP,采用序列到序列、序列到结构和结构到结构的算法。,9-3-5,SAM-T02,基于,HMM,的蛋白质结构预测。,9-3-6,Threader,蛋白质折叠识别。,9-3-7,ProSup,蛋白质结构附件。,9-3-8,SWEET,从,saccharides,序列构建其三维模型。,9-4,从头建模(,Ab initio,),9-4-1,HMMSTR/Rosetta,从序列预测蛋白质三维结构。,9-5,三维结构预测评价(,Assessing tertiary structure prediction,),9-5-1,Anolea,原子非局部环境评价。,9-5-2,Biotech Validation Suite for Protein Structures,9-5-3,EVA,原子蛋白质结构预测评价,9-5-4,LiveBench,结构预测服务器的连续,Benchmarking,。,9-5-5,PROCHECK,蛋白质结构的,stereochemical,质量证实。,9-5-6,What If,用于突变预测、结构验证、分子图示的蛋白质结构分析程序。,9-6,分子建模显示工具,9-6-1,Swiss-PdbViewer,显示、分析、添加蛋白质三维结构的程序,9-6-2,Astex Viewer,9-6-3,MolMol,9-6-4,Rasmol,9-6-5,VMD,10.,Sequence alignment,序列比,对,
展开阅读全文