ImageVerifierCode 换一换
格式:PPT , 页数:148 ,大小:3.39MB ,
资源ID:12680926      下载积分:22 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/12680926.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(序列分析的原理和方法+结构的预测+全序列分析和进化分析.ppt)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

序列分析的原理和方法+结构的预测+全序列分析和进化分析.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,序列分析的基本原理就其本质,,主要来源于:,几种主要的记分法和几种基本算法,(,一,),几种主要记分法,所谓记分法(,scoring method,)是将被分析的序列中的元素通过某 种手段转化为简单的、直观的、便于计算机处理的数值的方法。,生物信息学将被分析的序列中的氨基酸或核苷酸称为“元素”。,记分法主要有如下几种:,生物信息学中的算法,(algorithm),指的是根据上述记分法或者元素本身的特征以及在序列或结构中的分布 规律而推导出来的能反映被检序列生物学意义的数学方法。,1.,动态程序算法,动态程序

2、算法是现代序列分析的发展基础。,动态程序算法,(dynamic programming algorithm),起始于,1970,年。,现在普遍使用的用于同源性搜索和序列分析起步搜索的软件,都是以动态程序算法为基础,加以适当的改进而建立起来的。,该算法开始多用于双重序列分析,,包括全序列对齐,(global sequence alignment),和局部序列对齐,(local sequence alignment),。,其基本原理是两序列的最大匹配依赖于序列的相似性,,即一种序列中的元素与另一种序列相应位置的元素相同的最大数目。,请指出下面两个序列的保守部分,:,由于是双重序列对比,所以采用,2

3、D,列阵法,将对比的两个序列分别置于相互垂直的两个轴。,对应位置的两个元素相同则在列阵中对应点记分,1,,,不相同记为,0,。,1 CAGCCUCGCUUAG,2 AAUGCCAUUGACGG,GCCUCG,GCCAUUG,GCC UCG,GCCAUUG,2.,点矩阵作图法,点矩阵作图法,(dot matrix),也称图式矩阵,(graphic matrix),法。,在矩阵中用点,“,.,”,和空位代替动态程序算法中的数字,1,,,0,。两条对比的序列中对应的元素相同打点,不相同作空白。,两条序列比较,若完全相同,形成的点组成一条对角线;,若部分相同,形成的点可连成一条或几条与对角线平行的线

4、段;,若不相同,形成的点呈不规则散布;,序列内存在回文结构,对应的点形成的线段则垂直于主对角线;,T,T,A,A,G,C,T,T,A,T,T,A,A,G,C,T,T,A,TTAAGCTTA,TTAAGCTTA,CGTTAAGCTTA,TTAAGCTTAGC,用点矩阵作图法写出下面序列的,alignment,:,C,G,T,T,A,A,G,C,T,T,A,T,T,A,A,G,C,T,T,A,G,C,CGTTAAGCTTA,TTAAGCTTAGC,CGTTAAGCTTA-,-TTAAGCTTAGC,TCATTCGCTTA,ATTCGCTTACT,用点矩阵作图法分析:,T,C,A,T,T,C,G,C

5、T,T,A,A,T,T,C,G,C,T,T,A,C,T,TCATTCGCTTA,ATTCGCTTACT,回文结构,为了排除不规则散布的点对有意义点模式的干扰,该方法增加了一过滤程序以滤去散杂点,强化有意义的点。,过滤程序,(filtration procedure),此外,该方法为了增加矩阵的容量,将一很大的点矩阵,压缩成一个单面,并用彩色增加效果,一次能分析两条,各,5000,个元素的序列。,3.,最大期望值算法,最大期望值算法,(expectation maximization algorithm),简称,EM,法。,该方法是从多重序列对齐中反复分析找出体现,序列特性的最优模型。,可用于

6、蛋白质序列分析;,DNA,特殊序列的搜寻;,调节蛋白作用位点的分析,Gibbs,抽样法,(Gibbs sampling),是一种改进的最大期望值算法。,4.,权值矩阵法,上述方法给出了反映序列特征的最优模式。然而模式中元素对反映序列特征的贡献是平均化的。,事实上,蛋白质、酶以及核酸的活性部位中元素的作用是,有差异的,因此,包含在反映序列特性的模式中的各元素,除了出现的频率外,还应有能反映贡献差异的数学模式。,权值矩阵法,(Weight matrix),在这方面有所侧重。,然后,在以权值矩阵法为基础建立的程序反复分析,得到的,Motifs,能反映序列生物学本质。,综上所述,我们可以看到,用

7、于相似性分析的各种记分法、,动态程序算法、点矩阵法是序列分析的基础;,由此建立的软件,BLAST,等扫描数据库得到的相似性序列集合,(,alignment),,该相似性序列显著性意义可能不大;,经过,Gibbs,抽样法、,EM,法等反复抽样分析得到,Blocks,,,包含在,Blocks,的序列已经具有显著性意义;,权值矩阵法,由此我们得到一个从无规则排列的蛋白质、核酸序列中建立,Blocks,和,Motifs,的流程图:,Alignment-Block-Motifs,丝氨酸蛋白酶在自然界分布广泛,具有重要的生物学功能。早在,70,年 代末,,His-57,、,Asp-102,和,Ser-19

8、5,作为酶的催化活性中心已经被证明,已被大家所公认。,His-57-Asp-102-Ser-195,(H-D-S),高等生物至低等生物其丝氨酸蛋白酶均具有类似的功能和结构。将这些物种的相应蛋白序列利用生物信息学上述方法进行分析,得到下图。,Alignment,Block,Motifs#,H-D-C/S,既然病毒的这些蛋白质包含有体现丝氨酸蛋白酶催化活性,Motif:,H-D-S,我们可以推测病毒的这些蛋白质也具有丝氨酸蛋白酶活性,.,生物信息学,Blocks,和,Motifs,方法,在病毒研究中的应用,.,武汉大学学报,2000,,,46,(,6,):,709-716,(,三,)DNA,或,R

9、NA,序列分析,以软件,MACAW,为例,Reference 1:,Proceedings of the National Academy of Sciences USA 87,2264-2268(1990),Methods for Assessing the Statistical Significance of Molecular Sequence Features by Using General Scoring Schemes,Reference 2:,Science 262,208-214(1993),Detecting Subtle Sequence Signals:A Gibbs

10、 Sampling Strategy for Multiple Alignment,MACAW,:,Multiple Alignment Construction&Analysis Workbench,整理序列,FASTA format,Nucleotide,Key Words(NS5B),NS5B,NS5B,Display,Send to,Display,Send to,Default,FASTA,Display,Send to,FASTA,Display,Send to,Display,Send to,FASTA,FASTA,File,Text,Display,Send to,FASTA,

11、Text,Send to,Display,文件,另存为,NS5B-1.txt,整理序列,FASTA format,2),项目开始,Alignment Summary Information,Title:,Sequence type:,Score:,NS5B,RNA,Nucleotide,OK,3),输入序列,修改,Open-Copy,Import,Open-Copy,整理序列,FASTA format,2),项目开始,File Menu-New Project,3),输入序列,Sequence Menu-Import,BVDV NS5B,CSFV NS5B,HCV NS5B,4),选择范围,通

12、过,Mouse,选择范围,通过,Edit Menu,选择范围,Select All,整理序列,FASTA format,2),项目开始,File Menu-New Project,3),输入序列,Sequence Menu-Import,4),选择范围,Edit Menu-Select All,5),搜寻,Blocks,Alignment menu-Search For Blocks,对话框,Search For Blocks,显示,Search For Blocks,Begin,Segment Pair Overlap,Gibbs Sampler,Regular Expression,Sea

13、rch Method:,Search Results,Keep,m,len,Info.,+,3,22,0.109,3,20,0.104,3,21,0.103,3,19,0.102,View/Edit,Link,Unlink,Keep,Help,4 Blocks,Keep,+,m:,序列数量,len:,碱基数量,Info.:,重要性,View/Edit:,显示和编辑,Blocks,link:,Alignment-Block,Search Results,Keep,m,len,Info.,+,3,22,0.109,3,20,0.104,3,21,0.103,3,19,0.102,View/Edit

14、Link,Unlink,Keep,Help,+,3,22,0.109,Significant?,Yes:significant,Maybe:possibly significant,No:not significant,BVDV NS5B,CSFV NS5B,HCV NS5B,整理序列,FASTA format,2),项目开始,File Menu-New Project,3),输入序列,Sequence Menu-Import,4),选择范围,Edit Menu-Select All,5),搜寻,Blocks,Alignment-Search For,6),保存项目,File menu-sa

15、ve project,File name:NS5B,NS5B.MCW,整理序列,FASTA format,2),项目开始,File Menu-New Project,3),输入序列,Sequence Menu-Import,4),选择范围,Edit Menu-Select All,5),搜寻,Blocks,Alignment-Search For,6),保存项目,File menu-save project,7),转换成文本文件,File menu-export,File name:NS5B,NS5B.txt,Open,NS5B.txt,BVDV NS5B,CSFV NS5B,HCV NS5B

16、BVDV NS5B,CSFV NS5B,HCV NS5B,BVDV NS5B,CSFV NS5B,HCV NS5B,整理序列,FASTA format,2),项目开始,File Menu-New Project,3),输入序列,Sequence Menu-Import,4),选择范围,Edit Menu-Select All,5),搜寻,Blocks,Alignment-Search For,6),保存项目,File menu-save project,7),转换成文本文件,File menu-export,核酸序列分析步骤,MACAW,(,四,),蛋白质序列分析,以软件,MACAW,为例,

17、NS5B,整理序列,Alignment Summary Information,Title:,Sequence type:,Score:,NS5B,Protein,BLOSUM-62,2),项目开始,File Menu-New Project,对话框,Alignment Summary Information,显示,3),输入序列,4),选择范围,5),搜寻,Blocks,6),保存项目,7),转换成文本文件,另外,,Clustal X,也是多重序列对齐分析的常用软件。,第四章,结构的预测,核苷酸和氨基酸序列只有形成了三级或四级结构才能表现功能。,了解病毒蛋白质和核酸高级结构是非常重要的,它有

18、助于疫苗的研制、抗病毒药物的筛选以及药物的分子设计。,目前对大分子空间结构测定的方法一般是用,X,光衍射,核磁共振(,NMR,),这些方法能较精确地测定大分子的高级结构。著名的蛋白质和核酸三维结构数据库,PDB(http:www.pdb.bnl.gov,),专门收集通过,X,光衍射和,NMR,确定了结构的蛋白质和核酸。,X,光衍射需要高纯度的结晶,周期要求长;,NMR,也只能测定较小的蛋白质分子的结构。,仅靠,X,光衍射和,NMR,远远跟不上序列测定的速度。,不了解空间结构,就很难确定大分子的功能,更谈不上作用机理的阐明。,因此,随着计算机科学的发展,人们开始着手高级结构预测的研究。,一,同源

19、建模,(homology modeling),所谓同源建模就是选择行使同一功能、同源性较高的且空间结构已被,X,光衍射或,NMR,确定了的蛋白质或核酸作为参考模板,从而构建序列三级结构模型的方法。,一般分如下几个步骤:,1).,选定参考模板,2).,一级结构、二级结构对比分析,3).,三维结构模型构建,4).,模型精炼,5).,模型评估,二,折叠法,蛋白质折叠,RNA,折叠,许多小的折叠类型的结构已经清楚。,整个蛋白质或,RNA,分子,分解成,小的折叠类型,相应的结构类型,寻找到,整体结构,合并,三,,RNA,二级结构预测的实例,RNA structure 3.5,References:,Jo

20、urnal of Molecular Biology,288,911-940,(1999).,RNA,3,1-16,(1997).,预测的步骤,转化序列,sequence(,小写字母,),SEQUENCE(,大写字母,),预测的步骤,转化序列,输入序列,OPEN,File menu-New sequence,Title,Comment,Sequence,CSFV 3UTR,single positive-strand RNA,Format,Fold RNA,Enter Sequence,GCATGGTTGGC CCTTGATCGG GCCCTATCAG TAGAACCCTA TTGTAAATA

21、A 12120,CATTAACTTA TTAATTATTT AGATACTATT ATTTATTTAT TTATTTATTT ATTGAATGAG 12180,CAAGTACTGG TACAAACTAC CTCATGTTAC CACACTACAC TCATTTTAAC AGCACTTTAG 12240,CTGGAGGGAA AACCCTGACG TCCACAGTTG GACTAAGGTA ATTTCCTAAC GGCCCCC,预测的步骤,转化序列,输入序列,整理序列,Title,Comment,Sequence,CSFV 3UTR,single positive-strand RNA,Form

22、at,Fold RNA,Enter Sequence,GCATGGTTGGC CCTTGATCGG GCCCTATCAG TAGAACCCTA TTGTAAATAA 12120,CATTAACTTA TTAATTATTT AGATACTATT ATTTATTTAT TTATTTATTT ATTGAATGAG 12180,CAAGTACTGG TACAAACTAC CTCATGTTAC CACACTACAC TCATTTTAAC AGCACTTTAG 12240,CTGGAGGGAA AACCCTGACG TCCACAGTTG GACTAAGGTA ATTTCCTAAC GGCCCCC,GCAT

23、GGTTGG CCCTTGATCG GGCCCTATCA GTAGAACCCT ATTGTAAATA ACATTAACTT ATTAATTATT TAGATACTAT TATTTATTTA TTTATTTATT TATTGAATGA GCAAGTACTG GTACAAACTA CCTCATGTTA CCACACTACA CTCATTTTAA CAGCACTTTA GCTGGAGGGA AAACCCTGAC GTCCACAGTT GGACTAAGGT AATTTCCTAA CGGCCCCC,预测的步骤,转化序列,输入序列,整理序列,保存序列,Title,Comment,Sequence,CSFV

24、 3UTR,single positive-strand RNA,Format,Fold RNA,Enter Sequence,GCATGGTTGGC CCTTGATCGG GCCCTATCAG TAGAACCCTA TTGTAAATAA 12120,CATTAACTTA TTAATTATTT AGATACTATT ATTTATTTAT TTATTTATTT ATTGAATGAG 12180,CAAGTACTGG TACAAACTAC CTCATGTTAC CACACTACAC TCATTTTAAC AGCACTTTAG 12240,CTGGAGGGAA AACCCTGACG TCCACAGT

25、TG GACTAAGGTA ATTTCCTAAC GGCCCCC,GCATGGTTGG CCCTTGATCG GGCCCTATCA GTAGAACCCT ATTGTAAATA ACATTAACTT ATTAATTATT TAGATACTAT TATTTATTTA TTTATTTATT TATTGAATGA GCAAGTACTG GTACAAACTA CCTCATGTTA CCACACTACA CTCATTTTAA CAGCACTTTA GCTGGAGGGA AAACCCTGAC GTCCACAGTT GGACTAAGGT AATTTCCTAA CGGCCCCC,File,Save,预测的步骤,

26、转化序列,输入序列,整理序列,保存序列,折叠序列,Title,Comment,Sequence,CSFV 3UTR,single positive-strand RNA,Format,Fold RNA,Enter Sequence,GCATGGTTGG CCCTTGATCG GGCCCTATCA GTAGAACCCT ATTGTAAATA ACATTAACTT ATTAATTATT TAGATACTAT TATTTATTTA TTTATTTATT TATTGAATGA GCAAGTACTG GTACAAACTA CCTCATGTTA CCACACTACA CTCATTTTAA CAGCACTT

27、TA GCTGGAGGGA AAACCCTGAC GTCCACAGTT GGACTAAGGT AATTTCCTAA CGGCCCCC,Start,RNA folding is complete.,Exit,Draw Structures,茎环结构,单链区,环,茎,预测的步骤,转化序列,输入序列,整理序列,保存序列,折叠序列,输出结构,复制到,Edit Menu-Copy,四,蛋白质二级结构预测的实例,蛋白质二级结构的类型:,-,螺旋(,-helix,,,H,),-,折叠(,-sheet,E or S,),-,转角,(-turn,T),无规卷曲(,coil,C,),蛋白序列分析软件包,操作步骤,

28、1.,下载序列,HCV NS5B,RNA dependent RNA polymerase,RNA-directed RNA polymerase,2014-3011 RNA-directed RNA polymerase,操作步骤,1.,下载序列,2.,项目开始,OPEN,操作步骤,1.,下载序列,2.,项目开始,3.,输入序列,以文件的形式输入序列,HCVNS5B,GYKGVWRVDGIMHTRCHCGAEITGHVKNGTMR,GYKGVWRVDGIMHTRCHCGAEITGHVKNGTMR,操作步骤,1.,下载序列,2.,项目开始,3.,输入序列,4.,结构预测,Methods,Sec

29、ondary structure prediction,Profile,Hydrophobicity,Garnier,Gibrat,DPM,LEVIN,1,AA -,G,YKGVW State,T,TCCEE,指示线,T,E,C,H,C,30,T,H,E,C,-,螺旋,(H)-,折叠,(E),-,转角,(T),无规卷曲,(C),二级结构类型,:,T,E,C,H,C,Details,8,AA,V,E,T,E,C,操作步骤,1.,下载序列,2.,项目开始,3.,输入序列,4.,结构预测,5.,保存结果,五,三级结构视化,RasMol,操作步骤,1.,下载序列,国际核酸序列数据库,Protein3D

30、Struct,Key words(HCV NS5B protein),PDB,Save,操作步骤,1.,下载序列,2.,输入序列,第五章 全序列对齐和分子进化分析,TreeView.exe,TreeView.exe,全序列对齐,分子进化分析,产生进化树,1,,序列要整理成,Fasta,格式,2,,依次输入序列到分子进化分析软件,3,,,Do complete alignment,4,,,Draw tree,CLUSTAL X(1.8)multiple sequence alignment,TreeView,C,A,B,E,F,D,A,C,B,E,D,F,下面几周答疑,10,月,30,日(星期,4,)下午,6,点,11,月,6,日 (星期,4,)下午,6,点,11,月,13,日(星期,4,)下午,6,点,主要解决同学们在做实验时遇到的问题,地点,1,教,233,11,月,20,日(星期,4,)下午,5:30,,,在本教室继续上课,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服