收藏 分销(赏)

如何做序列的blas分析.ppt

上传人:w****g 文档编号:10277535 上传时间:2025-05-12 格式:PPT 页数:23 大小:2.84MB
下载 相关 举报
如何做序列的blas分析.ppt_第1页
第1页 / 共23页
如何做序列的blas分析.ppt_第2页
第2页 / 共23页
点击查看更多>>
资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,1,内容提要,Blast,简介,Blast,相关问题,Blast,的应用,示例,Blast,简介,BLAST,是NCBI,中用来将一个蛋白质或,DNA,序列和各种数据库中的其他序列进行比对的主要工具。,BLAST,搜索,是研究一个蛋白质和基因的最基本的方法之一。,Blast,具有非常广泛的运用,确定,特定的蛋白质或核酸序列有哪些已知的直系同源或旁系同源序列,确定哪些蛋白质和基因在特定的物种中出现,确定,一个,DNA,或蛋白质序列身份,发现新基因,确定,一个特定基因或蛋白质有哪些已经发现了的变种,研究可能存在多种剪切方式的表达序列标签,寻找对于一个蛋白质的功能和/或结构起关键作用的氨基酸残基,2,主要的,blast,程序,3,4,主要的,blast,程序,程序名,查询序列,数据库,搜索方法,Blastn,核酸,核酸,核酸序列搜索逐一核酸数据库中的序列,Blastp,蛋白质,蛋白质,蛋白质序列搜索逐一蛋白质数据库中的序列,Blastx,核酸,蛋白质,核酸序列,6,框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。,Tblastn,蛋白质,核酸,蛋白质序列和核酸数据库中的核酸序列,6,框翻译后的蛋白质序列逐一比对。,TBlastx,核酸,核酸,核酸序列,6,框翻译成蛋白质序列,再和核酸数据库中的核酸序列,6,框翻译成的蛋白质序列逐一进行比对。,5,具体步骤,1.,登陆,blast,主页,www.ncbi.nlm.nih.gov/Blast.cgi,2.,根据已有序列类型和搜索目标,选择合适的,blast,程序,Blastn,,,Blastp,,,Blastx,等,3.,填写表单信息,选择要搜索的数据库,并修改一些可选参数等,4.,提交任务,5.,查看和分析结果,具体步骤,输入要分析的序列,6,NP_006735,三种,主要的输入方式,剪切,然后粘贴,DNA,或蛋白质序列,使用FASTA,格式的序列,简单,地使用索引号码(如一个,RefSeq,或,GenBank(GI),的序号),具体步骤,选择要搜索的数据库(,blastp,),7,去冗余,GenBank,编码序列,PDB+SwissProt+PIR+PRF,Nr,数据库,合并了若干个主要的蛋白质,或,DNA,数据库,数据库有相同的序列,但,nr,数据库只收录一个,典型和常用的数据库,具体步骤,选择要搜索的数据库(,blastn,),8,具体步骤,调整可选参数,1.,Limit by Entrez Query,9,可以用任何一种范围限定词,来限定,NCBI BLAST,搜索的范围,具体步骤,调整可选参数,2.,Max target sequences,:,比对之后显示的最大的比对序列的数目,10,具体步骤,调整可选参数,3.,Expect threshold,:期望值,E,是得分大于或等于某个分值,S,的不同的比对的数目在随机的数据库搜索中发生的可能性。,11,默认值是,10,,表示随机出现得分等于,或高于比对得分,S,的期望数为,10,个。,当将期望选项值调小时,返回的数据,库搜索结果将变少,匹配被搜索到的,概率也会变小。,增大,E,值将返回更多的结果。,THANK YOU,SUCCESS,2025/5/12 周一,12,可编辑,具体步骤,调整可选参数,4.,Word size,(字段长度),13,蛋白质搜索,默认值是,3,核酸序列搜索,默认值是,11,改变字段长度可以影响搜索,精度和速度,具体步骤,调整可选参数,5.,Matrix,(打分矩阵),14,在一次,BLAST,搜索中,可以尝试使用几种不同的打分矩阵,高,PAM,值取代矩阵适合于差异较大的序列,低,BLOSUM62,值的取代矩阵适合于差异较大的序列,具体步骤,调整可选参数,6.,Compositional adjustments,,默认选择,一般来说可改善,E,值的统计计算和提高灵敏度(减少返回的假阳性结果的数目),15,具体步骤,调整可选参数,7.,Filter,(选择性过滤条件),过滤器将锁定诸如组成低复杂序列区(如Alu序列),用一系列N,(任意碱基),替代这些程序,16,过滤对绝大多数序列是有利的,,可以帮助避免那些假的数据库匹配,但某些情况下可信的匹配也会过滤掉,具体步骤,Blast,输出结果,上部,BLAST,搜索的类型、关于查询内容和所搜索的数据库的描述以及一个分类连接可以将结果按照物种进行分类,中部,数据库中序列与查询序列相匹配的项的列表,分为图像和列表两种描述方式,下部,一系列的两两序列比对,,4,种衡量的分数:比特分数、期望分数、一致性百分比、正性,(,相似性百分比,),17,具体步骤,Blast,输出结果,18,database,program,query,taxonomy,具体步骤,Blast,输出结果,19,每一个条带表示数据库中的一个与查询,序列相匹配的蛋白质或核酸序列,被标,以不同颜色表示亲缘关系的远近,(,根据比,对的分,),,最接近匹配用红色表示。,High scores,low e values,20,具体步骤,Blast,输出结果,Score,使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、相似性越高则,Score,值越大。,E value,在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述,Score,值的概率的大小。,E,值越小表示随机情况下得到该,Score,值的可能性越低。,具体步骤,Blast,输出结果,改变格式,21,BLAST,搜索策略总图示例,THANK YOU,SUCCESS,2025/5/12 周一,23,可编辑,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服