收藏 分销(赏)

Clustalx多序列比对-生物信息学.doc

上传人:xrp****65 文档编号:8752785 上传时间:2025-03-01 格式:DOC 页数:5 大小:68KB 下载积分:10 金币
下载 相关 举报
Clustalx多序列比对-生物信息学.doc_第1页
第1页 / 共5页
Clustalx多序列比对-生物信息学.doc_第2页
第2页 / 共5页


点击查看更多>>
资源描述
实验三:多条序列比对——Clustalx 实习目的:了解掌握Clustalx软件的应用,学会做多条序列比对并分析。 实习内容: 一、ClustalX的使用 Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。 1. 准备要比对的序列 请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存为文本文件(所有的序列请粘贴到同一个文本文件中)。选择NM、XM或NP打头的序列,不要选择NC或NW打头的序列,那是全基因组序列。 建议关键词:hemoglobin,trypsin, peroxidase, p53, Superoxide Dismutase, h5n1, etc. 2. 打开clustalX程序 开始菜单-程序-clustalX2- clustalX2 3. 载入序列 点最上方的File菜单,选择Load Sequence-选择你刚保存的序列文件,点打开。 在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。注意:ClustalX程序无法识别汉字,无法识别带空位的文件夹名,如 my document。各位同学的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。 4. 比对参数的选择 可以对两条序列比对的参数和多条序列比对的参数进行设置。 a. 两条序列比对的参数设置 点击Alilgnment菜单,选择Alignment Parameters,再选择Pairwise Alignment Parameters。首先可以选择比对的效果,是slow/accurate 还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,要使用的DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。 b. 多条序列比对参数设置 点击Alilgnment菜单,选择Alignment Parameters,再选择Multiple Alignment Parameters。 5. 更改输出格式 点击Alignment菜单,选择Output Format Options。 默认的是输出clustal format,如果需要其它格式,可在复选框里打勾。PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式。 6. 进行比对 点击Aliglnment菜单,选择Do Complete Alignment.此时出现一个对话框,提示你比对结果保存的位置,你在上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。选择好了点OK即可。 要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结果进行分析,选择哪个是最合理的结果(the result making biological sense)。 比对结束后生成的aln文件是多条序列比对的结果,可以用记事本打开浏览。在某一列比对结果下方如果出现*,说明这列是完全匹配。dnd文件是比对过程中生成的进化树,可以用treeview打开浏览。 7. 迭代比对 如果序列比对结果不理想,可以采用迭代选项,多次迭代寻找最佳比对结果。 点击Alignment菜单,选择iteration,选择iterate each alignment step或iterate final alignment. 然后再点击Aliglnment菜单,选择Do Complete Alignment进行比对。 8. 概型(Profile)比对模式 以上介绍的都是Multiple alignment Mode,ClustalX还提供了一个概型比对模式,在菜单栏下方选择Profile Alignment Mode,可以对两个比对结果(alignment, termed profile here)进行再比对,或将一条序列与一个比对结果(profile)进行比对。 二、Treeview Clustalx产生的guide tree(即后缀为dnd文件),可以通过treeview软件浏览。 解压缩并安装treev32.rar文件。双击后缀为dnd文件,选择treeview程序打开即可。 作业: 1. Clustalx是多条序列比对软件,为什么需要设置两条序列比对的参数? 答:Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果,既是采用两两比较后再继续进行比较的方法,所以,需要设置两条序列比对的参数。 2. 利用entrez或srs搜索来自于不同物种的同源序列(othologs),利用clustalX进行比对,给出所选序列简要信息(fasta格式第一行),比对所用的参数,比对过程中产生的guide tree(dnd文件),并分析比对结果(序列之间相似度关系,保守位点所在位置等)。 答:简要信息: >gi|23466358|gb|AF349413.3| Danio rerio estrogen receptor beta b mRNA, complete cds >gi|145308317|gb|EF530592.1| Paramisgurnus dabryanus estrogen receptor beta mRNA, partial cds >gi|32186925|gb|AY305027.1| Halichoeres tenuispinis estrogen receptor beta mRNA, complete cds >gi|2073112|dbj|AB003356.1| Anguilla japonica mRNA for estrogen receptor, complete cds >gi|89037528|ref|NW_925528.1| Homo sapiens chromosome 14 genomic contig, alternate assembly (based on Celera), whole genome shotgun sequence >gi|30962102|emb|AJ314602.1| Candidia barbatus mRNA for putative estrogen receptor >gi|61097789|dbj|AB190290.1| Rutilus rutilus ERb mRNA for estrogen receptor beta, complete cds 比对所用参数: Guide tree: 比对结果见附表1: 附表1: Candidia TATCACTATGGTGTCTGGTCATGTG---AGGGATGCAAGGCT---------TTTTTCAAA Rutilus TATCACTATGGTGTCTGGTCATGTG---AGGGGTGCAAGGCT---------TTCTTCAAA Danio TATCACTATGGTGTCTGGTCATGTG---AAGGGTGCAAGGCT---------TTCTTCAAG Paramisgurnus TATCACTACGGGGTGTGGTCATGCG---AGGGGTGCAAGGCT---------TTCTTCAAA Halichoeres TATCACTACGGTGTGTGGTCCTGCG---AGGGCTGTAAAGCA---------TTTTTCAAG Anguilla TATCACTACGGGGTGTGGTCCTGCG---AAGGCTGCAAGGCC---------TTCTTCAAG Homo TA-CACTGAGGGACTGAGCCTGGTGTATATGGCAGCAAGACTGGATGGTGGCTTTGCAGC ** **** ** * * * * * ** * ** * * * ** Candidia ------CGGAGCATTCAAGGACACAATGACT--ATATGTG----TCCAGCCACCAACC-- Rutilus ------CGGAGCATTCAAGGACACAATGACT--ATATTTG----TCCAGCCACCAACC-- Danio ------CGTAGCATTCAAGGTCACAATGACT--ATATTTG----TCCAGCCACCAACC-- Paramisgurnus ------CGAAGCATTCAAGGACACAATGACT--ACATTTG----TCCAGCCACCAACC-- Halichoeres ------AGGAGTATCCAAGGACACAACGACT--ACATCTG----CCCTGCAACAAATC-- Anguilla ------AGGAGCATCCAAGGGCACAATGGCT--ACATCTG----CCCCGCCACCAACC-- Homo AGTCTCCAGAGCATTCCATGAGATCCGGGCTCGAAATCCAGCATTTCAGCCACAAACTTT ** ** * * * * * ** * ** * ** ** ** Candidia AGTGCACCATTG-------ACAAGAGCCGACGCAAAAGCTG-CCAGGCCTGTCGACTCCG Rutilus AGTGCACTATTG-------ACAAGAGCCGACGCAAGAGCTG-CCAGGCCTGTCGACTCCG Danio AGTGCACTATTG-------ACAAGAGCAGACGCAAGAGCTG-TCAGGCCTGTCGACTCCG Paramisgurnus AGTGCACCATCG-------ACAAGAGTCGTCGTAAGAGCTG-TCAGGCCTGTCGATTCCG Halichoeres AATGCACTATCG-------ACAAGAACCGGCGTAAGAGCTG-CCAAGCCTGCCGCCTACG Anguilla AGTGCACCATCG-------ACAAGAACCGGCGCAAGAGCTG-CCAGGCCTGCCGACTCCG Homo GATGGACTTTGGCTCAGGTACTGGTTCTGTCACCTGGGCTGCTCACAGTATTTGGGGCCA ** ** * * ** * * * **** ** * * Candidia CAAGTGCTATGAA---ATGGGCATGATGAAGTGTGGTGTGAGGCGGG----AACGCTGCA Rutilus CAAGTGCTATGAA---ACAGGCATGATGAAGTGTGGTGTGAGGCGGG----AACGCTGCA Danio CAAGTGCTATGAA---GTGGACATGATGAAGTGTGGTGTGAGGAGGG----AGCGCTGCA Paramisgurnus CAAGTGCTATGAA---GTGGGCATGATGAAGTGTGGTGTGAGGCGAG----AACGGTGCA Halichoeres TAAATGCTACGAA---GTGGGCATGATGAAATGTGGTGTAAGACGTG----AACGCTGCA Anguilla CAAGTGCTACGAA---GTGGGCATGATGAAGTGTGGTGTGAGACGGG----AGCGTTGTA Homo GAGCCTACGTGAATATATGTGTGTGGACAGATCAGCTGCCATGTTGGTTTTGGCAGAAAA * *** ** * * * ** * * * * Candidia GTTACCGTGGTGCTCGTCATCGTCGCAAC---CCCCAGATCAGGGACAGCTCGGGCGGGG Rutilus GTTACCGCGGTGCTCGTCATCGTCGAAAT---CCCCCGATCAGAGACGGCTTGGGCGAGG Danio GTTATCGAGGTGCTCGACATCGTCGTAAC---CCCCAAATCAGAGACAGCTCTGGCGGGG Paramisgurnus GTTACCGCGGTGCCCGTCATCGTCGCCAT---CCCCAGACGAGAGACGGCTCAGGCAAAG Halichoeres GCTATCGAGGAACCCGACACCGCCGTGGTGGACTCCAGCCTCGGGATCCCACAGGCAGGG Anguilla CCTACCGGGGGGCGCGACACCGCCGCATG---CCCCACATCCGCGAGTTGGCGGGCACAG Homo ACTACTGAAAGGTGGTTCAGAATCTGGGGAG-CCTTATATTCCAGGTGTCTTTTTCAGAC ** * ** * * * * Candidia CTTTAG---------GGGTCAGAG-GTTGTTCCCAGCATCATTTAGAAATTCCT--CTCA Rutilus TGTTAG---------GGGTCAGAG-GTTGTTCCCAGCATAATTTAGAAATTCCT--CTCA Danio TGGTAG---------GACTCAGAG-GTCAATCCCAGCAGCATCTAGAGTTCCCC--CTCA Paramisgurnus CATTAG---------GGGTCAGAG-GTCGCTCCCAGCATAATCTAGAATTTCCG--TTCA Halichoeres GTTTGGTCAGAGTGGGGCTTGGTT-CTCGAGCCCAAAGGCATCTCCACCTTGAGGGTCCC Anguilla ---------------GGGGCGGGG-CCAGGACCCAGAGGCGGGGCGAGGG---------A Homo AGTTTCTACCTGTATCACCCAAGGTGCAGTTTGATGTAGTAGTGTCAGCTTTTTC-CTTA * Candidia ATCCCACTCATCACCTCTTCCCTTCAGGGGGCAG--AGCTGAGGGGTGTGGCC-----TG Rutilus ATCCCACTGATCACCTCTTCCCTTCTGGGGGCAG--AGCTGAGGGGTGTGTCC-----TG Danio GTCCCTCTCAGCACCTCTTTCCTTCAGGGGGCAG--AGCTGAGGGACGGGGCC-----TG Paramisgurnus TCTCCCCTCATCAACTCGTCCCTTCGGGTGGCGC--ATCCGAGGGCCGTGGCC-----TG Halichoeres CTCACCCCTGTCACCCCCCTCCCTCAGATGAGCC--ACGTACACCACGCAGCCA----TG Anguilla GTC---------------GTCCCTCAGACGCAGG--AGGCGCAGTCCTCGGCGC----TC Homo AGTGAACTGCCCAGCAAGGCTGACCGCACTGAGGTAGTTCAAACCTTATGGCGTAAGACA * * Candidia AGCTTCTCCCCTGAGCAGTTGGTGAACTGCATTCTGG--AGGCAGAGCCTCCTCAGATTT Rutilus AGCTTCTCCCCTGAGCAGTTGGTGAACTGTATTCTGG--AGGCGGAGCCTCCTCAGATTT Danio AACTATTCCCCTGAACAATTGGTCAGCTGTATTCTAG--AGGCGGAGCCACCTCAAATTT Paramisgurnus ------TCCGCTGAGCAGCTGGTGAACTGTATTCTAG--AGGCGGAGCCTCCTCAGATTT Halichoeres AG------CCCAGAGGAATTCATCATGCGCATCATGG--AAGCAGAGCCACCAGAGATCT Anguilla A------CGCCGGAGCAGTTAATCAACCGCATCATCG--AGGCGGAGCCGCCGGAGATCT Homo GGTCATTTCCTGGTACTGGTGGAGAATGGAACAAAAGCTGGGCACAGCCTTCTCATGGAT * * * * * * ** **** * * * Candidia GCCTGAGA----------GAGCCAGTGAAGAAGCCATACACGGAGGC-CAGCATGATGAT Rutilus GCCTGAAA----------GAGCCAGTGAAAAAGCCGTACACTGAGGC-CAGCATGATGAT Danio ACCTGAGA----------GAGCCGGTGAAAAAGCCATACACTGAGGC-TAGCATGATGAT Paramisgurnus ACCTGAAA----------GAGCAGGTGCAGAAGCCGTACACTGAGGC-CAGCATGATGAT Halichoeres ACCTCATG----------GAGGAGCAGAAGAAGCCTTTTACCGAGGC-CAGCATGATGAT Anguilla ACCTCATG----------AAGGAGCTGAAGAAGCCCTTCACCGAGGA-CAGCATGATGAT Homo GCCAGGGATCTGGTCCTTAAGGGAAAAGAGAAGTCACCTTTGGACCCTCGACCTGGTTTT ** ** * *** * ** * ** * * Candidia GTCACTCACCAGCCTTGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAG Rutilus GTCACTAACCACCCTCGCTGACAAGGAACTGGTGCTCA--TGATCAGCTGGGCCAAGAAG Danio GTCACTAACAAGCCTCGCCGACAAGGAGCTGGTGCTCA--TGATTAGCTGGGCGAAGAAG Paramisgurnus GTCACTAACCAACCTTGCTGACAGGGAACTGGTGCTCA--TGATCAGCTGGGCTAAAAAA Halichoeres GTCCCTCACAAACCTGGCAGACAAGGAGCTGGTGCTTA--TGATCAGCTGGGCTAAAAAG Anguilla GTCACTCACCAACCTGGCCGACAAGGAGCTCGTCCTCA--TGATCAGCTGGGCCAAAAAG Homo GTCTTTGCCCCGTGTCCCCATGAACTCCCTTGTCCCCAGTTGACCAACCTGGCCTGTAGC *** * * * * * ** ** * * *** * * *** * Candidia ATACCA-GGTTTTGTGGAGCTGACACTTTCAGATCAGGTGCATCTATTGGAATGCTGCTG Rutilus ATACCA-GGTTTCGTGGAGCTGACGCTTTCAGATCAGGTGCATCTATTGGAATGCTGCTG Danio ATACCA-GGTTTTGTAGAGTTGACTTTGTCAGATCAGGTGCATTTGCTGGAATGCTGCTG Paramisgurnus ATACCA-GGTTTTGTGGAGCTGTGTTTGTCTGATCAGGTGCATCTGTTGGAATGCTGTTG Halichoeres ATCCCT-GGCTTTGTCGAGCTGTGTCTAGCTGATCAGATTCACCTCCTAAAGTGCTGCTG Anguilla ATCCCT-GGGTTTGTGGAGCTGGACCTGTCTGACCAAGTACACCTGCTGGAGTGCTGTTG Homo TTCTCACAGGCGTACCATCCCATCCCCTTCAGCTGGAACA-AGAAACCAAAGGAAGAAAA * * * * * * * Candidia GCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCAT Rutilus GCTGGATATTCTGATGTTGGGATTGATGTGGAGATCTGTGGATCATCCCGGGAAACTCAT Danio GCTGGATATTCTGATGTTAGGATTGATGTGGAGATCTGTGGATCATCCTGGGAAACTCAT Paramisgurnus GCTGGATATTCTGATGTTGGGACTGATGTGGAGATCCGTAGATCATCCTGGGAAACTCAT Halichoeres GTTGGAAATTCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCATCCTGGGAAACTAAT Anguilla GCTGGAGGTGCTGATGCTGGGCCTGATGTGGAGGTCTGTGGATCACCCTGGGAAACTCAT Homo GTTCTCTATGGTGATCCTTGCTCGGGGGTCTCCAGAGGAGGCTCATCGCTGGCCCCGTAT * * * **** * * * ** * * *** * ** * ** Candidia CTTCTCACCTGACCTCAAACTGAACAGGGATGAGTGGAATTGTGT-TGAAGGCATCATGG Rutilus CTTCTCACCCGACCTCAAACTGAACAGGGGTGAATGGAATTGTGT-TGAAGGCATCATGG Danio CTTCACCCCTGACCTCAAGCTCAACAGGGAGGAAGGGAATTGTGT-TGAAGGCATCATGG Paramisgurnus CTTCTCACCAGACCTCAAGCTCAACCGGGACGAATGGGGTTGTGT-TGAAGGCATCATGG Halichoeres CTTCTCTCCTGACTTCAAACTCAACAGAGAGGAGGGTCAGTGTGT-GGAGGGCATCATGG Anguilla CTTTTCCCCAGACCTCAAGCTCAACAGGGATGAGGGAAGTTGTGT-GGAGGGGATCCTGG Homo CACTCAGCCTGTCCTTAAACGGCCTCGCCATGTGCATTGTCACTTGTGCTGTCCAGATGG * ** * * * ** * * * * * * *** Candidia AGATCTTTGACATGCTGCTGGCCACGACCTCCAGATTCAG--AGAATTGAAGCTACAGAG Rutilus AGATCTTTGACATGCTGCTGGCCACCACCTCCAGATTCAG--AGAACTGAAGCTACAGAG Danio AGATTTTTGACATGCTGCTGGCCACCACCTCTCGATTCAG--AGAGCTGAAGCTGCAGAG Paramisgurnus AGATCTTTGACATGCTGCTGGCCACCACCTCTAGATTCAG--AGAACTGAAGCTACGGAG Halichoeres AGATCTTTGACATGCTGCTGGCTGCCACCTCTCGGTTTCG--TGAGCTGAAGCTTCAGAG Anguilla AAATCTTCGACATGGTGCTGGCGGCAACCTCCAGGTTTCG--GGAGCTGAAGCTACAGAG Homo GCACATGCAGCATGCTG-TGCTCACAGCCCGCCGGCACGGCAGGGATTTGTATCGTTGTG * * **** ** ** * ** * * * * * * Candidia GGAGGAATACGTCTGTCTCAAAGCCATGATCCTTCTCAACTCCAATAACTGTTCAAGCTT Rutilus GGAGGAATACGTCTGTCTCAAAGCCATGATCCTTCTCAACTCCAATAACTGTTCAAGCTT Danio AGAGGAATACGTCTGTCTCAAAGCCATGATCCTGCTCAACTCTAATAACTGTTCGAGTTT Paramisgurnus AGAGGAATATGTCTGCCTCAAAGCCATGATCCTCCTCAACCC------------------ Halichoeres GGAGGAGTACGTCTGTCTGAAGGCCATGATCCTCCTCAACTCCAATCTGTGTTCGAGCTC Anguilla GGAGGAGTATGTGTGCCTCAAAGCCATTATCCTCCTCAACCCCAACCTGTGCACAACGTC Homo CCCGTGTCAGCTCCTGGGGAGATCTTTTACCTGTGCTTACTCCG-TCTGCGTTTCCTCCA * * * * * * * * ** * 5
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服