1、综合序列分析软件BioEdit20032003级 高芳銮1.BioEdit简介BioEdit是一个性能优良的免费的生物序列编辑器,可在Windows 95/98/NT/2000中运行,它的基本功能是提供蛋白质、核酸序列的编辑、排列、处理和分析。与DNAMAN相比,其分析内容相对丰富一些,而且提供了很多网络程序的分析界面和接口,与DNAMAN等软件配合使用更好。尤其值得一提是利用BioEdit能够十分方面地根据指定的核酸序列绘制相应的质粒图谱。2.序列的常规操作:序列输入序列输入:多种序列输入方式;序列分类序列分类:按标题、位置、定义、参数、注释等分类;成对排列成对排列:两序列的最佳排列及计算同
2、一性和类似性;序列屏蔽序列屏蔽:仅采用联配中部分区域进行分析而排除其他。核酸分析核酸分析:组成、互补、反转、翻译、质粒、限制性内切酶;蛋白质分析蛋白质分析:氨基酸成分、疏水性轮廓、疏水力矩平均数翻译或反翻译翻译或反翻译:把DNA或RNA翻译成蛋白质;切换翻译切换翻译:在核酸和编码蛋白质序列中切换核苷酸序列;点图点图成对比较成对比较:相互比较两序列的矩阵,生成一个点图。3.BLASTBLAST本地使用BLASTo创建本地数据库o本地BLAST搜寻BLASTINTERNET客户端程序 ClustalWClustalW 使用互联网工具使用互联网工具 HTMLBLAST网络浏览器PSI-BLASTnn
3、Predict 进化分析进化分析4.主要内容 绘制质粒图绘制质粒图 限制性内切酶图限制性内切酶图 蛋白质分析蛋白质分析 组成分析组成分析熵图熵图疏水性轮廓疏水性轮廓联配中搜寻保守区联配中搜寻保守区 根据密码子的使用翻译核苷酸根据密码子的使用翻译核苷酸 RNARNARNARNA比较分析比较分析共变共变潜在配对潜在配对互交信息分析互交信息分析 5.一、绘制质粒图(Plasmind drawing)使用BioEdit质粒绘图功能,序列可以通过自动的位置标记,自动修改成环形质粒。特征、多连接位点和限制性位点可以通过使用对话框增加。当将一个序列进入质粒图时,在背景上出现一个限制性内切酶图谱,所以可以通过
4、对话框选择可以增加限制性位点。它们自动增加到当前的位点。质粒功能提供简单的绘制和标记工具。标签和绘图可以通过鼠标移动和缩放。想要编辑目标性质,双击目标。想要从一个DNA序列产生一个质粒,从“Sequence”菜单中“NucleicAcid”子菜单中选择“CreatePlasmidfromSequence”选项。选择这个选项时,限制性内切酶图谱将会使用通常商业化的,储存在存储器中的限制性内切酶。质粒第一次产生时,它显示成有10个位点标记的圆圈,中央是标题。6.7.1.Restriction sites:(限制性位点)想 要 增 加 限 制 性 位 点,从“Vector”菜 单 中 选 择“Res
5、trictionSites”选项。将会显示一下对话框:8.想要显示图谱中的限制性内切酶,从右边(“DontShow”中)选择任何想要的酶,用按钮将它们移动到左边。按下“Apply&Close”时,这个位点就会增加到图谱中。指定的酶如果只有一个酶切位点,就会在酶切位点上出现一个“U”。如果没有“U”,将会显示第一个酶切位点。想要移动图谱中酶的位置,在“Show”中增加选择的酶的亮度,按下按钮将它们移动另一边。9.2.Positional marks(位置标记):点击“Vector”菜单中的“PositionalMarks”选项,可以出现以下对话框:可以通过移动位置标记到“Show”中,单独增加位
6、置标记,或者设定应用的分割标记数量。想要没有标记,选择“Divideinto:”中的下拉菜单顶端的“None”。10.3.Features(特征):想要增加一个特征,如抗生素抵抗标记,从“Vector”菜单选择“AddFeature”。将显示以下对话框:选择的类型是“NormalArrow”、“WideArrow”、“NormalBox”和、“WideBox”。在上面例子中的所有特征是“常规”宽度的。如果特征是一个箭头,箭头的方向将是从起点位置到终点位置。增加特征或酶时,他们各自的标记增加在外面,中心是可能的尺寸。标记可以被选择工具选择、移动、编辑和缩放。11.4.General Vector
7、 properties 载体属性可通过选“Vector”菜单中的“Properties”来更改:12.可以通过指定起点和末端位置,来增加多接头按钮。多接头显示为“CourierNew”字体。在这个对话框中,特征可以被编辑、增加或者删除。想要编辑或删除一个现存的特征,在“Features”下拉式菜单中选择特征,并点击合适的按钮。点击“AddNew”按钮,可以增加一个新的特征。现在只有一个圆形、单链质粒是有效的。在以后的版本中中将会改进。“Font”按钮改变指示的默认字体。特征标记的字体将可以单独改变,但是位置标记不能单独改变。13.二、Restriction Maps(限制性内切酶图)BioEd
8、it提供两种方法产生核苷酸序列的限制性内切酶图。一种内在的限制性内切酶图功能允许产生序列最多为65,536个核苷酸的限制性内切酶图。实际上,只能检测大约35Kb,而且在速度慢的计算机上会要消耗很长的时间。你 也 可 以 通 过 万 维 网 直 接 链 接 到WebCutter限制性内切酶图上。14.1.1.WebCutterWebCutter:点亮你想要图谱的序列标题,从“WorldWideWeb”菜单中选择“Auto-fedWebCutterRestrictionMapping”15.2.BioEdit:2.BioEdit:点亮你想要图谱的序列标题,从“Sequence”菜单选择“Restr
9、ictionMap”。以下选项将会显示在一个界面窗口:16.显示图谱显示图谱:显示或省略序列的全图谱,互补链显示每个酶的酶切位点.默认值:yes 按照字母顺序排列名称按照字母顺序排列名称:显示关于所有内切酶、它们的识别序列、切割频率和所有位置(5末端开始是1)的列表.默认值:yes 位置数位置数:关于酶切位点的列表.默认值:no 唯一位点列表唯一位点列表:在全部序列中只有一个酶切位点的内切酶列表.默认值:no 切割切割5 5 5 5次或更少的酶次或更少的酶.默认值:yes 频率汇总表频率汇总表:关于所有正确选择的内切酶和它们切割序列的次数。默认值:no 不能切割的内切酶不能切割的内切酶。默认值
10、:yes 4-4-4-4-碱基内切酶碱基内切酶:想要包括这些酶,必须点击这个选项.默认值:no(不包括本身)5-5-5-5-碱基内切酶碱基内切酶:与4-base cutters相同.非严格识别序列的酶非严格识别序列的酶:有时你可排除它们.默认值:yes 大的识别位点大的识别位点:通常用于克隆,只有共同的6-碱基识别酶被使用.同裂酶同裂酶:若只显示一个特殊识别位点的一个内切酶,不选(默认值=不选择).翻译翻译:显示沿着排列中的序列翻译(5端到3端的由左到右的翻译)互补翻译互补翻译:互补链的翻译方向相反.编号方式编号方式:是酶切位点的核酸的号码,而不是识别位点的起点.17.3.Restrictio
11、n Enzyme Browser(3.Restriction Enzyme Browser(限制性内切酶浏览器限制性内切酶浏览器)从核酸序列中得到内切酶谱时,显示酶的生产公司是很有用的。通过在内切酶图谱中选择制造厂商和按下按钮,可以手动浏览内切酶。你也可以通过选择“Options”菜单中的“ViewRestrictionEnzymesbyManufacturer”选择,在任何时候检查内切酶。显示如右对话框:18.在这个例子中,所有来源于Stratagene的限制性内切酶显示在左边的列表中,KpnI的亮度增加。KpnI的识别序列显示在顶端,同裂酶显示在它的下方,其他提供KpnI的公司显示在同裂酶
12、的下方。BioEdit使用ReBase提供的gcgenz表,限制性内切酶数据在万维网的 地 址 是:http:/ 以 从ReBase 下 载 最 新 的 gcgenz 表,将 其 命 名 为“enzyme.tab”,并且替代在BioEdit安装文件夹中“tables”目录下的旧文件。注意注意:表必须是gcgenz格式的。你可以从tables文件夹中打开“enzyme.tab”文件查看格式,或者查看“RestrictionMaps”。限制性内切酶表格文件名必须是“enzyme.tab”,而且必须在BioEdit的“tables”文件夹里。19.1.1.氨基酸的组成从“Sequence”菜单下进入
13、“Protein”,再进入“aminaacidcomposition”,可对序列的氨基酸组成分析,结果以摘要和图例的形式给出。图例中的柱形条表示每种氨基酸在序列中的摩尔比,如下图:三、蛋白质分析20.以RGDVRGDVRGDVRGDV的minoroutercapsidproteinminoroutercapsidproteinAAS66885AAS66885AAS66885AAS66885为例:21.2.2.熵图在联配文件中有专栏用熵图来衡量可变性。它衡量的是在联配中每个位置的“信息量”的缺乏。准确地说,是每个位置的可预测性的缺乏。22.3.3.疏水性轮廓(profile)(profile)平
14、均疏水性轮廓采用Kyte&Doolittle的方法,平均分值(总和/窗口大小)作为序列中各个位置的疏水性值,并以窗口中中间残基的疏水性值作图。23.4.4.瞬间疏水性轮廓(hydrophobic moment hydrophobic moment profileprofile)24.5.5.平均瞬间疏水性轮廓25.6.在联配中搜寻保守区 有时,即使序列之间的变化很大时,在几个序列中搜寻保守区是有用的。例如,根据一系列同源序列发现通用的PCR引物。BioEdiot查找的是低平均“熵”的区域。首先选择你的序列,从“Aligment”-“FindConservedRegion”,对话框中各选项的内容
15、:26.BioEditversion5.0.9ConservedregionsearchAlignmentfile:Q:Ribosomal_RNAsome_methanos.bio5/10/048:57:33PMMinimumsegmentlength(actualforeachsequence):15Maximumaverageentropy:0.2Maximumentropyperposition:0.2Gapslimitedto2persegmentContiguousgapslimitedto1inanysegment2conservedregionsfoundRegion1:Posi
16、tion755to774Consensus:755AUUAGAUACCCGGGUAGUCC774 27.SegmentLength:20Averageentropy(Hx):0.0155Position755:0.0000Position756:0.0000Position757:0.0000Position758:0.0708Position759:0.0000Position760:0.0000Position761:0.0000Position762:0.0000Position763:0.0000Position764:0.0708Position765:0.0000Position7
17、66:0.1679Position767:0.0000Position768:0.0000Position769:0.0000Position770:0.0000Position771:0.0000Position772:0.0000Position773:0.0000Position774:0.000028.Region2:Position1206to1222ConsensusConsensus:1206ACACGCGGGCUACAAUG1222SegmentLength:17Averageentropy(Hx):0.0182Position1206:0.0000Position1207:0
18、.0000Position1208:0.0000Position1209:0.0000Position1210:0.0708Position1211:0.0708Position1212:0.0000Position1213:0.1679Position1214:0.0000Position1215:0.0000Position1216:0.0000Position1217:0.0000Position1218:0.0000Position1219:0.0000Position1220:0.0000Position1221:0.0000Position1222:0.000029.BioEdit
19、version5.0.9ConservedregionsearchConservedregionsearchAlignmentfile:G:Ribosomal_RNAsome_methanos.bio5/10/999:34:06PMMinimumsegmentlength(actualforeachsequence):10Maximumaverageentropy:0.4Maximumentropyperposition:0.4with2exceptionsallowedGapslimitedto2persegmentContiguousgapslimitedto1inanysegment36
20、conservedregionsfound36conservedregionsfound结果:30.7.7.根据密码子的使用翻译核苷酸核苷酸序列可根据三联体密码翻译预测的蛋白序列。从“Sequence”-“Protein”-“Translation”,选择要按何种读框翻译。例如,以下是一个假设的Methanobacterium(甲烷细菌)的ORF(开放阅读框架)。31.MTH671codingregionMTH671codingregionATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATA
21、ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATA
22、ATTGAGGTCGTCACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAAGGGAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAG
23、AGCCTTGAGAAGACAGACATTGTAAGGGAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGAT
24、ACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCAGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCATACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGTACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGGAGGTGATGGATAATGCCACTCAGACGCCG
25、GCGAAGGCTCCTCTCGGATCAAAAGAGGTGATGGATAATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAA32.A frame 1 of this sequence is displayed as follows in the BioEdit text editor:MTH671codingregionMTH671codingregion1ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451MetValAl
26、aValProGlySerGluIleLeuSerGlyAlaLeuHis151MetValAlaValProGlySerGluIleLeuSerGlyAlaLeuHis15 46GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9046GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9016ValValSerGlnSerLeuLeuIleProValIleAlaGlyLeuLeu3016ValValSerGlnSerLeuLeuIleProValIleAlaGlyLeuLeu30 91TTATTCATGGTAT
27、ACGCCATAGTGACCCTCGGAGGGCTCATATCA13591TTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCA13531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer4531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer45 136GAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCG180136GAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCG18046GluTyrSerGly
28、ArgIleArgThrAspValLysGluLeuGluSer6046GluTyrSerGlyArgIleArgThrAspValLysGluLeuGluSer60 181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT225181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT22561AlaIleLysSerIleSerAsnProGlyThrProGluLysIleIle7561AlaIleLysSerIleSerAsnProGlyThrProGluLysIleIle75 226GAGGTCGTCGA
29、TTCGATGGACATACCACAGAGCCAGAAGGCCGTG270226GAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTG27076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal9076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal9033.|A C G T|A C G T|A C G T|A C G T|-A|3 7 3 13|A A|3 7 3 13|A A|3 7 3 13|A A|3 7 3 13|A|0.76 0.12 0.04 0.07|0.76
30、0.12 0.04 0.07|0.76 0.12 0.04 0.07|0.76 0.12 0.04 0.07|Lys Thr Arg Ile|Lys Thr Arg Ile|Lys Thr Arg Ile|Lys Thr Arg Ile|-A|1 4 4 6|C A|1 4 4 6|C A|1 4 4 6|C A|1 4 4 6|C|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn
31、Thr Ser Ile|-A|8 1 6 7|G A|8 1 6 7|G A|8 1 6 7|G A|8 1 6 7|G|0.24 0.23 0.03 1|0.24 0.23 0.03 1|0.24 0.23 0.03 1|0.24 0.23 0.03 1|Lys Thr Arg Met|Lys Thr Arg Met|Lys Thr Arg Met|Lys Thr Arg Met|-A|4 3 1 3|T A|4 3 1 3|T A|4 3 1 3|T A|4 3 1 3|T|0.39 0.21 0.13 0.47|0.39 0.21 0.13 0.47|0.39 0.21 0.13 0.4
32、7|0.39 0.21 0.13 0.47|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|-34.四、RNA 的比较分析RNA的结构定义为核苷酸的碱基的相互作用。最简单情况下,即螺旋中的碱基对之间的Waltson-Crick碱基配对。RNA结构的系统发育比较分析方法建立在如下假定上,即在进化中核苷酸改变,但重要的RNA二级和三级结构保持不变。一个可能破坏结构的碱基变化可以由序列中另一处的变化补偿以保持结构稳定。所以不同物种的同源RNA中将包含“补偿碱基变化”或“共变化,协变(covariation)”。所以通过检
33、查来自各个不同生物的同源RNA,确定这些“补偿碱基变化”,从而阐明结构。例如,一给定的序列,GAAGA将可能与序列中任一UCUUC配对,而后者可能在序列中出现数次。如何确定到底是和哪一个配对呢?可以检查不同生物的同源RNA序列,找出“补偿碱基变化”。35.organism#1organism#1GAAGAGAAGAUCUUCUCUUCUCUUCUCUUCUCUUCUCUUCorganism#2organism#2GAUGAGAUGAUCUUCUCUUCUCUGCUCUGCUCAUCUCAUCorganism#2organism#2GAUGAGAUGAGCUUCGCUUCUCUACUCUACUC
34、AUCUCAUCorganism#2organism#2GACGAGACGAUCUUCUCUUCUCUGCUCUGCUCGUCUCGUC在此例中,只有最后一个UCUUC 才可和GAAGA 配对。象这样在序列中2 个位置出现“补偿碱基变化”,被认为是螺旋存在的证据。两条序列不能形成互补,表明不存在配对。在“系统发育比较分析”中关键是序列联配,同源序列必须适当联配。此处同源性是严格意义的:同源的核苷酸来自一个共同的祖先。所以开始时,先使用关系紧密的序列进行联配,这样在序列相似性基础上联配,不需要加入许多联配的空位。联配后互补序列的“协变”可被立即发现,从而开始构建二级结构,然后差异大的序列可以添进
35、联配中。这样持续添加新序列,进行“协变”分析,直到联配和二级结构模型出现此过程的完全描述。一旦一个完整的二级结构模型形成,“协变”分析可以鉴定非螺旋区的核苷酸之间的相互作用以及不规则的相互作用。之所以可以被鉴定,是因为涉及的核苷酸即使不形成规则的碱基配对或是一个螺旋的一部分,也仍一致的变化。36.1.1.共变化(Covariation)共变化指序列中两个残基步调一致地变化。严格地讲即每当联配序列中x变化时,y也变化,两者是一致的。(例如,当x变为A,y变为T。每次x变为A,y一定变为T)。残基间的共变化表明,它们之间一定有重要的相互作用,当重要结构残基突变时,自然选择保留了那些有补偿突变的序列
36、。vv共变化的例子共变化的例子 假设我们现有一个联配序列,它表示了几种物种共有的一个特定的RNA的保守的结构。我们希望从联配中包含的信息推测出RNA二级结构。37.|.|.|.|.|.|.|.|.|.|.10201020sample 1 sample 1 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAUCCGGsample 2 sample 2 CCGGAUACUAUCUUGGCGAAAGUAUCUGGCCGGAUACUAUCUUGGCGAAAGUAUCUGGsample 3 sample 3 CGGGAUACGAUCGACGCGUA
37、CGUAUCCCGCGGGAUACGAUCGACGCGUACGUAUCCCGsample 4 sample 4 CGCGGUACCAUCCACCCCUAGGUACCGCGCGCGGUACCAUCCACCCCUAGGUACCGCGsample 5 sample 5 CCGGAUACGAUCGUCCCGUUCGUAUCCGGCCGGAUACGAUCGUCCCGUUCGUAUCCGGsample 6 sample 6 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAUCCGGsample 7 sample 7 CCGGACACGAUCGUCG
38、GGUACGUAUCCGGCCGGACACGAUCGUCGGGUACGUAUCCGGsample 8 sample 8 CCAGAUACGAUCGAAACUUUCGUAUCUGGCCAGAUACGAUCGAAACUUUCGUAUCUGGsample 9 sample 9 CCGGUUACCAUCGUCGGGUAGGUAACCGGCCGGUUACCAUCGUCGGGUAGGUAACCGGsample 9 sample 9 CCGGAUACGAUCGACAGGAACGUAUCCGGCCGGAUACGAUCGACAGGAACGUAUCCGGsample 10 sample 10 CCGGAUACGA
39、UCGUCCCGUACGUAUCCGGCCGGAUACGAUCGUCCCGUACGUAUCCGGsample 11 sample 11 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAUCCGGsample 12 sample 12 CCUGAUACUAUCGUCGCCUAAGUAUCGGGCCUGAUACUAUCGUCGCCUAAGUAUCGGGsample 13 sample 13 CGGGGUACGAUCGAGGCCUACGUACCCCGCGGGGUACGAUCGAGGCCUACGUACCCCGsample 14 sample 1
40、4 CCCGCUACGAUCGAGGCCUUCGUAGCGGGCCCGCUACGAUCGAGGCCUUCGUAGCGGGsample 15 sample 15 CCGGAUACGAUCGAGGCCUUCGUAUCCGGCCGGAUACGAUCGAGGCCUUCGUAUCCGGvv下面是一个联配的例子下面是一个联配的例子38.CovariationanalysisCovariationanalysisInputfile:I:BioEdithelpsamples.gbInputfile:I:BioEdithelpsamples.gbPositionnumberingisrelativetothea
41、lignmentnumbering.Positionnumberingisrelativetothealignmentnumbering.Nomaskwasused.Nomaskwasused.1CCCCCCCCCCCCCCCC1CCCCCCCCCCCCCCCC Position2:Position2:2CCGGCCCCCCCCCGCC2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGGAllpotentialWatsonCrickorG28GGCCGGGGGGGGGCGGAllpotentialWatsonCrickorG UpairsUpairs3GGGCGGGAGGGG
42、UGCG3GGGCGGGAGGGGUGCG4GGGGGGGGGGGGGGGG4GGGGGGGGGGGGGGGG Position5:Position5:5AAAGAAAAUAAAAGCA5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG UpairsUpairs6UUUUUUCUUUUUUUUU6UUUUUUCUUUUUUUUU7AAAAAAAAAAAAAAAA7AAAAAAAAAAAAAAAA8CCCCCCCCCCCCCCCC8CCC
43、CCCCCCCCCCCCC39.Position9:Position9:9GUGCGGGGCGGGUGGG9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG UpairsUpairs10AAAAAAAAAAAAAAAA10AAAAAAAAAAAAAAAA11UUUUUUUUUUUUUUUU11UUUUUUUUUUUUUUUU12CCCCCCCCCCCCCCCC12CCCCCCCCCCCCCCCC13GUGCGGGGGGGGGGGG13G
44、UGCGGGGGGGGGGGG14UUAAUUUAUAUUUAAA14UUAAUUUAUAUUUAAA15CGCCCCCACCCCCGGG15CGCCCCCACCCCCGGG16GGGCCGGAGACGGGGG16GGGCCGGAGACGGGGG17GCCCCGGCGGCGCCCC17GCCCCGGCGGCGCCCC18GGGCGGGUGGGGCCCC18GGGCGGGUGGGGCCCC19UAUUUUUUUAUUUUUU19UAUUUUUUUAUUUUUU20AAAAUAAUAAAAAAUU20AAAAUAAUAAAAAAUU40.Position21:Position21:21CACGCC
45、CCGCCCACCC21CACGCCCCGCCCACCC9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG UpairsUpairs22GGGGGGGGGGGGGGGG22GGGGGGGGGGGGGGGG23UUUUUUUUUUUUUUUU23UUUUUUUUUUUUUUUU24AAAAAAAAAAAAAAAA24AAAAAAAAAAAAAAAA Position25:Position25:25UUUCUUUUAUUUUCGU25UUUCUUUUAUUUUCGU5AAAGA
46、AAAUAAAAGCAAllpotentialWatsonCrickorG5AAAGAAAAUAAAAGCAAllpotentialWatsonCrickorG UpairsUpairs26CCCCCCCCCCCCCCCC26CCCCCCCCCCCCCCCC27CUCGCCCUCCCCGCGC27CUCGCCCUCCCCGCGCPosition28:Position28:28GGCCGGGGGGGGGCGG28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCCAllpotentialWatsonCrickorG2CCGGCCCCCCCCCGCCAllpotentialWatso
47、nCrickorG UpairsUpairs29GGGGGGGGGGGGGGGG29GGGGGGGGGGGGGGGG 41.在上述联配中共有3 对“共变化”的位置点:2/28,5/25,9/21。两个碱基共变表明它们很可能相互作用。如果一个突变发生在与其他碱基有重要作用的碱基上(常是碱基对),选择压力可能会只保留在另一处碱基上发生补偿突变的碱基。事实上,上述的碱基共变化都发生在规则的碱基对(Watson-Crick 碱基对或在RNA 中G-U)表明它们可能是碱基配对。共变化碱基对2/5 分别和5/25 的距离相同,而5/25 分别和9/21 的距离也相同,而且界于它们之间的碱基也可形成碱基互补
48、,这都表明联配序列的两端可能闭合形成螺旋如下是“Sample1”形成的结构。U C U C A G A G-C C G G A T A C G U-C C G G A T A C G U-G G C C T A T G C C-G G C C T A T G C C A G A G U G G U G G 42.2.2.潜在配对分析潜在配对分析potential pairingpotential pairing 当RNA分子中两个核苷酸之间存在配对碱基的相互作用力。一个碱基发生突变,另一个碱基为了补偿这一突变,可能不仅仅是某一特定核苷酸突变(例如原来的A-T配对可能在一序列中转换为G-C,而另
49、一序列中为G-U,)这在共变化分析中将被忽略。因为此种改变并不遵循完全相同的模式。要鉴定这种情况,可以在潜在配对中选定碱基配对的规则。仍用上例中的序列(sample 1 sample 1 sample 15 sample 15 略)BioEdit中并不要求有位置变化,所以未改变的位置上只要可以形成碱基对,也能被发现同时也可在“preference”中设置以滤出未改变的位置之间的碱基配对。以下是一个联配序列它和在共变化分析中使用的相同。设置允许A-U/G-C/G-U碱基配对规则以及1个错配,产生下列的结果(以清单格式,滤除了未变化位置的潜在配对)比较这一结果和共变化的结果,发现位置3/27有一潜
50、在的配对,而共变化的结果未检出。潜在配对的数据也可以按允许的配对出现的频率或原始允许配对的数目列出一个(二维矩阵)表。43.PotentialPairingsListInputFile:I:BioEdithelpsamples.gbAllowedMispairings=116totalsequences,29nucleotidespersequence.Axesreflectnumberingoftheentirealignment.NoMaskwasused.Hitsoninvariantpairshavebeenfilteredout.1CCCCCCCCCCCCCCCCPosition:2