1、序列常规操作:序列常规操作:序列输入序列输入序列输入序列输入:各种序列输入方式;序列分类序列分类序列分类序列分类:按标题、位置、定义、参数、注释等分类;成对排列成对排列成对排列成对排列:两序列最正确排列及计算同一性和类似性;序列屏蔽序列屏蔽序列屏蔽序列屏蔽:仅采取联配中部分区域进行分析而排除其它。核酸分析核酸分析核酸分析核酸分析:组成、互补、反转、翻译、质粒、限制性内切酶;蛋白质分析蛋白质分析蛋白质分析蛋白质分析:氨基酸成份、疏水性轮廓、疏水力矩平均数翻译或反翻译翻译或反翻译翻译或反翻译翻译或反翻译:把DNA或RNA翻译成蛋白质;切换翻译切换翻译切换翻译切换翻译:在核酸和编码蛋白质序列中切换核
2、苷酸序列;点图点图点图点图成对比较成对比较:相互比较两序列矩阵,生成一个点图。第1页 BLASTBLAST当地使用BLASTo创建当地数据库o当地BLAST搜寻BLASTINTERNET客户端程序 ClustalWClustalW 使用互联网工具使用互联网工具使用互联网工具使用互联网工具 HTMLBLAST网络浏览器PSI-BLASTnnPredict 进化分析进化分析进化分析进化分析第2页综合序列分析软件BioEdit第3页BioEdit介绍介绍BioEdit是一个性能优良无偿生物序列编辑器,可在Windows 95/98/NT/中运行,它基本功效是提供蛋白质、核酸序列编辑、排列、处理和分析
3、。与DNAMAN相比,其分析内容相对丰富一些,而且提供了很多网络程序分析界面和接口,与DNAMAN等软件配合使用更加好。尤其值得一提是利用BioEdit能够十分方面地依据指定核酸序列绘制对应质粒图谱。第4页主要内容主要内容 绘制质粒图绘制质粒图绘制质粒图绘制质粒图 限制性内切酶图限制性内切酶图限制性内切酶图限制性内切酶图 蛋白质分析蛋白质分析蛋白质分析蛋白质分析 组成份析组成份析组成份析组成份析熵图熵图熵图熵图疏水性轮廓疏水性轮廓疏水性轮廓疏水性轮廓联配中搜寻保守区联配中搜寻保守区联配中搜寻保守区联配中搜寻保守区 依据密码子使用翻译核苷酸依据密码子使用翻译核苷酸依据密码子使用翻译核苷酸依据密码
4、子使用翻译核苷酸 RNARNARNARNA比较分析比较分析比较分析比较分析共变共变共变共变潜在配对潜在配对潜在配对潜在配对互交信息分析互交信息分析互交信息分析互交信息分析 第5页一、绘制质粒图(一、绘制质粒图(Plasmind drawing)使用BioEdit质粒绘图功效,序列能够经过自动位置标识,自动修改成环形质粒。特征、多连接位点和限制性位点能够经过使用对话框增加。当将一个序列进入质粒图时,在背景上出现一个限制性内切酶图谱,所以能够经过对话框选择能够增加限制性位点。它们自动增加到当前位点。质粒功效提供简单绘制和标识工具。标签和绘图能够经过鼠标移动和缩放。想要编辑目标性质,双击目标。想要从
5、一个DNA序列产生一个质粒,从“Sequence”菜单中“NucleicAcid”子菜单中选择“CreatePlasmidfromSequence”选项。选择这个选项时,限制性内切酶图谱将会使用通常商业化,储存在存放器中限制性内切酶。质粒第一次产生时,它显示成有10个位点标识圆圈,中央是标题。第6页第7页1.Restriction sites:(限制性位点限制性位点)想要增加限制性位点,从“Vector”菜单中选择“RestrictionSites”选项。将会显示一下对话框:第8页想要显示图谱中限制性内切酶,从右边(“DontShow”中)选择任何想要酶,用按钮将它们移动到左边。按下“Appl
6、y&Close”时,这个位点就会增加到图谱中。指定酶假如只有一个酶切位点,就会在酶切位点上出现一个“U”。假如没有“U”,将会显示第一个酶切位点。想要移动图谱中酶位置,在“Show”中增加选择酶亮度,按下按钮将它们移动另一边。第9页2.Positional marks(位置标识位置标识):点击“Vector”菜单中“PositionalMarks”选项,能够出现以下对话框:能够经过移动位置标识到“Show”中,单独增加位置标识,或者设定应用分割标识数量。想要没有标识,选择“Divideinto:”中下拉菜单顶端“None”。第10页3.Features(特征特征):想要增加一个特征,如抗生素抵
7、抗标识,从“Vector”菜单项选择择“AddFeature”。将显示以下对话框:选择类型是“NormalArrow”、“WideArrow”、“NormalBox”和、“WideBox”。在上面例子中全部特征是“常规”宽度。假如特征是一个箭头,箭头方向将是从起点位置到终点位置。增加特征或酶时,他们各自标识增加在外面,中心是可能尺寸。标识能够被选择工具选择、移动、编辑和缩放。第11页4.General Vector properties 载体属性可经过选“Vector”菜单中“Properties”来更改:第12页能够经过指定起点和末端位置,来增加多接头按钮。多接头显示为“CourierNew
8、”字体。在这个对话框中,特征能够被编辑、增加或者删除。想要编辑或删除一个现存特征,在“Features”下拉式菜单中选择特征,并点击适当按钮。点击“AddNew”按钮,能够增加一个新特征。现在只有一个圆形、单链质粒是有效。在以后版本中中将会改进。“Font”按钮改变指示默认字体。特征标识字体将能够单独改变,不过位置标识不能单独改变。第13页二、二、Restriction Maps(限制性内切酶图限制性内切酶图)BioEdit提供两种方法产生核苷酸序列限制性内切酶图。一个内在限制性内切酶图功效允许产生序列最多为65,536个核苷酸限制性内切酶图。实际上,只能检测大约35Kb,而且在速度慢计算机上
9、会要消耗很长时间。你 也 能 够 经 过 万 维 网 直 接 链 接 到WebCutter限制性内切酶图上。第14页1.1.WebCutterWebCutter:点亮你想要图谱序列标题,从“WorldWideWeb”菜单中选择“Auto-fedWebCutterRestrictionMapping”第15页2.BioEdit:2.BioEdit:点亮你想要图谱序列标题,从“Sequence”菜单项选择择“RestrictionMap”。以下选项将会显示在一个界面窗口:第16页 显示图谱显示图谱显示图谱显示图谱:显示或省略序列全图谱,互补链显示每个酶酶切位点.默认值:yes 按照字母次序排列名称
10、按照字母次序排列名称按照字母次序排列名称按照字母次序排列名称:显示关于全部内切酶、它们识别序列、切割频率和全部位置(5末端开始是1)列表.默认值:yes 位置数位置数位置数位置数:关于酶切位点列表.默认值:no 唯一位点列表唯一位点列表唯一位点列表唯一位点列表:在全部序列中只有一个酶切位点内切酶列表.默认值:no 切割切割切割切割5 5 5 5次或更少酶次或更少酶次或更少酶次或更少酶.默认值:yes 频率汇总表频率汇总表频率汇总表频率汇总表:关于全部正确选择内切酶和它们切割序列次数。默认值:no 不能切割内切酶不能切割内切酶不能切割内切酶不能切割内切酶。默认值:yes 4-4-4-4-碱基内切
11、酶碱基内切酶碱基内切酶碱基内切酶:想要包含这些酶,必须点击这个选项.默认值:no(不包含本身)5-5-5-5-碱基内切酶碱基内切酶碱基内切酶碱基内切酶:与4-base cutters相同.非严格识别序列酶非严格识别序列酶非严格识别序列酶非严格识别序列酶:有时你可排除它们.默认值:yes 大识别位点大识别位点大识别位点大识别位点:通惯用于克隆,只有共同6-碱基识别酶被使用.同裂酶同裂酶同裂酶同裂酶:若只显示一个特殊识别位点一个内切酶,不选(默认值=不选择).翻译翻译翻译翻译:显示沿着排列中序列翻译(5端到3端由左到右翻译)互补翻译互补翻译互补翻译互补翻译:互补链翻译方向相反.编号方式编号方式编号
12、方式编号方式:是酶切位点核酸号码,而不是识别位点起点.第17页3.Restriction Enzyme Browser(3.Restriction Enzyme Browser(限制性内切酶浏览器限制性内切酶浏览器限制性内切酶浏览器限制性内切酶浏览器)从核酸序列中得到内切酶谱时,显示酶生产企业是很有用。经过在内切酶图谱中选择制造厂商和按下按钮,能够手动浏览内切酶。你也能够经过选择“Options”菜单中“ViewRestrictionEnzymesbyManufacturer”选择,在任何时候检验内切酶。显示如右对话框:第18页在这个例子中,全部起源于Stratagene限制性内切酶显示在左边
13、列表中,KpnI亮度增加。KpnI识别序列显示在顶端,同裂酶显示在它下方,其它提供KpnI企业显示在同裂酶下方。BioEdit使用ReBase提供gcgenz表,限 制 性 内 切 酶 数 据 在 万 维 网 地 址 是:http:/ moment hydrophobic moment profileprofile)第24页5.5.平均瞬间疏水性轮廓平均瞬间疏水性轮廓第25页6.在联配中搜寻保守区在联配中搜寻保守区 有时,即使序列之间改变很大时,在几个序列中搜寻保守区是有用。比如,依据一系列同源序列发觉通用PCR引物。BioEdiot查找是低平均“熵”区域。首先选择你序列,从“Aligment
14、”-“FindConservedRegion”,对话框中各选项内容:第26页BioEditversion5.0.9ConservedregionsearchAlignmentfile:Q:Ribosomal_RNAsome_methanos.bio5/10/048:57:33PMMinimumsegmentlength(actualforeachsequence):15Maximumaverageentropy:0.2Maximumentropyperposition:0.2Gapslimitedto2persegmentContiguousgapslimitedto1inanysegment
15、2conservedregionsfoundRegion1:Position755to774Consensus:755AUUAGAUACCCGGGUAGUCC774 第27页SegmentLength:20Averageentropy(Hx):0.0155Position755:0.0000Position756:0.0000Position757:0.0000Position758:0.0708Position759:0.0000Position760:0.0000Position761:0.0000Position762:0.0000Position763:0.0000Position76
16、4:0.0708Position765:0.0000Position766:0.1679Position767:0.0000Position768:0.0000Position769:0.0000Position770:0.0000Position771:0.0000Position772:0.0000Position773:0.0000Position774:0.0000第28页Region2:Position1206to1222ConsensusConsensus:1206ACACGCGGGCUACAAUG1222SegmentLength:17Averageentropy(Hx):0.0
17、182Position1206:0.0000Position1207:0.0000Position1208:0.0000Position1209:0.0000Position1210:0.0708Position1211:0.0708Position1212:0.0000Position1213:0.1679Position1214:0.0000Position1215:0.0000Position1216:0.0000Position1217:0.0000Position1218:0.0000Position1219:0.0000Position1220:0.0000Position1221
18、:0.0000Position1222:0.0000第29页BioEditversion5.0.9ConservedregionsearchConservedregionsearchAlignmentfile:G:Ribosomal_RNAsome_methanos.bio5/10/999:34:06PMMinimumsegmentlength(actualforeachsequence):10Maximumaverageentropy:0.4Maximumentropyperposition:0.4with2exceptionsallowedGapslimitedto2persegmentC
19、ontiguousgapslimitedto1inanysegment36conservedregionsfound36conservedregionsfound结果:结果:第30页7.7.依据密码子使用翻译核苷酸依据密码子使用翻译核苷酸核苷酸序列可依据三联体密码翻译预测蛋白序列。从“Sequence”-“Protein”-“Translation”,选择要按何种读框翻译。比如,以下是一个假设Methanobacterium(甲烷细菌)ORF(开放阅读框架)。第31页 MTH671codingregionMTH671codingregionATGGTTGCAGTACCCGGCAGTGAGATA
20、CTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACACGTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGGCAGGTCTACTGTTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCAGAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAA
21、CTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCACTGATGTTAAGGAACTTGAATCGGCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATTGAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAGATTCGATGGACATACCACAGAGCCAGAAGGCCGTGCTCACTGATATCGCAGGGACAGCTGAACTCGGACCAAAATCAAGG
22、GAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAAGGGAGGCCCTCGCAAGGAAGTTGATAGAGAATGAGGAACTCAGGGCTGCCAAGAGCCTTGAGAAGACAGACATTGTAACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTCGGGGCAGGTACCAGACTCGGCCCAACCCTTGGACTGATGGGGACACTCATACCCATGGGTCCAGGACTCGCAGCCCTC
23、GGGGCAGGTGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCAGACATCAATACACTGGCCCAGGCCATCATCATAGCCTTCGATACAACAGTTGTGGGACTTGCATCAGGGGGTATAGCATACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAGACAATGGCCGAGGCAGTGCTGTACATCATCTCCAAGGTCAGGAGAAGATGGTATGAGGAGTACCTCTCAAATCTTGAG
24、ACAATGGCCGAGGCAGTGCTGGAGGTGATGGATAATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAAGAGGTGATGGATAATGCCACTCAGACGCCGGCGAAGGCTCCTCTCGGATCAAAA第32页A frame 1 of this sequence is displayed as follows in the BioEdit text editor:MTH671codingregionMTH671codingregion1ATGGTTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451ATGG
25、TTGCAGTACCCGGCAGTGAGATACTGAGCGGTGCACTACAC451MetValAlaValProGlySerGluIleLeuSerGlyAlaLeuHis151MetValAlaValProGlySerGluIleLeuSerGlyAlaLeuHis15 46GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9046GTTGTCTCCCAGAGCCTCCTCATACCGGTTATAGCAGGTCTACTG9016ValValSerGlnSerLeuLeuIleProValIleAlaGlyLeuLeu3016ValValSerGl
26、nSerLeuLeuIleProValIleAlaGlyLeuLeu30 91TTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCA13591TTATTCATGGTATACGCCATAGTGACCCTCGGAGGGCTCATATCA13531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer4531LeuPheMetValTyrAlaIleValThrLeuGlyGlyLeuIleSer45 136GAGTACTCTGGAAGGATAAGGACTGATGTTAAGGAACTTGAATCG180136GAGTACTCTG
27、GAAGGATAAGGACTGATGTTAAGGAACTTGAATCG18046GluTyrSerGlyArgIleArgThrAspValLysGluLeuGluSer6046GluTyrSerGlyArgIleArgThrAspValLysGluLeuGluSer60 181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT225181GCAATAAAATCAATTTCAAACCCAGGAACCCCTGAAAAGATAATT22561AlaIleLysSerIleSerAsnProGlyThrProGluLysIleIle7561AlaIleLysS
28、erIleSerAsnProGlyThrProGluLysIleIle75 226GAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTG270226GAGGTCGTCGATTCGATGGACATACCACAGAGCCAGAAGGCCGTG27076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal9076GluValValAspSerMetAspIleProGlnSerGlnLysAlaVal90第33页|A C G T|A C G T|A C G T|A C G T|-A|3 7 3 13|A A|3 7 3 13|
29、A A|3 7 3 13|A A|3 7 3 13|A|0.76 0.12 0.04 0.07|0.76 0.12 0.04 0.07|0.76 0.12 0.04 0.07|0.76 0.12 0.04 0.07|Lys Thr Arg Ile|Lys Thr Arg Ile|Lys Thr Arg Ile|Lys Thr Arg Ile|-A|1 4 4 6|C A|1 4 4 6|C A|1 4 4 6|C A|1 4 4 6|C|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46|0.61 0.43 0.27 0.46
30、|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|-A|8 1 6 7|G A|8 1 6 7|G A|8 1 6 7|G A|8 1 6 7|G|0.24 0.23 0.03 1|0.24 0.23 0.03 1|0.24 0.23 0.03 1|0.24 0.23 0.03 1|Lys Thr Arg Met|Lys Thr Arg Met|Lys Thr Arg Met|Lys Thr Arg Met|-A|4 3 1 3|T A|4 3 1 3|T A|4 3 1 3|T A|4 3 1 3|T|0.39
31、0.21 0.13 0.47|0.39 0.21 0.13 0.47|0.39 0.21 0.13 0.47|0.39 0.21 0.13 0.47|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|Asn Thr Ser Ile|-第34页四、四、RNA 比较分析比较分析RNA结构定义为核苷酸碱基相互作用。最简单情况下,即螺旋中碱基对之间Waltson-Crick碱基配对。RNA结构系统发育比较分析方法建立在以下假定上,即在进化中核苷酸改变,但主要RNA二级和三级结构保持不变。一个可能破坏结构碱基改变能够由序列中另一处改变赔偿以保持结构稳定。所以
32、不一样物种同源RNA中将包含“赔偿碱基改变”或“共改变,协变(covariation)”。所以经过检验来自各个不一样生物同源RNA,确定这些“赔偿碱基改变”,从而说明结构。比如,一给定序列,GAAGA将可能与序列中任一UCUUC配对,而后者可能在序列中出现数次。怎样确定到底是和哪一个配对呢?能够检验不一样生物同源RNA序列,找出“赔偿碱基改变”。第35页organism#1organism#1GAAGAGAAGAUCUUCUCUUCUCUUCUCUUCUCUUCUCUUCorganism#2organism#2GAUGAGAUGAUCUUCUCUUCUCUGCUCUGCUCAUCUCAUCor
33、ganism#2organism#2GAUGAGAUGAGCUUCGCUUCUCUACUCUACUCAUCUCAUCorganism#2organism#2GACGAGACGAUCUUCUCUUCUCUGCUCUGCUCGUCUCGUC在此例中,只有最终一个UCUUC 才可和GAAGA 配对。象这么在序列中2 个位置出现“赔偿碱基改变”,被认为是螺旋存在证据。两条序列不能形成互补,表明不存在配对。在“系统发育比较分析”中关键是序列联配,同源序列必须适当联配。此处同源性是严格意义:同源核苷酸来自一个共同祖先。所以开始时,先使用关系紧密序列进行联配,这么在序列相同性基础上联配,不需要加入许多联配空
34、位。联配后互补序列“协变”可被马上发觉,从而开始构建二级结构,然后差异大序列能够添进联配中。这么连续添加新序列,进行“协变”分析,直到联配和二级结构模型出现此过程完全描述。一旦一个完整二级结构模型形成,“协变”分析能够判定非螺旋区核苷酸之间相互作用以及不规则相互作用。之所以能够被判定,是因为包括核苷酸即使不形成规则碱基配对或是一个螺旋一部分,也仍一致改变。第36页1.1.共改变共改变(Covariation)共改变指序列中两个残基步调一致地改变。严格地讲即每当联配序列中x改变时,y也改变,二者是一致。(比如,当x变为A,y变为T。每次x变为A,y一定变为T)。残基间共改变表明,它们之间一定有主
35、要相互作用,当主要结构残基突变时,自然选择保留了那些有赔偿突变序列。vv共改变例子共改变例子共改变例子共改变例子 假设我们现有一个联配序列,它表示了几个物种共有一个特定RNA保守结构。我们希望从联配中包含信息推测出RNA二级结构。第37页.|.|.|.|.|.|.|.|.|.|.10201020sample 1 sample 1 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAUCCGGsample 2 sample 2 CCGGAUACUAUCUUGGCGAAAGUAUCUGGCCGGAUACUAUCUUGGCGAAAGUAUCUGG
36、sample 3 sample 3 CGGGAUACGAUCGACGCGUACGUAUCCCGCGGGAUACGAUCGACGCGUACGUAUCCCGsample 4 sample 4 CGCGGUACCAUCCACCCCUAGGUACCGCGCGCGGUACCAUCCACCCCUAGGUACCGCGsample 5 sample 5 CCGGAUACGAUCGUCCCGUUCGUAUCCGGCCGGAUACGAUCGUCCCGUUCGUAUCCGGsample 6 sample 6 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAU
37、CCGGsample 7 sample 7 CCGGACACGAUCGUCGGGUACGUAUCCGGCCGGACACGAUCGUCGGGUACGUAUCCGGsample 8 sample 8 CCAGAUACGAUCGAAACUUUCGUAUCUGGCCAGAUACGAUCGAAACUUUCGUAUCUGGsample 9 sample 9 CCGGUUACCAUCGUCGGGUAGGUAACCGGCCGGUUACCAUCGUCGGGUAGGUAACCGGsample 9 sample 9 CCGGAUACGAUCGACAGGAACGUAUCCGGCCGGAUACGAUCGACAGGAAC
38、GUAUCCGGsample 10 sample 10 CCGGAUACGAUCGUCCCGUACGUAUCCGGCCGGAUACGAUCGUCCCGUACGUAUCCGGsample 11 sample 11 CCGGAUACGAUCGUCGGGUACGUAUCCGGCCGGAUACGAUCGUCGGGUACGUAUCCGGsample 12 sample 12 CCUGAUACUAUCGUCGCCUAAGUAUCGGGCCUGAUACUAUCGUCGCCUAAGUAUCGGGsample 13 sample 13 CGGGGUACGAUCGAGGCCUACGUACCCCGCGGGGUACG
39、AUCGAGGCCUACGUACCCCGsample 14 sample 14 CCCGCUACGAUCGAGGCCUUCGUAGCGGGCCCGCUACGAUCGAGGCCUUCGUAGCGGGsample 15 sample 15 CCGGAUACGAUCGAGGCCUUCGUAUCCGGCCGGAUACGAUCGAGGCCUUCGUAUCCGGvv下面是一个联配例子下面是一个联配例子第38页CovariationanalysisCovariationanalysisInputfile:I:BioEdithelpsamples.gbInputfile:I:BioEdithelpsample
40、s.gbPositionnumberingisrelativetothealignmentnumbering.Positionnumberingisrelativetothealignmentnumbering.Nomaskwasused.Nomaskwasused.1CCCCCCCCCCCCCCCC1CCCCCCCCCCCCCCCC Position2:Position2:2CCGGCCCCCCCCCGCC2CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGGAllpotentialWatsonCrickorG28GGCCGGGGGGGGGCGGAllpotentialWat
41、sonCrickorG UpairsUpairs3GGGCGGGAGGGGUGCG3GGGCGGGAGGGGUGCG4GGGGGGGGGGGGGGGG4GGGGGGGGGGGGGGGG Position5:Position5:5AAAGAAAAUAAAAGCA5AAAGAAAAUAAAAGCA25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG25UUUCUUUUAUUUUCGUAllpotentialWatsonCrickorG UpairsUpairs6UUUUUUCUUUUUUUUU6UUUUUUCUUUUUUUUU7AAAAAAAAAAAAAAAA7
42、AAAAAAAAAAAAAAAA8CCCCCCCCCCCCCCCC8CCCCCCCCCCCCCCCC第39页Position9:Position9:9GUGCGGGGCGGGUGGG9GUGCGGGGCGGGUGGG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG21CACGCCCCGCCCACCCAllpotentialWatsonCrickorG UpairsUpairs10AAAAAAAAAAAAAAAA10AAAAAAAAAAAAAAAA11UUUUUUUUUUUUUUUU11UUUUUUUUUUUUUUUU12CCCCCCCCCCCCCCCC1
43、2CCCCCCCCCCCCCCCC13GUGCGGGGGGGGGGGG13GUGCGGGGGGGGGGGG14UUAAUUUAUAUUUAAA14UUAAUUUAUAUUUAAA15CGCCCCCACCCCCGGG15CGCCCCCACCCCCGGG16GGGCCGGAGACGGGGG16GGGCCGGAGACGGGGG17GCCCCGGCGGCGCCCC17GCCCCGGCGGCGCCCC18GGGCGGGUGGGGCCCC18GGGCGGGUGGGGCCCC19UAUUUUUUUAUUUUUU19UAUUUUUUUAUUUUUU20AAAAUAAUAAAAAAUU20AAAAUAAUAAA
44、AAAUU第40页Position21:Position21:21CACGCCCCGCCCACCC21CACGCCCCGCCCACCC9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG9GUGCGGGGCGGGUGGGAllpotentialWatsonCrickorG UpairsUpairs22GGGGGGGGGGGGGGGG22GGGGGGGGGGGGGGGG23UUUUUUUUUUUUUUUU23UUUUUUUUUUUUUUUU24AAAAAAAAAAAAAAAA24AAAAAAAAAAAAAAAA Position25:Position25:25U
45、UUCUUUUAUUUUCGU25UUUCUUUUAUUUUCGU5AAAGAAAAUAAAAGCAAllpotentialWatsonCrickorG5AAAGAAAAUAAAAGCAAllpotentialWatsonCrickorG UpairsUpairs26CCCCCCCCCCCCCCCC26CCCCCCCCCCCCCCCC27CUCGCCCUCCCCGCGC27CUCGCCCUCCCCGCGCPosition28:Position28:28GGCCGGGGGGGGGCGG28GGCCGGGGGGGGGCGG2CCGGCCCCCCCCCGCCAllpotentialWatsonCri
46、ckorG2CCGGCCCCCCCCCGCCAllpotentialWatsonCrickorG UpairsUpairs29GGGGGGGGGGGGGGGG29GGGGGGGGGGGGGGGG 第41页在上述联配中共有3 对“共改变”位置点:2/28,5/25,9/21。两个碱基共变表明它们很可能相互作用。假如一个突变发生在与其它碱基有主要作用碱基上(常是碱基对),选择压力可能会只保留在另一处碱基上发生赔偿突变碱基。实际上,上述碱基共改变都发生在规则碱基对(Watson-Crick 碱基对或在RNA 中G-U)表明它们可能是碱基配对。共改变碱基对2/5 分别和5/25 距离相同,而5/25
47、分别和9/21 距离也相同,而且界于它们之间碱基也可形成碱基互补,这都表明联配序列两端可能闭合形成螺旋以下是“Sample1”形成结构。U C U C A G A G-C C G G A T A C G U-C C G G A T A C G U-G G C C T A T G C C-G G C C T A T G C C A G A G U G G U G G 第42页2.2.潜在配对分析潜在配对分析潜在配对分析潜在配对分析potential pairingpotential pairing 当RNA分子中两个核苷酸之间存在配对碱基相互作用力。一个碱基发生突变,另一个碱基为了赔偿这一突变,
48、可能不但仅是某一特定核苷酸突变(比如原来A-T配对可能在一序列中转换为G-C,而另一序列中为G-U,)这在共改变分析中将被忽略。因为此种改变并不遵照完全相同模式。要判定这种情况,能够在潜在配对中选定碱基配正确规则。仍用上例中序列(sample 1 sample 1 sample 15sample 15 略)BioEdit中并不要求有位置改变,所以未改变位置上只要能够形成碱基对,也能被发觉同时也可在“preference”中设置以滤出未改变位置之间碱基配对。以下是一个联配序列它和在共改变分析中使用相同。设置允许A-U/G-C/G-U碱基配对规则以及1个错配,产生以下结果(以清单格式,滤除了未改变
49、位置潜在配对)比较这一结果和共改变结果,发觉位置3/27有一潜在配对,而共改变结果未检出。潜在配正确数据也能够按允许配对出现频率或原始允许配正确数目列出一个(二维矩阵)表。第43页PotentialPairingsListInputFile:I:BioEdithelpsamples.gbAllowedMispairings=116totalsequences,29nucleotidespersequence.Axesreflectnumberingoftheentirealignment.NoMaskwasused.Hitsoninvariantpairshavebeenfilteredout
50、.1CCCCCCCCCCCCCCCCPosition:22CCGGCCCCCCCCCGCC28GGCCGGGGGGGGGCGG0mis matches第44页Position:3Position:33GGGCGGGAGGGGUGCG3GGGCGGGAGGGGUGCG27CUCGCCCUCCCCGCGC27CUCGCCCUCCCCGCGC0mis0mis matchesmatches Position:4Position:44GGGGGGGGGGGGGGGG4GGGGGGGGGGGGGGGG6UUUUUUCUUUUUUUUU0mis6UUUUUUCUUUUUUUUU0mis matchesmat