1、生物信息学软件介绍 基因芯片相关软件基因芯片相关软件 序列分析软件序列分析软件 RNARNA二级结构软件二级结构软件 蛋白质二级结构软件蛋白质二级结构软件 限制酶切位点软件限制酶切位点软件 质粒绘图软件质粒绘图软件 引物分析软件引物分析软件 凝胶分析软件凝胶分析软件 生物显微分析软件生物显微分析软件 数据统计类软件数据统计类软件 文献管理软件文献管理软件2 常用生物信息学软件常用生物信息学软件 管理实验室数据及文献资料管理实验室数据及文献资料管理实验室数据及文献资料管理实验室数据及文献资料 查阅实验相关文献,对所研究课题的最新进展有一个基本的了解,查阅实验相关文献,对所研究课题的最新进展有一个
2、基本的了解,从而确定自己的实验策略,同时,方便实验室结果的储存、管理和从而确定自己的实验策略,同时,方便实验室结果的储存、管理和申报工作。常用软件:申报工作。常用软件:EndNote(可以在线查找可以在线查找InternetInternet上的各种文献数据库,将查找到的上的各种文献数据库,将查找到的资料保存入本地数据库,并自动生成格式化的参考文献清单插入各资料保存入本地数据库,并自动生成格式化的参考文献清单插入各种文字处理软件)种文字处理软件)Reference Manager(可以在线通过查找关键词搜索(可以在线通过查找关键词搜索PubMedPubMed等多个等多个数据库中的专业资料,同时保
3、存查找的资料为本地文件,可直接在数据库中的专业资料,同时保存查找的资料为本地文件,可直接在wordword中查找资料,并插入引用,在文章中对引用的文献可以格式化。)中查找资料,并插入引用,在文章中对引用的文献可以格式化。)医学文献王医学文献王(智能化网上检索、专业化文献管理和自动化嵌入参考文(智能化网上检索、专业化文献管理和自动化嵌入参考文献三大特点,特长在中文期刊的系统化,也支持外文文献数据库)献三大特点,特长在中文期刊的系统化,也支持外文文献数据库)3 软件功能软件功能 分析和处理实验数据和公共数据,加快研究分析和处理实验数据和公共数据,加快研究分析和处理实验数据和公共数据,加快研究分析和
4、处理实验数据和公共数据,加快研究进度,缩短科研时间进度,缩短科研时间进度,缩短科研时间进度,缩短科研时间4 软件功能软件功能 随着实验的进行,就必须对实验过程中的DNA、RNA和蛋白质的信息进行各种处理,包括限制酶分析、引物设计、同源序列比较、质粒做图,结构域查找,RNA二级结构预测,蛋白二级结构分析,三维结构显示等方面的内容限制酶分析限制酶分析推荐软件:DNA ssist 1.0 大多软件只对线性序列进行分析,那么cNNNNNNNNgaatt环状的序列就找不到EcoR I的位点。DNAssist 1.0能很容易把这个EcoR I位点找出来 DNAssist在输出上非常完美,除了图形、线性显示
5、外,还有类似DNASIS的列表方式,列出有的位点(按酶排列,按碱基顺序排列)。Vector NTI Suite 亦是不错的选择 5引物设计Primer Premier 5.0(自动搜索)Oligo 6(引物评价)Vector NTI Suite(综合分析)Primer Express(实时定量PCR引物设计和探针设计)Omiga 2.0DNAStarPrimer 3(在线服务)6同源序列比对同源序列比对NCBI 的Blast Expasy 的 allignmentClustal XGeneDoc 3.2 Vector NTI SuiteOmiga 7质粒绘图Gene Construction
6、Kit 2.0Winplas 2.6Plasmid Premier2.02Redasoft Visual Cloning 2000SimVectorClone Manager8RNARNA二级结构二级结构RNA Structure 3.5RNAdraw9序列综合分析序列综合分析Vector NTI Suite 8.0Omiga 2.0DS geneDNASIS for Windows 2.5DNATools 5.1BioeditDNAMAN10蛋白分析软件蛋白分析软件 蛋白二级结构分析:ANTHEPROT 4.5、Peptool、VHMPT(Viewer and editor for Heli
7、cal Membrane Protein Topologies)、MACAW(Multiple Alignment Construction&Analysis Workbench,MACAW)三维结构显示:RasMol、Cn3D、CHIME 2.6 IE、POV-Ray 3.511凝胶分析软件 BandScan 4.30:通用的电泳胶条带定量分析软件,手动、自动找到条带,手动的条带可以是无规则的,可以清除背景。进行分子量、百分比、质量、波峰等方面的定量分析。直接使用扫描仪,将数据输出到excel文件。Band leader 3.0:小巧的凝胶图像分析软件 TotalLab 2.0:一个全智能化
8、的凝胶分析软件,对DNA、蛋白凝胶电泳图像、arrays,dot blots与colonies等图像可以进行很方便的处理 PDQuest 6.2.1:bio-rad公司一个分析2维凝胶并生成数据库的标准软件。使用它,可以同时分析100个凝胶图像,生成包含1000个凝胶图像的数据库。12 DNASIS 2.5 tRNA DNASIS 2.5 tRNA 二级结构预测二级结构预测13 软件应用图例软件应用图例Omiga 2.0 ORF MapOmiga 2.0 ORF Map14DNAStar DNAStar 之之 Protean Protean 对氨基酸的亲疏水性分析:对氨基酸的亲疏水性分析:he
9、lical wheel helical wheel 图图15PrimerSelectPrimerSelect16Winplas 2.6 Winplas 2.6 质粒构建质粒构建17Atheprot 5.0 Atheprot 5.0 预测蛋白跨膜区域预测蛋白跨膜区域18Antheprot 5.0 Antheprot 5.0 预测信号肽断裂点预测信号肽断裂点19DNASIS 2.5 DNASIS 2.5 对蛋白编码区的预测对蛋白编码区的预测20DNASIS 2.5 DNASIS 2.5 对蛋白编码区的预测对蛋白编码区的预测(ORF List)(ORF List)21DNASTAR DNASTAR
10、GeneQuest GeneQuest 预测预测CDSCDS22 DNASIS 2.5 DNASIS 2.5 蛋白二级结构预测蛋白二级结构预测23Cn3D 2.5 Cn3D 2.5 显示显示 1EQF A1EQF A链三维结构链三维结构24RasMol RasMol 2.7 2.7 显示显示1EQF A1EQF A链三维结构链三维结构25本次课程内容本次课程内容 引物设计:引物设计:PRIMER PREMIER 5.0PRIMER PREMIER 5.0 文献编辑软件文献编辑软件:EndNote X4:EndNote X4 26引物设计实例分析PCRPCR原理概述原理概述 PCR PCR技术又
11、称聚合酶链反应(技术又称聚合酶链反应(Polymerase Chain ReactionPolymerase Chain Reaction)技术,)技术,是一种在体外(试管、切片是一种在体外(试管、切片)扩增核酸的技术。该技术模拟体内)扩增核酸的技术。该技术模拟体内天然天然DNADNA的复制过程。其基本原理是在模板、引物、的复制过程。其基本原理是在模板、引物、4 4种种dNTPdNTP和耐热和耐热DNADNA聚合酶存在的条件下,特异扩增位于两段已知序列之间的聚合酶存在的条件下,特异扩增位于两段已知序列之间的DNADNA区区段的酶促合成反应。每一循环包括高温变性、低温退火、中温延伸段的酶促合成反
12、应。每一循环包括高温变性、低温退火、中温延伸三步反应。每一循环的产物作为下一个循环的模板,如此循环三步反应。每一循环的产物作为下一个循环的模板,如此循环3030次,次,介于两个引物之间的新生介于两个引物之间的新生DNADNA片段理论上达到片段理论上达到230230拷贝(约为拷贝(约为10109 9个分个分子)。子)。PCRPCR技术的特异性取决于引物与模板结合的特异性。技术的特异性取决于引物与模板结合的特异性。2829PCRPCR原理原理Sample denaturatationSample denaturatationPrimer annealingPrimer annealingPrime
13、r extensionPrimer extensionPCRPCR引物设计引物设计 引物设计有引物设计有3 3 条基本原则:条基本原则:首先引物与模板的序列要紧密互补;首先引物与模板的序列要紧密互补;其次引物与引物之间避免形成稳定的二聚体或发夹结构;其次引物与引物之间避免形成稳定的二聚体或发夹结构;再次引物不能在模板的非目的位点引发再次引物不能在模板的非目的位点引发DNA DNA 聚合反应聚合反应(即即错配错配)。30引物设计需要考虑的因素引物设计需要考虑的因素引物设计需要考虑的因素引物设计需要考虑的因素围绕这几条基本原则,设计引物需要考诸围绕这几条基本原则,设计引物需要考诸多因素,如:多因素
14、,如:引物长度(引物长度(primer lengthprimer length)产物长度(产物长度(product lengthproduct length)序列序列TmTm值值 (melting temperature)(melting temperature)GG值值(internal stability)(internal stability)引物二聚体及发夹结构(引物二聚体及发夹结构(duplex formation and duplex formation and hairpinhairpin)错误引发位点(错误引发位点(false priming sitefalse priming
15、 site)引物及产物引物及产物GCGC含量(含量(compositioncomposition),有时还要),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。对引物进行修饰,如增加限制酶切点,引进突变等。31引物设计要点引物设计要点 一一般般引引物物的的长长度度为为16-23bp16-23bp,常常用用的的长长度度为为18-21bp18-21bp,不不超过超过38bp38bp,过长或过短都不合适。,过长或过短都不合适。碱碱基基随随机机分分布布:引引物物中中四四种种碱碱基基的的分分布布最最好好是是随随机机的的,不不要要有有聚聚嘌嘌呤呤或或聚聚嘧嘧啶啶的的存存在在。尤尤其其33端端不不应应
16、超超过过3 3个个连连续的续的G G或或C C,因这样会使引物在,因这样会使引物在G+CG+C富集序列区错误引发。富集序列区错误引发。引引物物3 3端端的的碱碱基基一一般般不不用用A A,因因为为A A在在错错误误引引发发位位点点的的引引发发效效率率相相对对比比较较高高,而而其其它它三三种种碱碱基基的的错错误误引引发发效效率率相相对小一些。对小一些。引引物物的的GCGC含含量量一一般般为为45-55%45-55%,过过高高或或过过低低都都不不利利于于引引发发反应。上下游引物的反应。上下游引物的GCGC含量不能相差太大。含量不能相差太大。32引物设计要点引物设计要点 G G 值是指值是指DNA
17、DNA 双链形成所需的自由能,该值反映了引物与模双链形成所需的自由能,该值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标,一般情况板结合的强弱程度,也是一个重要的引物评价指标,一般情况下,在下,在Oligo 5.0Oligo 5.0软件的软件的GG值窗口中,引物的值窗口中,引物的GG值最好呈正弦值最好呈正弦曲线形状,即曲线形状,即55端和中间部分端和中间部分GG值较高,而值较高,而33端端GG值相对值相对较低,且不要超过较低,且不要超过9 9(GG值为负值,这里取绝对值),如此则值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。分析其原理,引物与有利于正确引发反应
18、而可防止错误引发。分析其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此合,因此55端与中间段的端与中间段的GG值应较高,而值应较高,而33端端GG值影响值影响DNADNA聚合酶对模板聚合酶对模板DNADNA的解链,过高则不利于这一步骤。的解链,过高则不利于这一步骤。33引物设计要点引物设计要点 引物与非特异扩增序列的同源性不要超过引物与非特异扩增序列的同源性不要超过70%70%或有连续或有连续8 8个互补碱个互补碱基同源。基同源。引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构导引物自身不应存在互补序列,
19、否则引物自身会折叠成发夹状结构导致引物本身复性。这种二级结构会因空间位阻而影响引物与模板的致引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物二聚体及发夹结构的能量一般不要超过复性结合。引物二聚体及发夹结构的能量一般不要超过 4.5kcal/mol4.5kcal/mol 引物的延伸是从引物的延伸是从33端开始的,不能进行任何修饰,也不能有形成端开始的,不能进行任何修饰,也不能有形成任何二级结构可能任何二级结构可能34引物设计要点引物设计要点 引物的引物的55端限定着端限定着PCRPCR产物的长度,它对扩增特异性影响不大。产物的长度,它对扩增特异性影响不大。因此,可以被修饰而
20、不影响扩增的特异性。引物因此,可以被修饰而不影响扩增的特异性。引物55端修饰包端修饰包括:加酶切位点;标记生物素、荧光、地高辛等;引入蛋白质括:加酶切位点;标记生物素、荧光、地高辛等;引入蛋白质结合结合DNADNA序列;引入突变位点、插入与缺失突变序列和引入一序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。启动子序列等。如扩增编码区域,引物如扩增编码区域,引物33端不要位于终止密码子的第端不要位于终止密码子的第3 3位,因位,因密码子的第密码子的第3 3位易发生简并,会影响扩增特异性与效率。位易发生简并,会影响扩增特异性与效率。35DNA/mRNA引物的区别DNADNA36intr
21、onexonmRNAmRNAAAAAAA 35 pmGpppGUCSC:37基因搜索基因搜索http:/genome.ucsc.edu/http:/genome.ucsc.edu/38输入待查询输入待查询基因名称基因名称3940目标目标基因基因4月-2441基因组、基因组、mRNAmRNA、蛋白序列蛋白序列42434月-24广西医学科学实验中心xy4445芯片检测结果芯片检测结果PRIMER PREMIER 5.0使用说明4月-24广西医学科学实验中心xy47安装安装Primer premier5Primer premier54月-24广西医学科学实验中心xy484月-24广西医学科学实验中心
22、xy494月-24广西医学科学实验中心xy504月-24广西医学科学实验中心xy514月-24广西医学科学实验中心xy524月-24广西医学科学实验中心xy534月-24广西医学科学实验中心xy544月-24广西医学科学实验中心xy554月-24广西医学科学实验中心xy564月-24广西医学科学实验中心xy574月-24广西医学科学实验中心xy584月-24广西医学科学实验中心xy594月-24广西医学科学实验中心xy604月-24广西医学科学实验中心xy614月-24广西医学科学实验中心xy624月-24广西医学科学实验中心xy634月-24广西医学科学实验中心xy644月-24广西医学科学
23、实验中心xy65FileFile菜单中的菜单中的ParameterParameter命令可以对系统参数,命令可以对系统参数,PCRPCR反应条件和程序打分系统进行设置,以帮助用户根反应条件和程序打分系统进行设置,以帮助用户根据自己的特殊要求来进行引物设计,其中反应条件据自己的特殊要求来进行引物设计,其中反应条件按照引物浓度,单价离子浓度,按照引物浓度,单价离子浓度,MgMg离子浓度,离子浓度,NaNa盐盐浓度等。而打分系统是参照的以下公式:浓度等。而打分系统是参照的以下公式:根据一段氨基酸序列反推到根据一段氨基酸序列反推到DNA DNA 来设计引物,由于大多来设计引物,由于大多数氨基酸的遗传密
24、码不只一数氨基酸的遗传密码不只一种,因此,由氨基酸序列反种,因此,由氨基酸序列反推推DNA DNA 序列时,会遇到部分序列时,会遇到部分碱基的不确定性。这样设计碱基的不确定性。这样设计并合成的引物实际上是多个并合成的引物实际上是多个序列的混和物,它们的序列序列的混和物,它们的序列组成大部分相同,但在某些组成大部分相同,但在某些位点有所变化,称之为简并位点有所变化,称之为简并引物。引物。4月-24广西医学科学实验中心xy674月-24广西医学科学实验中心xy684月-24广西医学科学实验中心xy69引物设计(引物设计(Primer Primer DesignDesign),酶切分析(),酶切分析
25、(Restriction Restriction SitesSites)和基序分析()和基序分析(MotifMotif)当一个基因被识别、其当一个基因被识别、其DNADNA序列被解读时,人们序列被解读时,人们往往仍然无法往往仍然无法 弄清相应的蛋白序列是什么。这是因为在没有其弄清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,它信息的前提下,DNADNA序列可以按六种框架阅读序列可以按六种框架阅读和翻译和翻译 (每条链三种,对应三种不同的起始密码子)。(每条链三种,对应三种不同的起始密码子)。阅读框的次序(阅读框的次序(+1,+2,+3,-1,-2,-3)+1,+2,+3,-1,-2,-
26、3)。创建新序列文件创建新序列文件4月-24广西医学科学实验中心xy72将模板序列粘贴进入将模板序列粘贴进入点击进入引物设计模块点击进入引物设计模块最上面一层左面是最上面一层左面是5 5个控制个控制按钮,用于实现引物设计中按钮,用于实现引物设计中的各种功能,包括引物自动的各种功能,包括引物自动寻找,寻找结果查看和引物寻找,寻找结果查看和引物编辑编辑 显示模板和引物序列及二者显示模板和引物序列及二者间的配对情况的显示间的配对情况的显示 显示两个引物的各显示两个引物的各种参数,包括给引种参数,包括给引物的打分,引物以物的打分,引物以及产物的起始位置、及产物的起始位置、长度、长度、TmTm值、值、G
27、CGC、简并性简并性 有关于引物的二聚体结有关于引物的二聚体结构、发卡结构、错配情构、发卡结构、错配情况和引物间二聚体结构况和引物间二聚体结构的预测的预测 显示的是对显示的是对PCRPCR扩增有影扩增有影响的结构的响的结构的位置,结构位置,结构细节和稳定细节和稳定能能 根据模板序列寻找引物的界面,在该界面中可以设定所要搜索的引物的类型,包括PCR引物,测序引物和杂交探针以及引物所在的链;另外也能设定搜索引物的范围,以及最终PCR产物的长度和引物的长度等。4月-24广西医学科学实验中心xy75点击点击searchsearch点击参数设置点击参数设置GCGC夹夹引物与目的位点的有效结合引物与目的位
28、点的有效结合需要有稳定的需要有稳定的55末端。这一末端。这一段有较强稳定性的段有较强稳定性的55末端称末端称为为GCGC钳,它保证引物与模板钳,它保证引物与模板的稳定结合。的稳定结合。4月-24广西医学科学实验中心xy77Degeneracy(多义性):当设计多义引物时,尽量减少引物多义性,这样会带来更好的特异性。应尽量避免3末端的多义性,因为这里即使一个碱基的错配都能阻止引物的延伸。3末端稳定性:引物稳定性影响它的错配效率,一条理想的引物应该有一个稳定性较强的5末端和相对稳定性较弱的3末端。如果3末端稳定性强,有可能在即使5末端不配对的情况下造成错配,形成非特异性扩增条带。在结果窗口中给出了
29、程序给该对引物在结果窗口中给出了程序给该对引物的打分(的打分(ratingrating)和上下游引物的起)和上下游引物的起始位置和长度以及产物的长度。通过始位置和长度以及产物的长度。通过直接点击各对引物在相应引物搜寻界直接点击各对引物在相应引物搜寻界面中相应的显示引物的各种信息。包面中相应的显示引物的各种信息。包括其各种参数和各种可能存在的不利括其各种参数和各种可能存在的不利结构。结构。利用引物编辑窗口对程序自动找利用引物编辑窗口对程序自动找到的或手工找到的引物序列进行到的或手工找到的引物序列进行编辑,以便用户能在引物引入突编辑,以便用户能在引物引入突变及加入特定的酶切位点,并对变及加入特定的
30、酶切位点,并对修改后的序列的二聚体结构、发修改后的序列的二聚体结构、发卡结构和错配进一步评估。卡结构和错配进一步评估。除了以上的直观地对引物进行基本的设计和除了以上的直观地对引物进行基本的设计和评估功能外,该程序还提供了多种数据报告,评估功能外,该程序还提供了多种数据报告,主要通过主要通过ReportReport菜单和菜单和GraphGraph菜单中命令来实菜单中命令来实现。现。G G是指是指DNADNA双链形成所需的自由能,双链形成所需的自由能,该值反映了双链结构内部碱基对的该值反映了双链结构内部碱基对的相对稳定性。应当选用相对稳定性。应当选用33端端G G值值较低(绝对值不超过较低(绝对值
31、不超过9 9),而),而55端端和中间和中间G G值相对较高的引物。引物值相对较高的引物。引物的的33端端G G值过高,容易在错配位值过高,容易在错配位点形成双链结构并引发点形成双链结构并引发DNADNA聚合反应。聚合反应。引物二聚体及发夹结构的能值过高引物二聚体及发夹结构的能值过高(超过(超过4.5kal/mol)4.5kal/mol)易导致产生引物二易导致产生引物二聚体带,并且降低引物有效浓而使聚体带,并且降低引物有效浓而使PCRPCR反应不能正常进行。反应不能正常进行。总的来说,Primer设计引物的经验为:1、引物取分值高的;2、两个引物的Tm值比较接近为好,温度为五六十度,不要高于七十度;3、引物之间的距离200-1000比较常见;4、Tm减去5度为退火温度;5、引物和产物的Tm 值不要相差太大,20摄氏度范围内较好。6、最好能跨内含子,因为这样可以与基因组的序列分开来(适用于RT-PCR)作业作业请描述人COX-2(PTGS2)基因特点,以word格式将其序列记录下来,其中CDS Exon以大写字母表示,其余为小写,并分别设计针对DNA和RNA的引物序列。86
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100