1、如何判断序列的正反向NCBI里的序列,mRNA,CDS序列等等,都标注的很清楚,只是有的基因序列给的是反向互补的序列,需要大家在primer5等软件里转换一下。具体看是不是反向互补的序列,办法就是看在第一个CDS区的前三个碱基是不是是不是ATGATG,如果是ATG,那么这个序列就是你要的了,如果不是,那八成就是你要得序列的反向互补序列了。1目的:寻找promoter区域预测核心启动子区2寻找promoter区域用NCBI:用UCSC:用Ensembl:用公司信息(只包含公司拥有promoterclones的信息):/(*种类比较少)用SIB-EPD:(可直接提供TSS,但是库容较小,很多基因查
2、不到)预测核心启动子区3NCBI数据库4寻找promoter区域NCBIhttp:/选择Gene,输入ankh,点击search选择第一项,以人类Homosapiens的ANKH为例;Chromosome5location14707,complement(反义链)即-14871887到-14704909为基因范围此例中选取-14873887到-14871887约2000bp核苷酸序列作为启动子区域5选择Ensembl或者HGNC_,进入ensembl分析寻找promoter区域6寻找promoter区域图形显示FASTA格式显示的核苷酸序列输入序列可以查询染色体位置ANKHgene在反义链上,
3、所以用负数表示可以查询具体核苷酸序列Genomiccontext点击Graphics-Tools-SequeceTextView7寻找promoter区域点击GoToPosition,输入-14873887,点击PrevPage找到具体位置复制白底黑色区域即为promoter区域。白底黑字为启动子区域紫底黑字为基因区域粉底黑字为编码区,ATG为启示密码子8大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点9寻找promoter区域在前两张幻灯片中选择FASTA在右边Changeregi
4、onshown输入到Displayoptions选择Showreversecomplement可以直接得到FASTA格式的promoter核苷酸序列(似乎有一个bp的差距,可以输入到)可以选择展示反向互补序列101.选择基因示意图:1).向下查看“Genomicregions,transcriptsandproducts”2).将鼠标放在Genes的”NR_”示意图上,3).在弹出的窗口中点击2.点击”FASTAView,序列范围表示NR_的位置。出现该基因的实际序列,第一个序列的位置表示“起始位置”3.调整显示位置:将起始位点先前排1000bp,向后排1000bp。更改后的位置认为是启动子区
5、。11UCSC数据库12寻找promoter区域UCSC选择左侧边栏的“TableBrowser”在clade选择Mammal,genome选择Human,assmebly选择最新的数据库,在position后面的搜索框内写入待查的基因名称,如actin。点击getoutput。方法一13寻找promoter区域出现一系列候选序列。当搜索用词不特异的时候会出来太多的结果,只显示500条。14寻找promoter区域点击自己目的基因的结果链接,会出现该基因在染色体上的位置(有时候会直接跳到选择genome,protein,mRNA那一页面,可能是在搜索词比较特异的情况写),继续 getout p
6、ut选择 genome15寻找promoter区域选择Promoter/Upstreamby2000basesExonsinuppercase,everythingelseinlowercase:外显子大写,其他小写16寻找promoter区域小写字母为promoter区域大写字母为基因区域,与NCBI结果相同ATG为CDS区起始密码子17寻找promoter区域promoter/upstream前面的框中打勾,一般的启动子长度大约为2kb左右,这个数字可以修改。为便于观察,可继续修改下面的几个选项。这里选择CDS大写。点击get sequence即可得到结果。18寻找promoter区域UT
7、R和upstream是分开的,CDS是大写的,可以看到起始码。Copy ATG以前的序列进行启动子分析。PCR以genome为模板。19寻找promoter区域UCSC,点击左侧边栏的“GenomeBrowser”方法二20寻找promoter区域以大鼠(rattus orvegicus)的结缔组织生长因子(CTGF)为例,在OrganismOrganism的下拉菜单中选择Rat,在assemblyassembly的下拉菜单中选择最新日期最新日期Nov.2004,在positionposition框中键入CTGF,image widthimage width选择默认即可,如下图所示:点击 Su
8、bmit21寻找promoter区域结果显示该基因的已知序列和相关mRNA序列,点击“Known Gene”中的第一个序列,22寻找promoter区域出现包含这序列的图解概要为了获得这个区域更清晰的图像,可以点击紧靠zoomout的1.5X按钮,如下图:对于KnownGenes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5端和3端非翻译区。起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。23寻找promoter区域本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的TrackControls
9、按钮,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。24寻找promoter区域Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较。若查询启动子区域,我们需要将将Ensembl Genes选择为选择为dense 或或full模式模式,点击Refresh,即刷新,出现下图:图中多出了EnsemblGenes的预测路径,我们在红框中圈出。点击用于表达该序列的任何方块出现以下页面:25寻找promoter区域点击红框中的条形深色方块(不是(不是Ense
10、mbl Genes文字)文字),26寻找promoter区域选择并点击Linktosequence中的GenomicSequence,即显示基因组序列27寻找promoter区域将promoter改为2000bp,具体多少bp合适,可根据文献资料和实验目的获取,有的基因可能在其上游戏几百bp就可以了,其他的几个选项分别为5端非编码区,编码区外显子,3端非编码区,内含子(内含子用绿框圈了起来)等。SequenceFormattingOptions序列显示方式,选择上图红框里的内容,即外显子大写,即外显子大写,其余的小写,也就是说其余的小写,也就是说mRNA的外显子大写,其余上下游非编码区以及内含
11、子均为小的外显子大写,其余上下游非编码区以及内含子均为小写。写。28寻找promoter区域第一个大写字母以后就是第一个大写字母以后就是mRNA序列,之前序列,之前的小写字母序列即为启动子区域了。的小写字母序列即为启动子区域了。29第一个大写字母以后就是mRNA序列,但该序列包含外显子和内含子,是未经剪切修饰的mRNA,图中两段大写字母中间的小写字母便为内含了序列。寻找promoter区域30Ensemble数据库31寻找promoter区域Ensembl:选择human输入ankh选择Gene,点击GeneIDENSG点击左边的Exportdata方法一32寻找promoter区域5Flan
12、kingsequence输入2000OptionsforFASTAsequence中Genomic选5Flankingsequence,deselectall点击Next(不管正反此法都适用)33寻找promoter区域得到2000bases的核苷酸序列34寻找promoter区域Ensembl:在“SearchEnsembl“标题下search后的下拉框中选中物种名homosapiens(人),for框中输入基因名ankh,点击Go方法二35寻找promoter区域找到所需要的gene,点击出来2个结果。本例中貌似是同一个。点击相应链接进入新页面。36寻找promoter区域貌似有2个不同的
13、转录本。点击ExonInfo。37寻找promoter区域新页面中即可看到5upstreamsequence。可以在Flankingsequenceateitherendoftranscript后面的框中修改期望显示的序列长度。一般启动子最好选2kb。然后copy所显示的上游序列进行分析。38Genecopoeia公司39寻找promoter区域点击searchproduct,选择promoterclones,因为没有ANKH的信息,此处输入FIBRONECTIN选择目的基因40寻找promoter区域点击clickheretoviewthepromotersequence得到promoter
14、信息41EPD数据库42寻找promoter区域SIB-EPD网址:具体使用方法大同小异,就是输入物种名、基因名,限定启动子序列区域43预测核心启动子区44Transcript start site(TSS)附近-60bp到+40bp是核心启动子区核心启动子区,是精确转录必须的最小单元。CpG岛岛是一段200bp或更长的DNA序列,核苷酸G+C的含量较高,并且CpG双核苷酸的出现频率占G+C含量的50%以上。许多脊椎动物的启动子区都与CpG岛的位置重合。45常见的在线预测工具有:真核启动子真核启动子数据库第数据库第85版版(TheEukaryoticPromoterDatabaseCurren
15、tRelease85,EPD,)转录起始位点数据库转录起始位点数据库:该数据库主要包括人,小鼠等常见生物的基因转录起始位点及该基因启动子的可能情况。Promoter scan(),Promoter2.0 Prediction Server()神经网络启动子预测器NNPP()SoftBerry()DragonPromoterFinder()(好像不能用了?)46FirstEF()UROGENE(),可用于位点甲基化的预测CpGPlot/CpGReport/Isochore()CpGProD()CpGIslandSearcher(;)CpGPrediction()/CpGCpG岛预测软件岛预测软件
16、471、获取目的基因的mRNA序列,并且在NCBI的数据库中查获转录起始点;2、截取转录起始点为中心,上下约各1000bp,若在此范围内出现CDS,可到翻译起始点终止;3、利用在线软件进行分析;PromoterInspectorPromoterScanPromoter 2.0NNPPEMBOSS CpgplotCpG Islands PredictionCpG Islands Prediction本人是采取多种软件结合的方法,由于proscan和promoter 2.0的假阳性率较高,仅作为参考,而promoter inspector的特异性较高,结果比较可信。同时,利用CpG岛预测,作为辅助参考4、最后,可以找到小鼠的同源区,进行同源性比较,启动子区域一定是高保守区!5、到此,可以初步预测启动子区域的范围了。48