1、生物信息学Bioinformatics1第1页http:/选择选择“Undertaken Courses”点击点击“Bioinformatics(spring)”下载下载“参考参考ppt”2第2页密码密码:bioinformation进入以上公用邮箱下载幻灯片进入以上公用邮箱下载幻灯片“ppt10-上机上机2”到电脑桌面到电脑桌面3第3页第四章第四章 DNA DNA与蛋白质序列分析与蛋白质序列分析4第4页第一节第一节 序列比对序列比对第二节第二节 Blast Blast应用应用第三节第三节 序列功效分析序列功效分析5第5页Question1:1.我刚才分离一个水稻基因片段序列,大约我刚才分离一
2、个水稻基因片段序列,大约250bp,我想初步分析一下它是什么基因,编码什么产物以我想初步分析一下它是什么基因,编码什么产物以及是否已经被他人克隆,应该采取什么工具和数据及是否已经被他人克隆,应该采取什么工具和数据库?库?A.Blastn B.Blastp C.tblastn,D.tblastx,B.E.blastx F.nr G.EST H.nr/nt6第6页Question 2:w什么是什么是HMM?w怎样进行基因结构预测?怎样进行基因结构预测?wPromoter位置在哪里位置在哪里?w什么是什么是TSS,为何要预测为何要预测TSS?预测预测TSS有哪些方法有哪些方法?7第7页第第2节节 B
3、last应用应用8第8页主要blast程序程序名程序名查询查询序列序列数据数据库库搜索方法搜索方法Blastn核酸核酸核酸核酸w核酸序列搜索逐一核酸数据库中序列Blastp蛋白蛋白质质蛋白蛋白质质w蛋白质序列搜索逐一蛋白质数据库中序列Blastx核酸核酸蛋白蛋白质质w核酸序列翻译成蛋白质序列后和蛋白质数据库中序列逐一搜索。Tblastn蛋白蛋白质质核酸核酸w蛋白质序列和核酸数据库中核酸序列翻译后蛋白质序列逐一比对。TBlastx核酸核酸核酸核酸w核酸序列翻译成蛋白质序列,再和核酸数据库中核酸序列翻译成蛋白质序列逐一进行比对。9第9页http:/blast.ncbi.nlm.nih.gov/Bl
4、ast.cgi10第10页详细步骤详细步骤1.登陆登陆blast主页主页 http:/www.ncbi.nlm.nih.gov/BLAST/2.依据数据类型,选择适当程序依据数据类型,选择适当程序3.填写表单信息填写表单信息4.提交任务提交任务5.查看和分析结果查看和分析结果11第11页q序列组成序列组成/分子量分子量/等电点等电点-初级分析初级分析q酶切位点分析酶切位点分析(载体构建载体构建)q基因结构分析基因结构分析/开启子序列分析开启子序列分析第第3节节 序列功效分析内容序列功效分析内容 12第12页Part 1.初级序列分析初级序列分析序列组成序列组成/分子量分子量/等电点分析等电点分
5、析13第13页http:/ version 2.6”点击点击“运行运行”进行安装进行安装14第14页15第15页序列组成份析序列组成份析16第16页序列组成份析序列组成份析17第17页序列组成份析序列组成份析18第18页A/G/C/T组成,尤其是组成,尤其是G+C含量预测(进化?探针设计?)含量预测(进化?探针设计?)19第19页蛋白分子量和等电点蛋白分子量和等电点20第20页蛋白分子量和等电点蛋白分子量和等电点21第21页蛋白分子量和等电点蛋白分子量和等电点22第22页蛋白质分子量蛋白质分子量/等电点预测等电点预测 online Compute pI/MWhttp:/us.expasy.or
6、g/tools/pi_tool.html23第23页Part2.酶切位点分析酶切位点分析 只要进行基因工程利用必须用到各种限制性内切酶如 GGATCC BamHI24第24页25第25页26第26页Part 3.基因结构分析基因结构分析/开启子序列分析开启子序列分析27第27页1 1)基因结构分析)基因结构分析)基因结构分析)基因结构分析:Genomic DNAcDNA28第28页29第29页用用softberry预测基因结构预测基因结构 http:/www.bio-30第30页一个例子一个例子:用用softberry预测基因结构预测基因结构31第31页2)2)开启子序列分析开启子序列分析:什
7、么是开启子什么是开启子什么是开启子什么是开启子?开启子序列,普通在开启子序列,普通在开启子序列,普通在开启子序列,普通在TSSTSS之前之前之前之前bpbp,了解哪个位点是了解哪个位点是了解哪个位点是了解哪个位点是TSSTSS,哪个是起始,哪个是起始,哪个是起始,哪个是起始ATG?ATG?TSSATGTATApromoter32第32页2)2)开启子序列分析开启子序列分析:所以,我们必须得到所以,我们必须得到所以,我们必须得到所以,我们必须得到TSSTSSTSSTSS位置位置位置位置.怎样经过生物信息学方法确定怎样经过生物信息学方法确定怎样经过生物信息学方法确定怎样经过生物信息学方法确定TSS
8、?TSS?TSS?TSS?首先截取包含首先截取包含首先截取包含首先截取包含ATGATGATGATG之前之前之前之前3000bp3000bp3000bp3000bp和基因序列采取以下两种和基因序列采取以下两种和基因序列采取以下两种和基因序列采取以下两种方法方法方法方法 1)1)1)1)软件预测软件预测软件预测软件预测,如如如如Softberry;Softberry;Softberry;Softberry;2)2)2)2)搜索搜索搜索搜索ESTESTESTEST数据库数据库数据库数据库;33第33页分析目标分析目标分析目标分析目标:2)2)首先找到首先找到首先找到首先找到ATGATG前面约前面约前
9、面约前面约3000:3000:怎样经过生物信息学方法确定怎样经过生物信息学方法确定怎样经过生物信息学方法确定怎样经过生物信息学方法确定TSS?TSS?以以以以AF486280AF486280为例为例为例为例.首先要找到包含首先要找到包含首先要找到包含首先要找到包含AF486280AF486280基因组序列基因组序列基因组序列基因组序列.34第34页2 2 2 2)首先截取首先截取首先截取首先截取ATGATGATGATG之前之前之前之前3000bp3000bp3000bp3000bp序列序列序列序列以以以以AF486280AF486280为例为例为例为例.首先要找到包含首先要找到包含首先要找到包
10、含首先要找到包含AF486280AF486280基因组序列基因组序列基因组序列基因组序列.35第35页36第36页37第37页38第38页39第39页40第40页41第41页方法一方法一:用用softberry预测预测.42第42页方法二方法二:用用Fruitfly网站网站promoter预测程序预测预测程序预测.43第43页44第44页练习练习:w(1)查找序列查找序列:AY900120w(2)请用两种方法分析该基因可能请用两种方法分析该基因可能TSS?给出从给出从TSS开始开始10bp序列序列.(提醒:首先搜索基因组数据提醒:首先搜索基因组数据库,取得包含该基因第一个外显子之前库,取得包含
11、该基因第一个外显子之前3000bp和和该基因基因组序列;然后进行预测:方法该基因基因组序列;然后进行预测:方法1:搜索:搜索dbEST数据库;方法数据库;方法2:用:用softberryFGENESH进进行预测行预测TSS;)w(3)依据(依据(2)结果请列出该基因开启子序列)结果请列出该基因开启子序列;w(4)依据(依据(2)结果请画出该基因基因结构图(包)结果请画出该基因基因结构图(包含外显子和内含子排列和长度)含外显子和内含子排列和长度);w(5)请预测请预测AF486280基因编码产物分子量和等电基因编码产物分子量和等电点点(能够采取能够采取BioXM软件软件);w(6)请对请对AF4
12、86280基因序列进行限制性酶切位点基因序列进行限制性酶切位点分析分析,分析序列中是否存在分析序列中是否存在HindIII和和SacI酶切位酶切位点点?(能够采取能够采取BioXM软件软件)w(7)请分析请分析AF486280基因编码产物亚细胞定位情基因编码产物亚细胞定位情况况;w(8)请分析请分析AF486280基因编码产物功效域基因编码产物功效域(domain);w(9)请分析请分析AF486280基因编码产物序列中有哪些基因编码产物序列中有哪些主要主要motif?45第45页练习练习:w(5)请预测请预测AY900120基因编码产物分子量和等电基因编码产物分子量和等电点点(能够采取能够采取BioXM软件软件);w(6)请对请对AY900120基因序列进行限制性酶切位点基因序列进行限制性酶切位点分析分析,分析序列中是否存在分析序列中是否存在HindIII和和SacI酶切位酶切位点点?(能够采取能够采取BioXM软件软件)w(7)请分析请分析AY900120基因编码产物功效域基因编码产物功效域(domain);46第46页