1、生物信息学试验课件邢晋祎生命科学学院Copyright第1页试验二试验二 惯用分子生物学数据惯用分子生物学数据库检索方法及数据格库检索方法及数据格式式第2页实验目1.了解ncbi所提供在线entrez检索方法。2.了解EBI所提供SRS检索方法。3.熟悉查询swiss-prot蛋白质序列数据库查询。4.详细了解三大核酸序列数据库之一GenBank数据库平面文件Flat file。5.详细了解蛋白质结构数据库PDB数据库中pdb文件。第3页试验材料计算机,网络。第4页试验过程1.Entrez检索方法NCBIAll databaseEntrez查询某一关键词(eg.Helicase,insulin
2、,topoisomerase,gyrase,hemoglobin。)依次点击各个数据库查看第5页第6页第7页第8页试验过程第9页第10页GenPept文件下载第11页平面文件取得查询某一条核酸序列取得平面文件保留或者下载用写字板(记事本)打开第12页试验过程2.SRS检索方法。EBISRSEBIchoice database查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin。)第13页第14页第15页试验过程3.Swiss-prot查询方法。Swiss-protSRSEBIchoice database查询某一关键词(eg.H
3、elicase,insulin,topoisomerase,gyrase,hemoglobin)。第16页第17页第18页第19页第20页4.GenBank flatfile(GBFF)内容。是GenBank数据库基本信息单位,也是最广泛地用以表示生物序列格式之一。GenPept文件GBFF能够分成三个部分,头部包含关于整个统计信息(描述符)。第二部分包含了注释这一统计特征,第三部分是核苷酸序列本身。全部核苷酸数据库统计(DDBJ/EMBL/GenBank)都在最终一行以/结尾。第21页第22页第23页试验过程5.PDB 文件取得进入PDB数据库查询某蛋白质结构(eg:1d3y)下载结构到当地电脑用写字板(记事本)打开第24页第25页源自源自PDB结构统计内容结构统计内容PDB统计包含两个序列信息备份:隐性序列和显性序列。显性序列在PDB文件中以关键词SEQRES打头逐行存放。隐性序列蕴涵在由PDB文件中ATOM统计及对应(X,Y,Z)位置坐标组成化学立体结构中。实践中,许多PDB文件浏览器,如Rasmol,仅用隐性序列重构PDB统计蛋白质化学图象,而忽略由SEQRES引导显性序列信息。第26页文件头部第27页显性序列第28页第29页隐性序列第30页第31页作业:格式同试验一1.写出Genbank flatfile详细结构组成。2.写出PDB文件详细组成。第32页