ImageVerifierCode 换一换
格式:PPT , 页数:66 ,大小:3.66MB ,
资源ID:13876720      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/13876720.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(第1章DNA、RNA和蛋白质序列信息资源.ppt)为本站上传会员【pc****0】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

第1章DNA、RNA和蛋白质序列信息资源.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,人民卫生出版社,8,年制及,7,年制临床医学等专业用,生物信息学,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第一章,DNA,、,RNA,和蛋白质序列信息资源,DNA,、,RNA And Protein Sequence Information Resources,中国医科大学 赵雨杰,生物信息学(,bioinformatics,),在生命科学研究中发展起来的一门由分子生物学与计算机信息处理技术相结合,以计算机为研究工具对生物信息进行获取、处理、储存、传播、分析、模拟和解

2、释的交叉学科。,生物信息学研究,内容,它利用数据库技术和软件技术对大量积累的生物大分子序列数据进行比较和分析,揭示出生物大分子的分子结构、功能和进化关系以及基因组构成与基因表达等生物学事件对生命活动的影响。,生物信息学研究,重点,主要体现在,基因组学(,genomics,)和蛋白质组学(,proteomics,),两方面。它从核酸和蛋白质序列出发,分析序列中与结构、功能相关的生物信息的表达。,生物信息学数据库,生物信息学中的各类数据库几乎覆盖了生命科学的各个领域,如核酸序列数据库,蛋白质序列数据库,蛋白质、核酸、多糖的三维结构数据库,基因组数据库,文献数据库和其他种类数据库。,生物信息学数据库

3、分类,生物信息数据库种类繁多,就目前来看,大体可以分为四个大类:,1.,基因组数据库;,2.,核酸和蛋白质一级结构序列数据库;,3.,生物大分子(主要是蛋白质),三维空间 结构数据库;,4.,根据以上三类数据库和文献资料为基础构建的二次数据库。也称专门数据库、,专业数据库或专用数据库,。,一次数据库,第二节 核酸序列数据库,Section 2 Nucleic Acid sequence Databases,自,20,世纪,80,年代第一个核酸数据库建立以来,核酸数据库迅速发展。在互联网上不仅有核酸序列数据库,还出现了基因组相关数据库、核酸三维结构数据库、基因表达数据库、人类基因突变及疾病相关数

4、据库、进化相关数据库及其他与核酸有关的数据库。,三大核酸序列数据库,GenBank,EMBL,DDBJ,特殊类型核酸序列数据库:,非编码,RNA,数据库(,nc,RNA,);,表达序列标签数据库(,db,EST,);,序列标签位点数据库(,db,STS,);,miRBase,;,tRNAdb,等。,基因组相关数据库:,人类基因组数据库(,HGD,);,基因组序列数据库(,GS,DB,);,基因组在线数据库(,G,OL,D,)等。,核酸三维结构数据库:,核苷酸三维结构数据库(,NDB,);,普纳大学核酸结构数据库(,BNASDB,)等。,基因表达数据库:,基因表达库(,GEO,);,斯坦福微阵列

5、数据库(,SMD,);,ArrayExpress,;,CGED,;,GXD,;,BodyMap,等。,人类基因突变及疾病相关数据库:,人类基因变异数据库(,HMGD,)、人类遗传双等位基因序列数据库(,HGBASE,)、人类孟德尔遗传在线(,OMIM,)、国际单体型计划(,HapMap,)、人类单核苷酸多态性数据库(,dbSNP,)、肿瘤基因数据库(,TGDB,)、疾病关联数据库(,GAD,)、癌症基因数据库(,CGAP,)、人类表观遗传数据库(,HEP,)、人类,DNA,甲基化与癌症数据库(,MethylCancer,)等。,一、,GenBank,数据库,GenBank,(,www.ncbi

6、nlm.nih.gov/genbank/,)是一个综合数据库,该数据库中包含了已经公开的,30,万余种不同物种生物的核酸序列,这些数据主要,来源于全世界不同实验室和大规模测序计划项目,。,GenBank,是具有,目录和生物学注释,的核酸序列综合数据库,由美国国家医学图书馆的国家生物技术信息中心构建、维护和管理。该中心位于美国马里兰国家健康研究所(,NIH,)。,GenBank,数据库的序列数据来源于,序列发现者,提交的序列、批量提交的,表达序列标签,(,expressed sequence tag,EST,)、,基因组测序序列,(,genome survey sequence,GSS,)和其

7、他测序中心提供的高通量数据,还包括美国专利商标局提供的已发表专利的序列数据。,GenBank,数据库每天与,欧洲分子生物学实验室的核酸序列数据库(,European,Molecular,Biology Laboratory Nucleotide Sequence Database,,,EMBL,),和,日本的,DNA,数据库(,DNA Data Bank of Japan,DDBJ,),进行数据交换,以保证数据库内容在全世界范围的同步性。,在,NCBI,(,www.ncbi.nlm.nih.gov/,)的主页上提供了进入,GenBank,的路径、相关检索和分析服务。,通过,NCBI,的检索系统

8、Entrez,),可以进入,GenBank,。,Entrez,检索程序整合了主要的,DNA,和蛋白序列数据的分类学、基因组、图谱、蛋白结构和结构(功能)域信息,,还包括相关的,PubMed,的生物医学文献信息。,BLAST,程序提供,GenBank,和其他序列数据库中,序列相似性,搜索服务。,(一),GenBank,数据库结构,1.,依据序列的物种来源分类,2.Genbank,记录和分类,2.1,表达序列标签,(EST),2.2,序列标签位点,(STS),、,基因组勘测序列,(GSS),和,环境样品序列,(ENV),2.3,高通量基因组,(HTG),和高通量,cDNA(HTC),序列,2.

9、4,全基因组鸟枪测序序列,(WGS),2.5,转录组鸟枪组合序列,(一),GenBank,数据库结构,3.,特殊记录类型,3.1,第三方注释(,TPA,),The third party annotate,3.2 GenBank CON,记录,较小记录组合记录,(二)构建数据库,1,直接电子提交,1.1,使用,BankIt,(1.射击踏垛;人行道;软长椅;碗橱的搁板或壁架),提交,1.2,使用,Sequin,和,tbl2asn,提交,1.3,条形码序列,提交,2.,序列标识符和记录号,(三)检索,GenBank,数据,1.Entrez,系统(,www.ncbi.nlm.nih.gov/site

10、s/gquery,),2.,与测序计划检索相关的序列记录,(,www.ncbi.nlm.nih.gov/genomeprj,),3.BLAST,序列相似性搜索(,,blast.,ncbi.nlm.nih.gov/Blast.cgi,),4.,用,FTP,获取,GenBank,(,,ftp,.ncbi.nih.gov/genbank,),二、,EMBL,数据库,EMBL,建立于,1980,年,,EMBL,核苷序列数据库(,www.edi.ac.uk/embl/,)是欧洲主要的核苷序列收集单位,欧洲生物信息中心,EBI,(即,EMBL,在德国海德堡的站点)维护这个数据库。,核苷数据来自基因组测序中

11、心、世界各地的科学家、欧洲专利局、以及与合作伙伴,DDBJ(Japan),和,GenBank(USA),交换的数据。,三、,DDBJ,数据库,日本,DNA,数据库(,DDBJ,)是在亚洲唯一的核酸序列数据库,是搜集研究者公认的测定核酸序列的数据库,并且发放给数据提交者国际认证的核酸序列编号。由于,DDBJ,每天将搜集的数据与,EMBL-Bank/EBI,和,GenBank/NCBI,进行交换,使得三个核酸数据库几乎在任何时候都享有相同数据。,DDBJ,主要收集来自日本研究者获得的序列数据,但也收集数据和发放编号给任何其他国家的研究者。,四、其他重要的核酸序列数据库,dbEST,:,dbEST,

12、是,GenBank,中的一个子数据库,包含来源于不同物种的表达序列数据和表达序列标签序列的其他信息。,ncRNAdb,:,非编码,RNA,(,non-coding RNA ncRNA,)数据库旨在提供非编码,RNA,的,序列和功能信息,。,miRBase,:,miRBase,序列数据库主要存放已发表的,微小,RNA,(,microRNA miRNA),序列和注释,的数据库。,第三节 蛋白质序列数据库,Section 3 Protein Sequence Database,随着分子生物学的发展,人们获得了越来越多关于蛋白质序列、结构和功能的信息。世界各国的生物学家和计算机科学家合作利用这些信息构

13、建了蛋白质序列数据库、蛋白质三维结构数据库、蛋白质组数据库(二维凝胶电泳数据库)、信号传导及蛋白质,-,蛋白质相互作用相关数据库、,DNA,和蛋白质相互作用数据库等蛋白质相关数据库。,常用的蛋白质序列数据库:,PIR,MIPS,Swiss-Prot,蛋白质功能、结构域和蛋白质家族有关的数据库:,PROSITE,InterPro,Pfam,ProDom,SMART,等,蛋白质三维结构相关数据库:,PDB,BioMagResBank,SWISS-MODEL Repository,ModBase,CATH,SCOP,ReLiBase,TOPS,SWISS-3DIMAGE,BioImage,等,蛋白质

14、二维凝胶电泳数据库:,WORLD-2DPAGE,Phoretix links,信号传导及蛋白质,-,蛋白质相互作用相关数据库:,DIP,INTERACT,ProNet,KEGG,CANSITE,SPAD,CSNDB,等,DNA,和蛋白质相互作用数据库:,DPInteract,蛋白质翻译后修饰相关数据库:,O-GlycBase,、,PhosphoBase,、,RES,蛋白质等蛋白质,一、,PIR,数据库,蛋白质信息库(,PIR,),(,pir.georgetown.edu/pirwww/,)是一个支持基因组学、蛋白质组学和系统生物学检索和科学研究的综合公共生物信息学资源。,PIR,是由,美国国家

15、生物医学基金会,(,NBRF,)于,1984,年建立,帮助研究者确认和解释蛋白序列信息的数据库。,PIR,免费为科学界提供包括蛋白序列数据库(,PSD,)在内的蛋白数据库和分析工具。,PIR,信息库资源,PIR,主要数据库:,1.UniProt-,通用蛋白质资源库,2.iProClass-,蛋白质知识整合数据库,3.PIRSF-,蛋白质家族分类系统,4.iProLINK-,蛋白质文献、信息和知识整合数据库,1.UniProt-,通用蛋白质资源库,UniProt,(,www.uniprot.org/,)是存储和链接其他蛋白质数据库的资源库,并且是蛋白质序列和具有综合功能注释目录的中心资源库。使用

16、UniprotKB,可以检索准确、可靠的蛋白综合信息。使用,UniRef,可以减少冗余,加速序列相似性搜索。使用,UniParc,可以检索存档序列和它们来源的数据库。,2.iProClass-,蛋白质知识整合数据库,iProClass,(,pir.georgetown.edu/iproclass/,)提供来自,90,多个生物学数据库的大量整合数据,包括蛋白,ID,图谱服务、,UniProtKB,编注蛋白质摘要描述和筛选,UnParc,数据库的蛋白质序列。使用,iProClass,可以检索最新的蛋白质综合信息,包括:功能、转导通路、相互作用、家族分类、基因和基因组、功能注释标准体系(,onto

17、logy,)、文献和分类学信息。使用,iProClass,还可以检索,ID,图谱、蛋白质词典和相关序列。,3.PIRSF-,蛋白质家族分类系统,PIRSF,(,pir.georgetown.edu/pirsf/,)分类系统概要论述家族的特征,如家族名称、分类分布、分级和功能域结构,以及家族成员,包括功能、结构、传导通路、功能注释标准体系(,ontology,)和家族分类。利用这些信息可以获得蛋白质的准确功能或预测的功能和该蛋白质所属家族成员共有的其他特征。,4.iProLINK-,蛋白质文献、信息和知识整合数据库,iProLINK,(,pir.georgetown.edu/iprolink/,

18、提供有关注释内容的文献、蛋白质名称词典和其他有助于文献挖掘的人文语言处理技术开发的信息、数据库校正、蛋白质名称标记和功能注释标准体系(,ontology,)。使用,iProLINK,可以获得描述蛋白质记录的文本文献资源,在,UniProtKB,记录(生物词典)中加入蛋白质或基因命名的图谱,获得用于开发文本挖掘算法的注释数据集、挖掘蛋白质磷酸化(,RLIMS-P,)文献和获得蛋白质功能注释标准体系(,ontology,)(,PRO,)信息。,二、,MIPS,数据库,慕尼黑蛋白质序列信息中心(,MIPS,)(,www.helmholtz-muenchen.de/en/mips,),它的重点工作是

19、基因组生物信息学,特别注重基因组信息系统分析,包括应用生物信息学方法注释基因组、表达分析和蛋白质组学方面研究。,MIPS,支持和维护一系列基因组数据库以及系统,可以提供细菌、真菌和植物基因组比较分析服务。在该站点提供基因组分析工具、数据库检索系统、表达分析、蛋白相互作用等网络服务。,三、其他重要的蛋白质序列数据库:,PRINTS,Pfam,(一),PRINTS,PRINTS,(,www.bioinf.manchester.ac.uk/dbbrowser/PRINTS/index.php,)是蛋白基序指纹图综合数据库,每个指纹图都是使用数据扫描程序,ADSP,或,VISTAS,序列分析软件包反复

20、优化后定义的。数据库中有两种类型指纹图,根据指纹图的复杂性分为简单和复合指纹图:简单指纹图基本上是单一的基序,而复合指纹图包含多个基序。,(二),Pfam,蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作域(,domain,)。在不同的蛋白质中不同的域以不同的组合出现,导致在自然界发现多种多样组成成分的蛋白质。识别出现在蛋白质中的域可以了解蛋白质的功能。,Pfam,数据库(,pfam.sanger.ac.uk/,)是一个大的蛋白质域家族集合,每个家族是用多序列比对和隐马模型(,HMMs,)分析结果的代表。,第四节,NCBI,与,EBISection 4 NCBI and EBI,一、

21、NCBI,的简介,二、,EBI,简介,一、,NCBI,的简介,作为一个国家分子生物学信息资源,,NCBI,的使命是开发新的信息技术,帮助理解控制健康和疾病的基本分子和遗传过程。特别是,,NCBI,肩负建立存储和分析分子生物学、生物化学和遗传学知识的自动系统;提供研究和医学界使用方便的数据库和软件;努力协调搜集国内外生物技术信息;执行分析生物学重要分子结构和功能的先进研究方法。,二、,EBI,简介,欧洲生物信息学研究所(,EMBL-EBI,),是欧洲分子生物学实验室(,EMBL,)的一部分,,EMBL-EBI,维护世界上最广泛的分子数据库。,EMBL-EBI,是在全球范围内,努力协调搜集和传播

22、生物学数据的欧洲节点,,EMBL-EBI,的许多数据库是生物学家们熟知的,包括:,EMBL-Bank,(,DNA,和,RNA,序列)、,Ensemble,(基因组)、,ArrayExpress,(基于微阵列的基因表达数据)、,UniProt,(蛋白质序列)、,InterPro,(蛋白家族、域和基序)、,Reactome,(传导通路)和,ChEBI,(小分子),新的资源帮助研究者不仅了解构成生物体的分子部件,还了解这些部件是如何组合构成系统的。,三、通过,Entrez Gene,从,NCBI,获取序列信息,Entrez,主要是用于,NCBI,数据库综合的、基于文本的搜索和检索系统。,Entrez

23、综合了科学文献、,DNA,和蛋白序列数据、,3D,蛋白质结构和蛋白质域数据、种群研究数据集、表达数据、完整基因组组装和分类学信息,形成一个紧密链接的系统。它用于搜索,NCBI,链接数据库的检索系统。,Entrez,检索系统子数据库,(一),Entrez Gene,检索,Entrez Gene,检索到的记录提供关键链接,将图谱、序列、表达、结构、功能、索引文献和同源数据链接在一起构成关键链接。用定义序列、已知的图谱定位和从表型信息推测的基因,为基因分配特有标识符。这些标识符在,NCBI,的数据库中通用,可以用于注释更新跟踪和相关信息跟踪。,Entrez Gene,用,NCBI,参考序列(,Re

24、fSeqs,)覆盖了基因组,还被整合到,NCBI,的,Entrez,和,E-Utilities,系统的索引、查询和检索中。,NCBI,检索首页检索窗口的数据库,选项下拉菜单,检索栏(,for,)输入,“,IL-2 human,”,(二),Entrez Gene,记录显示格式,当进行检索时,检索结果以摘要(,summary,)格式显示,每页可显示多条记录,摘要显示的每条记录前有一个选择框,可以选择哪些记录需要显示。显示内容还包括首选名称标志、完整全名、双单词的物种名称(在方括号中)、基因组定位和基因编号。如果基因在已命名的质粒上,那么作为基因定位将给出质粒名称。右侧的,Links,可以关联到显示

25、相关的,Entrez,记录,核对希望显示的记录,选择灰色查询条目中的显示选项,可以显示希望显示的相关记录。,Entrez Gene,检索结果摘要格式显示页面,Entrez Gene,全文报告页面(前部分),Entrez Gene,全文报告页面(后部分),IL2 mRNA,的,Nucleotide,数据库记录检索结果显示界面,(,三),Nucleotide,数据库记录显示格式,Nucleotide,数据库记录的显示结果,可以,GenBank,、,FASTA,、,Graphics,和,ASN.1,格式显示,序列信息通常用,FASTA,和,GenBank,两种格式显示,,FASTA,格式仅包括该序列

26、的简要特征,并以,G,、,A,、,T,、,C,四种碱基列出核苷酸序列,简单明了。而,GenBank,格式可显示较完整的基因序列记录,反映核苷酸序列的详细信息。,四、通过,SRS,从,EBI,中获取蛋白质序列信息,SRS,(,srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?-page+quickSearch+-id+76e2D1aC0Ri,)是世界上主要的生物信息学、基因组和相关数据整合、分析和显示工具。,SRS,检索系统是个开放的系统,可以根据不同的需要安装不同的数据库,现在,安装在,EBI,的数据库有,300,多个。,SRS,有三种检索方式:快速检索、标准检索和批量检索

27、SRS,开始页面,SRS,快速文本检索窗口,SRS,检索结果页面显示的检索结果,SRS,蛋白质记录详细内容页面,SRS,蛋白质序列显示窗口,SRS,标准检索页面,SRS,标准检索页面检索基因名为,“,KRAS,”,蛋白序列输入示意图,SRS,标准检索结果输出页面,小 结,本章介绍了生物信息学常用的数据库和重要网站,重点介绍了三大核酸数据库:,GenBank,数据库、,EMBL,数据库和,DDBJ,数据库。,NCBI,的,Entrez Gene,将分类、基因组、图谱、序列、表达、结构、功能、索引文献和同源数据链接在一起,为用户提供了便捷的检索方式。,EBI,的,SRS,检索系统是世界上主要的生物信息学、基因组和相关数据整合、分析和显示工具。,SRS,检索系统是个开放的系统,可以根据用户不同的需要安装不同的数据库,便于用户开发具有自己特性的操作平台,尤其在数据分析方面,对于检索的信息可以进行多种方式的分析处理。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服