收藏 分销(赏)

实验四蛋白质序列、结构的获取和显示.ppt

上传人:精**** 文档编号:12878097 上传时间:2025-12-22 格式:PPT 页数:57 大小:11.16MB 下载积分:14 金币
下载 相关 举报
实验四蛋白质序列、结构的获取和显示.ppt_第1页
第1页 / 共57页
实验四蛋白质序列、结构的获取和显示.ppt_第2页
第2页 / 共57页


点击查看更多>>
资源描述
,复旦大学,.,*,实验四:蛋白质序列、结构的获取和显示,杜 娟,dujuannx,基因与蛋白质组学数据分析,实验项目,四:蛋白质序列、结构的获取和显示,一、实验目的和要求:,掌握蛋白质序列数据库,Uniprot,的查询方法及格式特点,掌握蛋白质结构数据库,PDB,的及格式特点,掌握蛋白质结构显示软件,Pymol,的使用,2,.,UniProt,:,Universal Protein Resource,收录蛋白质序列目录最广泛、功能注释最全面的数据库;,包含三个子库:,UniProtKB,(,UniProt Knowledgebase,),UniRef,(,UniProt Reference Clusters,),UniParc,(,Uniprot Archive,),一,UniProt,数据库,1.,简介,3,.,2.,数据来源,European Bioinformatics Institute(EMBL-EBI),SIB Swiss Institute of Bioinformatics,Protein Information Resource(PIR),Swiss-Prot and TrEMBL,Protein Sequence Database(PIR-PSD),4,.,UniProt,的网址:,www.uniprot.org/,5,.,3.,数据查询,Uniprot,检索号,,包括,6,个字符串,可由大写字母,AZ,和数字,09,组合而成。,也可以用关键词检索,.,检索演示,例,1,:查询,草履虫,细胞周期蛋白依赖的蛋白激酶(,CDK2,),的结构数据,(1),登陆,Uniprot,网站,www.uniprot.org/,(2),在搜索栏选中“,Protein knowledgebase(,UniProtKB,)”,,在文本框中输入“,Paramecium tetraurelia CDK2,”,,单击,Site Search,按钮,,出现结果,。,.,8,.,9,.,10,.,11,.,12,.,与其他数据库的链接,13,.,14,.,4.UniProt,数据格式,ID Q9XYV1_PARTE Unreviewed;301 AA.,AC Q9XYV1;,DT 01-NOV-1999,integrated into UniProtKB/TrEMBL.,DT 01-NOV-1999,sequence version 1.,DT 21-MAR-2012,entry version 71.,DE SubName:Full=Cyclin-dependent protein kinase Cdk2;,GN Name=CDK2;,OS Paramecium tetraurelia.,OC Eukaryota;Alveolata;Ciliophora;Intramacronucleata;,OC Oligohymenophorea;Peniculida;Parameciidae;Paramecium.,OX NCBI_TaxID=5888;,头部区,序列名称,序列编号,序列来源的物种名,序列来源的物种学名和分类学位,物种分类号,序列简单说明,15,.,引文区,RN 1,RP NUCLEOTIDE SEQUENCE.,RC STRAIN=51S;,RX MEDLINE=99448661;PubMed=10519216;,RX DOI=10.1111/j.1550-7408.1999.tb06065.x;,RA Zhang H.,Berger J.D.;,RT A novel member of the cyclin-dependent kinase family in Paramecium,RT tetraurelia.;,RL J.Eukaryot.Microbiol.46:482-491(1999).,评论区,CC -,CC Copyrighted by the UniProt Consortium,see www.uniprot.org/terms,CC Distributed under the Creative Commons Attribution-NoDerivs License,CC -,相关文献编号或递交序列的注册信息,序列注释信息,16,.,交叉引用数据库区,DR EMBL;AF126147;AAD34354.1;-;Genomic_DNA.,DR HSSP;P24941;1OIQ.,DR ProteinModelPortal;Q9XYV1;-.,DR GO;GO:0005524;F:ATP binding;IEA:UniProtKB-KW.,DR GO;GO:0004674;F:protein serine/threonine kinase activity;IEA:InterPro.,DR InterPro;IPR011009;Kinase-like_dom.,DR InterPro;IPR000719;Prot_kinase_cat_dom.,DR InterPro;IPR017441;Protein_kinase_ATP_BS.,DR InterPro;IPR002290;Ser/Thr_dual-sp_kinase_dom.,DR InterPro;IPR008271;Ser/Thr_kinase_AS.,DR Pfam;PF00069;Pkinase;1.,DR SMART;SM00220;S_TKc;1.,DR SUPFAM;SSF56112;Kinase_like;1.,DR PROSITE;PS00107;PROTEIN_KINASE_ATP;1.,DR PROSITE;PS50011;PROTEIN_KINASE_DOM;1.,DR PROSITE;PS00108;PROTEIN_KINASE_ST;1.,17,.,序列区,KW ATP-binding;Cyclin;Kinase;Nucleotide-binding;Transferase.,SQ SEQUENCE 301 AA;34675 MW;E839F1A5EA0D5CB5 CRC64;,MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL,LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN,YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTHEVIT LWYRAPEILL,GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD,FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN,N,/,与序列相关的关键词,氨基酸统计数,18,.,DNA,代码,氨基酸代码,19,.,FASTA,文件格式,tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1,ID,号,名称,基本性质简要说明,20,.,在,Uniprot,中查询拟南芥的光敏色素,phyE,编码蛋白的详细信息,阅读序列格式的解释,列,出共包含哪几个部分?,标出,头部区主要字段,的,含义,。,在,Uniprot,中查询(,1,)拟南芥,油菜素内酯受体,gibberellin receptor,GID1C,、(,2,)水稻,独角金内酯水解酶,strigolactone hydrolase D14,的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的,mRNA,检索号(类似于这样的格式,N*_*,)、,GeneID,号。,作 业,21,.,二 蛋白质结构数据库,PDB Protein DataBank,,美国,Brookhaven,国家实验室管理生物大分子三维空间结构原子坐标数据库,www.rcsb.org/pdb/,NCBI STRUCTURE,:,MMDB(Molecular Modelling DataBase),,包含了从,PDB,获取的实验确定的生物高聚物结构分子模型数据库。,.,PDB,数据库,(,protein data bank),1.,简介,美国,Brookhaven,实验室,1971,年建立的,大分子结构数据库,PDB,蛋白质晶体结构资料数据库,(Protein Data Bank),。,PDB,数据库的维护由,结构生物信息学研究合作组织,(,Research Collaboration for Structural Bioinformatics,RCSB,)负责。,.,2.,数据来源,通过实验(,X,射线晶体衍射,核磁共振,电子显微镜方法等,)测定的生物大分子的三维结构。,主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。,.,3.,数据统计,截止,2013,年,11,月,,PDB,数据库已含有,95644,个结构数据,其中约,92.5%,是蛋白质的结构。,.,.,4.,数据查询,PDB,中的记录有唯一的,PDB-ID,,包括,4,个字符串,可由大写字母,AZ,和数字,09,组合而成。,PDB,和它的镜像站点提供每个,PDB,记录的查询,可按一些专门的查询项目(如,提交数据、作者姓名、结构表达,)进行检索。,.,检索演示,例,1,:查询,人类泪液载脂蛋白,的结构数据,(1),登陆,PDB,网站,www.rcsb.org/pdb/,(2),在上方的搜索栏选中“,Everything”,,在文本框中输入“,HUMAN TEAR LIPOCALIN,”,,单击,Site Search,按钮,,出现结果,。,.,第一步:,输入关键字“,HUMAN TEAR LIPOCALIN”,也可输入,ID,号,.,第二步:,选择人类泪液载脂蛋白,1XKI,.,数据查看:,(3),分别单击标签,3D view,,,Sequence,,,Annotations,,,Seq.Similarity,3D Similarity,Literature,Biol.&Chem.,Methods,Geometry,观察数据信息。,(4),回到,Summary,标签,在右侧的,Biological Assembly,区域可以观察蛋白的三维结构。,(5),单击右侧目录中的,Download Files,下载不同格式和内容的文件;或下载,FASTA,序列文件,;也可下载,PDB,文件,(,1XKI.pdb,),。,.,第三步:观察数据信息,1XKI,.,.,第四步:,1XKI,结构展示图,.,.,下载,PDB,结构文件,.,5.,数据结构,PDB,中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。,每条记录有两种序列信息,一种是显式序列信息,(explicit sequence),,一种是隐式序列信息,(implicit sequence),。,.,在,PDB,文件中,以关键字,SEQRES,作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;,PDB,的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。,.,PDB,文本文件,用写字板打开,标题部分,分子类别,转运蛋白,该文件的公布日期,该化合物的,pdb,代码,该化合物的来源,结构测定者名字,REMARK,是此,pdb,文件的参考书目、最大分辨率、注解等,.,.,一级结构,杂因子,.,二级结构,连接注释,晶胞特征及坐标变换,.,连通性部分,坐标部分,1-6,“,ATOM,或,HETATM,”,7-11,原子序列号,13-16,原子名称,18-20,残基名,22,链标识符,23-26,残基序列号,31-38 X,坐标,39-46 Y,坐标,47-54 Z,坐标,55-60,位置,61-66,温度因子,79-80,原子带的电荷,77-78,元素符号,.,三,结构显示软件,-PyMOL,简介,www.pymol.org/,All,指所有的对象,,3ODU,指刚才打开的文件,,(sele),是选择的对象,按钮,A:,代表对这个对象的各种,action,,,S,:显示这个对象的某种样式,,H,:隐藏某种样式,,L,:显示某种,label,,,C,:显示的颜色,.,点击,all,中的,H,,选择,everything,,隐藏所有,点击,3ODU,中的,S,,选择,cartoon,,以,cartoon,形式显示蛋白质,点击,3ODU,中的,C,,选择,by ss,,以二级结构分配颜色,选择,点击右下角的,S,,窗口上面出现蛋白质氨基酸序列,找到,1164,位,ITD,,是配体,.,点击选择,ITD,,此时,sele,中就包含,ITD,这个残基,点击(,sele,)行的,A,,选择,rename selection,,窗口中出现,更改,sele,为,IDT,,点击(,IDT,)行的,S,选择,sticks,,点击,C,,选择,by element,,选择,调整窗口使此分子清楚显示。,.,IDT,行点击,A,选择,find,,选择,polar contacts,,再根据需要选择,这里选择,to other atoms in object,分子显示窗口中出现几个黄色的虚线,这就是氢键的对象,点击这一行的,C,,选择,red,,把氢键显示为红色。,.,接着再显示跟,IDT,形成氢键的残基,点击,3ODU,行的,S,,选择,lines,,显示出所有残基的侧链,使用鼠标转动蛋白质寻找与,IDT,以红色虚线相连的残基,分别点击选择这些残基。注意此时,selecting,要是,residures,.,.,.,.,.,.,.,在,PDB,结构数据库中查询(,1,)拟南芥茉莉酸受体、(,2,)拟南芥油菜素内酯受体、(,3,)水稻独角金内酯水解酶的结构,每个蛋白共搜索到几个,PDB,结构?用,Pymol,软件观察下载到的结构,对每个蛋白的几个结构有何区别?,利用,Pymol,,做出拟南芥茉莉酸受体与茉莉酸结合的作用图,背景白色,分子显示成棍状模型,蛋白显示为,cartoon,模型。,作 业,55,.,实验报告,到网络教学平台,-,基因与蛋白质组学数据分析,B2100029-,教学材料,-,实验课件,下载基因与蛋白质组学数据分析实验报告模版,将上述问题答案整理到实验报告中,正反打印放在,1,张纸上(,不超过,1,张,),下次实验课上交。,56,.,谢谢大家!,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服