1、生物信息学毕业论文湖 南 科 技 大 学毕 业 设 计( 论 文 )题目绵羊MHC Class基因的生物信息学分析作者周丽萍学院生命科学学院专业生物科学学号0709010125指导教师金元昌二一一年 月 日湖 南 科 技 大 学毕业设计(论文)任务书 生命科学学院 院 生物工程 系(教研室)系(教研室)主任: (签名) 2011 年 1 月 18 日学生姓名: 周丽萍 学号: 07090101025 专业: 生物科学 1 设计(论文)题目及专题: 绵羊 MHC ClassII基因的生物信息学分析 2 学生设计(论文)时间:自2011年 1月18日开始至 2011 年 6 月 10 日止3 设计
2、(论文)所用资源和参考资料:3.1所用资源:万维网上的生物数据库;学校所购买的电子期刊;校图书馆;学院实验室网络;3.2 参考资料:张阳德编著.生物信息学M北京:科学出版社,2004.9.金伯泉.细胞和分子免疫学M.科学出版社,2006,281-305. 许忠能.生物信息学M. 清华大学出版社,2008,1-4. 杨晶,胡刚,王奎,沈世镒.生物计算生物序列的分析方法与应用M.科学出版社,2010,105-111.4 设计(论文)应完成的主要内容:4.1获取绵羊 MHC ClassII基因核酸与蛋白序列及与其同源的其它物种的序列,进行多序列比对,做出分子进化树,并分析; 4.2对绵羊 MHC C
3、lassII分子的疏水区、跨膜区、功能结构域和生物活性位点分析; 4.3预测绵羊 MHC ClassII分子的二级结构与三级结构。 5 提交设计(论文)形式(设计说明与图纸或论文等)及要求: 5.1严格按照的写作完成毕业论文,完成不少于8000字信息量的论文;格式正确,包括目录、论文中英文题目及摘要、前言、正文、参考文献、致谢词和附录; 5.2 在实验及论文写作过程中,对数据和结果等要求实事求是,并且要在老师的指导下独立完成。 6 发题时间: 2011 年 1 月 17 日指导教师: (签名)学 生: (签名)湖 南 科 技 大 学毕业设计(论文)指导人评语主要对学生毕业设计(论文)的工作态度
4、,研究内容与方法,工作量,文献应用,创新性,实用性,科学性,文本(图纸)规范程度,存在的不足等进行综合评价指导人: (签名)年 月 日 指导人评定成绩: 湖 南 科 技 大 学毕业设计(论文)评阅人评语主要对学生毕业设计(论文)的文本格式、图纸规范程度,工作量,研究内容与方法,实用性与科学性,结论和存在的不足等进行综合评价评阅人: (签名)年 月 日 评阅人评定成绩: 湖 南 科 技 大 学毕业设计(论文)答辩记录日期: 学生: 学号: 班级: 题目: 提交毕业设计(论文)答辩委员会下列材料:1 设计(论文)说明书共页2 设计(论文)图 纸共页3 指导人、评阅人评语共页毕业设计(论文)答辩委员
5、会评语:主要对学生毕业设计(论文)的研究思路,设计(论文)质量,文本图纸规范程度和对设计(论文)的介绍,回答问题情况等进行综合评价答辩委员会主任: (签名)委员: (签名)(签名)(签名)(签名) 答辩成绩: 总评成绩: 摘 要从NCBI中获取绵羊主要组织相容性复合体(Major Histocompatibility Complex,MHC)的核苷酸与氨基酸序列,应用生物信息学原理,对绵羊MHC分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比,做出分子进化树。结果表明,绵羊MHC分子
6、有一个疏水区和跨膜区;该分子有主要组织相容性复合物蛋白免疫球蛋白信号及N-糖基化位点、蛋白质激酶C磷酸化位点等多个生物活性位点。绵羊MHC class的氨基酸序列和核苷酸序列与成都麻羊的同源性最高,分别达66%和73%,其次与亚洲水牛和肩蜂牛的同源性也较高,与大黄鱼的同源性最低,分别为25%和51%。关键词:主要组织相容性复合体类;生物信息学;序列分析ABSTRACTExtract Ovis aries from NCBI of nucleotides and Major Histocompatibility Complex class II amino acid sequence, appl
7、ication bioinformatics principle, on Ovis aries MHC class II molecules succoth watershed and transmembrane area, the structure and function domain and biological activity sites aspects of biology characteristic was analyzed to predict the secondary structure and level 3 genetic structure, and the Ov
8、is aries and other animals will be more nucleotide sequence of amino acid sequence and contrast, make more sequence phylogenetic tree. Results show that, Ovis aries MHC class II molecules have a dredging watershed and transmembrane area, the molecules are major histocompatibility complex protein imm
9、unoglobulin signal and N - glycosylation sites, protein kinase C phosphorylation sites such multiple bioactive loci sites, Ovis aries MHC class II the sequence of amino acids and nucleotide sequences and the Capra hircus is highest homology of 66% and 73%. Secondly Bubalus bubalis and Bos indicus ho
10、mology of higher, with the lowest, homology of Larimichthys crocea for 25% and 51% respectively.Keywords: Major Histocompatibility Complex class II molecules; Bioinformatics; Sequence analys 湖南科技大学本科生毕业设计(论文)目 录第一章 前言11.1 生物信息学简介11.2 MHC的相关简介1第二章 材料来源4第三章 分析方法53.1 蛋白质序列的获取53.1.1 绵羊MHC Class基因的核酸和蛋白质
11、序列的获得53.1.2 同源序列获得53.2 蛋白质的基本性质分析53.2.1 疏水性分析53.2.2 跨膜区分析53.2.3 功能结构域分析53.2.4 生物活性位点分析53.3 蛋白质结构预测53.3.1 蛋白质二级结构的预测53.3.2 蛋白质三级结构预测53.4 绵羊MHC Class系统进化树分析5第四章 结果与分析64.1 绵羊MHC Class基因的核酸和蛋白质序列64.2 绵羊MHC Class蛋白质的疏水性和跨膜区分析74.2.1绵羊MHC Class蛋白质的疏水性分析74.2.2绵羊MHC Class蛋白质的跨膜螺旋区分析84.3 绵羊MHC Class蛋白质的功能结构域分
12、析94.4 绵羊MHC Class蛋白质生物活性位点分析114.5 绵羊MHC Class蛋白质的二级结构预测124.6 绵羊MHC Class蛋白质的三级结构预测144.7 同源序列对比和系统发生分析15第五章 结论21参考文献22致谢23-第一章 前 言1.1 生物信息学简介生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义1。它的研究内容包括生物信息的存储于获取、序列比对、测序与拼接、基因预测、生物进化与系统发育分析、蛋白质结构预测、RNA结构预测、分子设计与药物设计、代谢网络分
13、析、基因芯片、DNA计算等。它还是一门以信息知识为基础的学科,关键资源是知识,关键技术是信息处理。它为揭示人类及重要动植物种类的基因组信息,继而进行生物大分子结构模拟和药物设计,以及天然生物大分子的改造和基于受体结构的药物分子设计提供依据。生物信息学不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质具有重要意义,而且可为人类疾病的诊断和防治开辟全新的途径,并为动植物的物种改良提供了坚实的理论基础。此外通过对影响药物代谢或效应通路、相关基因编码序列的再测序,很可能揭示个体对药物差别的遗传学基础2。生物信息学作为生命科学研究所必需的研究工具,在生命科学实践中越来越显示出它的重要作用,特别是在
14、实验设计、结构分析上,离不开生物信息学的指导3。而生物数据库、相关软件是生物信息学研究与应用的重要资源。在生物信息学软件中,生物学研究人员用得最多的软件是搜索工具BLAST(Basic Local Alignment Search Tool)1。本文则是对绵羊MHC class II基因进行了生物信息学分析,也多次使用了BLAST软件。1.2 MHC的相关简介诱导强而迅速排斥反应的抗原称为主要组织相容性抗原或主要移植抗原, 编码这种抗原的基因群称为主要组织相容性复合体(Major Histocompatibility Complex, MHC)。 主要组织相容性复合体是存在于脊椎动物某一染色体
15、上的一群紧密连锁的基因群,编码主要组织相容性抗原,调控细胞间相互识别,并与免疫应答和免疫调节有关,呈高度多态性4。多态性是一个群体的概念,指MHC存在多个基因座位,染色体同一基因座有两种以上的基因型,即可能编码两种以上的产物。MHC的高度多态基因区,这些连锁的免疫应答基因控制着机体对抗原产生免疫应答的能力。MHC高度多态性赋於物种极大的应变能力造就了各式各样对抗原(病原体)入侵反应性和易感性不同的个体.使之能对付多变的环境条件及各种病原体的侵袭。在免疫应答的T-B、T-T、T-APC细胞的相互作用中,T细胞除识别抗原物质外,还必须同时识别与之作用细胞表面的MHC分子,这一现象称为MHC限制性。
16、不同的物种,不同种属动物都有自身的MHC:如人的MHC通常称HLA基因(hunan leukocyte antigen,HLA)或HLA基因复合体, 称其产物为HLA分子或HLA抗原;称小鼠MHC为H-2;称黑猩猩为ChLA;称狗为DLA;称猪为SLA;称牛为BoLA。根据主要组织相容性抗原分子结构、分布和功能不同分为、类分子。按所含基因的功能不同,一般可将MHC区域分为Class区、Class区和Class区。其编码基因也相应地分成三类。类和类分子是结构相似的细胞膜表面糖蛋白,除作为移植抗原外,还与抗原递呈及某些疾病相关。类分子包括C2、C4、B因子和肿瘤坏死因子等多种可溶性蛋白质。MHC类
17、分子:所有有核细胞及血小板、网织红细胞。图1.1 MHC分子结构图MHC-类分子是异源二聚体,它的分子的两条链均由MHC-类分子基因编码,由链和链以非共价键结合的多肽链构成(如图1.1所示),其中链分子量为3234kDa,有两个N连接寡糖;链为2730kDa,有一个N连接寡糖。两条链在整个结构上彼此相似,由于糖基化作用,链比链略大,链、链胞膜外区各有两个结构域1、2及1、2,每个结构域约含90个氨基酸残基。链和链均是跨膜蛋白,C端为胞浆区。除1结构域外,2、1和2每个结构域均含一个二硫键。胞膜外区(跨膜区和胞浆区)按功能进一步分为肽结合区和免疫球蛋白样区。MHC-类分子的两条链均由不同的MHC
18、基因编码,呈多态性。肽结合区MHC-类分子的1、1结构域与免疫球蛋白样区结构域无相似性,是类分子结合抗原肽部位和高度多态性所在。每个结构域都是有4条折叠和1个螺旋组成,1和1结构域的片层共同形成肽结合沟槽的底部,1和1结构域的螺旋共同形成肽结合沟槽的侧壁。2和2结构域属于免疫球蛋白超家族C1型结构,具非多态性,2和2结构域是MHC-类分子的非多态部分,也是与CD4分子相互作用的位点。2和2结构域C端侧各有一个短的连接区,分别连接2、2结构域与跨膜区。跨膜区约含25个氨基酸残基,形成螺旋将链和链固定在细胞膜上。胞浆区很短,有2530个氨基酸残基,可能与信号转导有关5。在MHC基因内,第一外显子编
19、码先导顺序或信号顺序,它将新生蛋白带向内质网。每个约由90个氨基酸组成的细胞外区残基各有一个大外显子跨膜区和胞浆区由几个小外显子编码。控制MHC基因转录的许多顺式调节顺序位于编码MHC分子外显子阅读框架的5端,这些核苷酸顺序是DNA-结合蛋白的分子靶位,这些DNA-结合蛋白事反式转录调节因子。MHC基因转录调节的一般原则与免疫球蛋白基因相似。MHC类基因启动子序列位于基因编码区5端上游,转录起始点上游200bp范围内。MHC类基因进侧基因启动子部分存在多态性,表现为顺式作用元件DQ,DP的多基因家族,是类分子多样性的分子基础,在免疫应答中起关键作用5。本文是对绵羊MHC class分子进行生物
20、信息学分析,应用生物信息学方法找出绵羊MHC class的核酸和蛋白质序列,对绵羊MHC class分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比和系统分子进化树分析,对绵羊MHC class的研究做一下基础性工作。第二章 材料来源绵羊MHC class基因及其同源的其它物种的核酸和氨基酸序列编码(表2.1)。 表2.1 不同物种MHC class基因的核酸和蛋白质序列种类(species)蛋白质编号(protein ID)核酸编号(nucleotide ID)绵羊NP-00111
21、6870NM-001123398褐家鼠CAD86939AJ554216原鸡AAR14674AY357254小家鼠NP-034508NM-010378非洲爪蟾蜍NP-001079971NM-001086502家猫ACK99138EU915361家马XP-001493225XM-001493175野驴ABM92287EF204945欧洲兔NP-001164589NM-001171118欧洲野兔ACN39186FJ225345大熊猫XP-002914414XM-002914368鹪鹩AAN87894AY169005成都麻羊AAR97716AAR97716亚洲水牛AAY40169DQ016629肩峰牛
22、CAX17688FM986339大猩猩AAU87999AY663403红毛猩猩ACL00582EU877227野猪ABA42968DQ159895大西洋鲱CAM34665AM492999三文鱼CAD27719AJ438965大黄鱼ABV48907EF681863人NP-002113NM-002122家犬CAH61722AJ630362第三章 分析方法3.1 蛋白质序列的获得3.1.1 绵羊MHC class基因的核酸和蛋白质序列的获得 在NCBI数据库上搜索绵羊MHC class基因的核酸和蛋白质序列。3.1.2 同源序列获得 利用NCBI上的BLAST程序对比直接获取与绵羊MHC class
23、基因同源的核酸和蛋白质序列。3.2 蛋白质的基本性质分析3.2.1 疏水性分析 用位于Expasyde的Protscale6(http:/www.expasy.org/cgi-bin/protscale.pl) 程序对其进行疏水性分析。3.2.2 跨膜区分析 联网至(http:/www.genome.cbs.dut.dk/services/TMHMM-2.0)使用服务器TMHMM-2.07 或联网至(http:/www.ch.embnet.org/software/TMPRED_form.html)进行跨膜区分析。3.2.3 功能结构域分析 联网至(http:/www.ebi.ac.uk/in
24、terpro/index.html)用EBI开发的InterProScan7进行分析。3.2.4 生物活性位点分析 利用位于Expasy的Prosite6(http:/www.expasy.org/prosite/)对绵羊MHC class蛋白质进行活性位点分析。3.3 蛋白质结构预测3.3.1 蛋白质二级结构的预测 联网至(http:/www. Predictprotein.org/)用PHD8对绵羊MHC class进行分析或联网至PSIPRED8的网址(http:/bioinf.cs.ucl.ac.uk/psipred)。3.3.2 蛋白质三级结构的预测 利用位于SWISS-MODEL5
25、的Automated Mode服务器返回到邮件的结果,观察蛋白质的三级结构。3.4 绵羊MHC class系统进化树分析联网至(http:/www.ebi.ac.uk/clustalw/)6对所获得的同源蛋白质序列进行比对分析并构建系统进化树。第四章 结果与分析4.1 绵羊MHC class基因的核酸和蛋白质序列在NCBI上获取绵羊的蛋白质序列(序列号:NP-001116870): 1MKKALILRALALAAMMSLCGGEDIVADHVGTYGTNVYQTYGASGQFTFEFDGDELFYVDL61RKKETVWRLPEFNNITMFEIQSALRNIVMSKRNLDILMKNSNFT
26、PATNDIPEVAVFPKSS121VILGIPNTLICQVDNIFPPVINITWFYNGQFVAEGVAETTFYPKSDHSFLKFSYLTFVPA181SEDFYDCRVEHWGLEEPLVKHWEPKIPTPTSELTETVVCALGLPMGLMGIVVGTVLILRV241RCSGAASRRRRAMSHGLKDGKERKVFISVFAAASGAQDHQPHAAWCFR该蛋白质序列由288个氨基酸残基组成。在NCBI上获取绵羊的核酸序列(序列号:NM-001123398): 1CATGGGCTGCTCCAACATGATTTCTCCAGCAGTTCTCTTTAGACCACCTTCC
27、TGGTGAGG61CACCACTTGGAACAGCCACTCCTGAGGAAACCCTTGGAGGAGGAGGAGGATGAAGAAAGC121TCTGATTCTGAGGGCTCTCGCTCTGGCCGCCATGATGAGCCTGTGTGGAGGTGAAGACAT181CGTGGCGGACCACGTGGGCACTTACGGCACAAATGTCTACCAGACGTACGGCGCCTCTGG241CCAGTTCACGTTTGAATTTGATGGAGACGAGCTCTTCTACGTGGACCTGAGGAAAAAAGA301GACTGTCTGGAGGCTGCCCGAGTTTAACAATATCACCA
28、TGTTTGAAATTCAGAGTGCCCT361GAGAAACATTGTTATGTCAAAAAGAAATTTGGACATCTTGATGAAAAATTCCAACTTTAC421ACCTGCCACCAATGACATCCCTGAAGTGGCTGTGTTTCCCAAATCCTCCGTGATCCTGGG481GATTCCCAACACCCTCATCTGTCAGGTGGACAACATCTTTCCTCCTGTGATCAACATCAC541TTGGTTTTACAATGGACAGTTTGTTGCAGAAGGTGTCGCTGAGACCACCTTCTACCCCAA601GAGTGACCACTCCTTCCTCAAGT
29、TCAGTTACCTCACCTTTGTTCCCGCCAGTGAAGACTT661CTATGACTGCAGAGTGGAGCACTGGGGCCTGGAAGAGCCCCTCGTCAAGCACTGGGAGCC721CAAGATTCCAACCCCTACATCAGAGCTGACAGAGACTGTGGTCTGTGCCCTGGGGCTGCC781CATGGGCCTCATGGGCATCGTGGTGGGCACTGTCCTCATCCTCCGAGTCCGGTGCTCAGG841TGCTGCCTCCAGACGTCGAAGGGCCATGAGTCATGGCCTGAAAGATGGGAAGGAGAGGAA901AGTCTTCA
30、TTTCTGTTTTCGCTGCAGCATCGGGAGCACAGGACCATCAGCCTCATGCTGC961CTGGTGTTTCAGGTGATCAGTCTTTACAAGAAAAGAAAGGCATGGTTCAGGCTCCAGTTC1021CCCATCTTGACCTTGACTGAGACGTGCTCCTTGGTCCATTTCATCACAGAGCTCCTTCCA1081CGCCCTCCTGCTCTCCCTGCTGGGGCAGACTTTATGGAGGAATTTTCCTTCGAAGATCAC1141TGACCCTCACGAATTCTCCCAACTTAGTCTTTGATTCATTGCCTACCTGTCAC
31、AGAGACC1201TGGATTGTTCCACC 该核酸序列由1214个碱基组成。4.2 绵羊MHC class蛋白质的疏水性和跨膜区分析4.2.1 绵羊MHC class蛋白质的疏水性分析疏水性是每个氨基酸所固有的特性,即每个氨基酸远离周围水分子,将自己包埋进蛋白质核心的相对趋势。疏水性氨基酸在蛋白质内部,由于其疏水性的相互作用,在保持蛋白质三级结构的形成和稳定中起着重要作用。疏水性预测的方法依赖于疏水性的衡量尺度,每个氨基酸根据其一系列的物理特性(例如溶解性、跨越水-汽相时产生的自由能等),被赋予一个数值以代表其疏水性。组成蛋白质的20种氨基酸各自带有不同极性的侧链基团,氨基酸侧链的疏水
32、性,用从各氨基酸的疏水性减去甘氨酸疏水性之值来表示。具有较高正值的氨基酸具有较强的疏水性;而具有较低负值的氨基酸则具有较强的轻水性6。利用位于Expasy的Protscale进行疏水性分析,当Window size设置为9时,当氨基酸残基的疏水性值大于2.34时,为明显的疏水区。单个氨基酸疏水性值:Ala: 1.800 Arg: -4.500 Asn: -3.500 Asp: -3.500 Cys: 2.500 Gln: -3.500 Glu: -3.500 Gly: -0.400 His: -3.200 Ile: 4.500 Leu: 3.800 Lys: -3.900 Met: 1.900
33、 Phe: 2.800 Pro: -1.600 Ser: -0.800 Thr: -0.700 Trp: -0.900 Tyr: -1.300 Val: 4.200 : -3.500 : -3.500 : -0.490 MIN: -2.244MAX: 3.122图4.1 用Protscale对绵羊MHC class蛋白质进行疏水性分析结果从上图返回的结果我们得知在第234位氨基酸处有最大值3.122,在第258位氨基酸处有最小值-2.244,在第位231至236位氨基酸的值分别为2.503,2.829,2.941,3.122,2.912,2.601这一区段氨基酸疏水性值大于2.34,所以我们得
34、出结论:该蛋白质序列在位于231236位残基之间具有明显的疏水性,从而说明该序列有一个疏水区。4.2.2 绵羊MHC class蛋白质的跨膜螺旋区分析膜蛋白是一类结构独特的蛋白质,执行着重要的细胞生物学功能。蛋白质序列含有跨膜区,提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白或离子通道蛋白,所以含有跨膜区蛋白往往和细胞的功能状态密切相关,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用9。通常使用单一的预测软件分析的准确性都不太高,综合不同的软件预测结果并结合疏水性图,可获得较好的预测结果。使用两种在线网络工具分析结果分别是:(1)利用TMHMM软件分析结果如下:# Sequence
35、 Length: 288# Sequence Number of predicted TMHs: 1# Sequence Exp number of AAs in TMHs: 21.83121# Sequence Exp number, first 60 AAs: 0.52936# Sequence Total prob of N-in: 0.06765SequenceTMHMM2.0outside 1 217SequenceTMHMM2.0TMhelix 218 240SequenceTMHMM2.0inside 241 288图4.2 用TMHMM对绵羊MHC class蛋白质的跨膜区分析
36、结果根据以上数据和图表显示我们可以得出这样的结论:在位于位于218240位氨基酸之间存在一个跨膜区。(2)利用Tmpred软件分析结果如下:possible models considered, only significant TM-segments used- STRONGLY prefered model: N-terminus outside 3 strong transmembrane helices, total score : 3329 # from to length score orientation 1 4 25 (22) 742 o-i 2 121 143 (23) 54
37、2 i-o 3 217 240 (24) 2045 o-i- alternative model 3 strong transmembrane helices, total score : 2867 # from to length score orientation 1 6 24 (19) 899 i-o 2 114 133 (20) 505 o-i3 216 238 (23) 1463 i-o 图4.3 用Tmpred对绵羊MHC class蛋白质的跨膜区分析结果由分析结果和图像显示,可得出这样的结论:绵羊MHC class蛋白质的跨膜区有两种可能,它有三个明显的跨膜区。一种可能为它的跨膜
38、区一个位于 425 位氨基酸之间,一个位于121143位氨基酸之间,另一个位于217240位氨基酸之间。另一种可能为它的跨膜区一个位于624位氨基酸之间,一个位于114133位氨基酸之间,另一个位于216238位氨基酸之间。总体来看,Tmpred软件预测出三个跨膜区,TMHMM预测出一个跨膜区,显然,对于同一蛋白,两种不同的的方法给出了不同的预测结果,但部分预测结果大致相同。然而在多数情况下,Tmpred的预测结果比实际情况会稍微长一些或偏一些,基于综上考虑,认为该蛋白仅存在一个跨膜区,位于218240位氨基酸残基之间,这与疏水性的分析也基本吻合。4.3 绵羊MHC class蛋白质的功能结构
39、域分析结构域(StructuralDomain)是生物大分子中具有特异结构和独立功能的区域,特别指蛋白质中这样的区域,是介于二级和三级结构之间的另一种结构层次。所谓结构域是指蛋白质亚基结构中明显分开的紧密球状结构区域,又称为辖区。在球形蛋白中,结构域具有自己特定的四级结构,其功能部依赖于蛋白质分子中的其余部分,但是同一种蛋白质中不同结构域间常可通过不具二级结构的短序列连接起来。蛋白质分子中不同的结构域常由基因的不同外显子所编码。有些球形蛋白的一条肽链,或以共价键相连的两条或多条肽链在空间结构上可以区分为若干个球状的子结构,其中的每一个球状子结构就被称为一个结构域。图4.4 用InterProS
40、can对绵羊MHC class蛋白质的功能结构域分析结合Prosite数据库分析: hits by profiles: 1 hit (by 1 profile) on 1 sequenceHits by PS50835 IG_LIKE Ig-like domain profile :USERSEQ1(288 aa)111 - 191:score = 11.134PEVAVFP-KSSVILGIPNTLICQVDNiFPPVINITWFYNG-QFVAEGVAETTFYpKSDHSFLKFSYltFVPASEDFYDCRVEH-Predicted feature:DISULFID131187By similaritycondition: C-x*-Chits by patterns: 1 hit (by 1 pattern) on 1 sequenceHits by PS00290 IG_MHC Immunoglobulins and major histocompatibility complex proteins signa