ImageVerifierCode 换一换
格式:PPT , 页数:47 ,大小:666.50KB ,
资源ID:12264128      下载积分:12 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/12264128.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(生物信息学课堂.ppt)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

生物信息学课堂.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,产生,(,分子生物学研究中获得的大量数据,),收集,(,数据库,),维护,(,产生高质量数据,),传播,(,互联网,搜索引擎,),分析,(,主要研究内容,),应用,(,多个领域,),什么是生物信息学?,主要由数据库、计算机网络和应用软件三大部分构成,定义,收集、维护、传播、分析以及利用在分子生物学研究中获得的大量数据,。生物信息学(,bioinformatics,)是生物学与计算机科学以及应用数学等学科相互,交叉,而形成

2、的一门新兴学科。它通过对生物学,实验数据的获取、加工、存储、检索与分析,,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动力来自,分子生物学,,生物信息学的研究主要集中于,核苷酸和氨基酸序列,的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。现代分子生物学的发展,特别是,人基因组计划,的实施,使生物学家所面对的数据不再是实验记录本上或文献上的几行简单数字,而是公共数据库中数以千兆计的记录。,基因组信息,是生物信息中最基本的表

3、达形式,并且基因组信息量在生物信息量中占有极大的比重,但是,生物信息并不仅限于基因组信息,生物信息学也不等于是基因组信息学。广义的说,生物信息不仅包括基因组信息,如基因的,DNA,序列、染色体定位,也包括,基因产物,(蛋白质或,RNA,),的结构和功能,及各生物种间的,进化关系,等其他信息资源。,定义,生物信息学,发展过程,早在,年,,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会”上,便产生了,生物信息学的概念,。,20,世纪,50,年代末,数学模型、统计学方法和计算机处理宏观生物学数据。,数量分类学,、,数学生态,。,年,这一学科被正式命名为“生物信息学”(,bioinform

4、atics,)。此后,其内涵随着研究的深入和现实需要的变化而几经更迭。,应用于,分子生物学,:分子生物学数据库、蛋白质结构分析与预测。,年,在美国人类基因组计划第一个五年总结报告中,给出了一个,较为完整的生物信息学定义,人类基因组计划,(,human genome project,HGP,):,1990,年启动,,10,年时间完成草图(,3x10e9,个碱基对,并对,30,000,多个基因进行了注释)。,越来越多的,微生物和其他模式生物也完成了全基因组测序,工作。,生物信息学的,发展过程,大致经历了,3,个阶段,:,前基因组,时代,-,生物数据库的建立、检索工具的开发、,DNA,和蛋白质序列分

5、析、全局和局部的序列对位排列;,基因组,时代,-,基因寻找和识别、网络数据库系统的建立、交互界面的开发;,后基因组,时代,-,大规模基因组分析、蛋白质组分析。,生物信息学的,重要性,生物信息学不仅是一门,学科,,更是一种重要的,研究开发工具,。,从,科学的角度,来讲,生物信息学是一门研究生物和生物相关系统中信息内容与信息流向的综合系统科学。只有通过生物信息学的计算处理,人们才能从众多分散的生物学观测数据中获得对生命运行机制的系统理解。,从,工具的角度,来讲,生物信息学几乎是今后所有生物(医药)研究开发所必需的工具。只有根据生物信息学对大量数据资料进行分析后,人们才能选择该领域正确的研发方向。,

6、生物信息学不仅具有重大的,科学意义,,而且具有巨大的,经济效益,。它的许多研究成果可以较快地产业化,成为价值很高的产品。,生物信息学的基本方法:,建立,生物数据库,:核苷酸顺序数据库,(GENBANK),、,Protein Data Bank(PDB),、氨基酸顺序数据库,(SWISS-PRO),、酵母基因组数据库,(YEASTS),、美国种质保藏中心,(ATCC),、美国专利局数据库,(USPO),。,数据库,检索,:,Blast,序列分析,:序列对位排列、同源比较、进化分析。,统计模型,:如,隐马尔可夫模型,(hidden Markov model,HMM)-,基因识别、药物设计。,最大似

7、然模型,(maximun likelihood model,ML),、,最大简约法,(Maximun Parsimony,MP)-,分子进化分析。,算法,:如自动,序列拼接,、,外显子预测,和,同源比较,、,遗传算法,、,人工神经网络,(artificial neural network),。,生物信息学的,研究内容,对,基因组研究相关生物信息,的获取、加工、存储、分配、分析和解释:,一是对海量数据的收集、整理与服务,即,管理,好这些数据;,二是从中发现新的规律,也就是,使用,好这些数据。,具体地说,生物信息学是把基因组(脱氧核糖核酸)序列信息分析作为源头,找到基因组序列中代表蛋白质和(核糖核

8、酸)基因的,编码区,。同时,阐明基因组中大量存在的,非编码区,的信息实质,破译,隐藏在序列中的遗传语言,规律。在此基础上,归纳、整理与基因组,遗传信息释放,及其,调控,相关的,转录谱,和,蛋白质谱,的数据,从而认识,代谢、发育、分化、进化,等的规律。,生物信息学的,研究内容,获取人和各种生物的,完整基因组,基因组注释:,新基因、单核苷酸多态,(SNP).,基因组中非编码区信息结构分析,在基因组水平研究生物进化,完整基因组的比较研究,从功能基因组到系统生物学,蛋白质结构模拟与药物设计,生物信息学的,研究内容,获取人和各种生物的,完整基因组,基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码

9、有亿个碱基,而现在的测序仪每个反应只能读取几百到上千个碱基。这样,要得到人的全部遗传密码,首先要把人的基因组打碎,测完一个个小段的序列后再把它们重新拼接起来。而基因组大规模测序的每一个环节,都同信息分析紧密相关,每一步都紧密依赖于生物信息学的软件和数据库。,生物信息学的,研究内容,实验数据,-,转换为,-,计算机信息,高度自动化,的实验数据的获得、加工和整理如何将实验室中得到的,生物学信息,转化为计算机能够处理的,数字信息,,是生物信息学的一个重要课题。这种转化大量地体现在各种,自动化分子生物学仪器,应用上,如,DNA,测序仪,,PCR,仪等。这类仪器将实验所得的物理化学信号转化为数字信息,并

10、对其作简单分析,再将分析结果用于实验条件的控制,完成高度自动化的实验过程。从事,大规模,EST,测序,和,DNA,物理图谱构建,的实验室都已建立起,高度自动化的机器人系统,来完成大部分的实验工作。,数据管理系统,伴随着实验过程的高度自动化甚至工厂化,从事大规模分子生物学项目的实验室,,每天需要存储的数据,可以轻易地超过几千兆字节。这样大的数据量必须用,专门的实验室数据管理系统,进行处理,以自动完成包括实验进程和数据的记录,常规数据分析,数据质量检测和问题的自动查找,常规的数据说明和数据输人数据库在内的各项工作。由于不同实验室需处理的数据类型各不相同,很多实验室都是各自,开发自己的系统,。随着,

11、测序逐渐成为实验室的常规工作,,对这种系统的需求会越来越大。,生物信息学的,研究内容,生物信息学的,研究内容,序列片段的拼接,DNA,自动测序仪,每个反应只能测序,500bP,左右。如何将这些,序列片段拼接成完整的,DNA,顺序,就成为接下来的一个重要工作。传统的测序技术通常将克隆进行亚克隆并对亚克隆进行排序。这些工作需要大量的人力物力。现在生物信息学提供了,自动而高速地拼接序列的算法,,即根据,Lander-Waterman,模型利用鸟枪法进行测序,再将大量随机测序的片段用计算机进行自动拼接。这种技术不仅避免了亚克隆排序所需的大量繁琐的工作,还使序列具有一定的冗余性以保证序列中每个碱基的准确

12、性。序列拼接算法的进一步发展,需要在以下方面进行改进:,1,将已知的基因组知识应用与拼接算法,以进一步提高拼接真核基因组的有效性。,2,自动处理自动测序造成的差错,特别是对差错倾向的,EST,顺序更是如此。,目前最为常见的基因测序方法是鸟枪法(,Shotgun method,)。鸟枪法测序的结果使我们只能得到大量的随机的基因片段,更廉价和更高效的新一代测序技术,基因片段越来越短,基本上是,25-30,个碱基对的片段,与以前的长达几百几千的基因拼接在算法上就有了差异性。为了能够在超短序列上拼接出完整的基因序列,就必须加大测序的覆盖率,这样将会导致庞大的初始序列文件,通常达到了,GB,级别。最新的

13、序列拼接软件,ALLPATHS V3.0,需要至少,32GB,的内存,这种昂贵的代价是一般机器无法提供的。,超短基因片段导致了大量的,overlap,(重叠区域),这将是传统的拼接算法所无法承受的计算量。还有大量的,repeat,(重复区域)也将使传统的算法更加的不可靠。同时初始文件的庞大导致传统的内存算法已经不再适用。,生物信息学的,研究内容,序列片段的拼接,基因区域的预测(基因注释),在完成序列的拼接后,我们得到的是很长的,DNA,序列,甚至可能是整个基因组的序列。这些序列中包含着许多未知的基因,下一步就是,将基因区域从这些长序列中找出来,。,所谓基因区域的预测,一般是指预测,DNA,顺序

14、中编码蛋白质的部分,即,外显子部分,。不过目前基因区域的预测已从单纯外显子预测发展到,整个基因结构的预测,。这些预测综合各种外显子预测的算法和人们对,基因结构信号,(如,TATA box,和加尾信号)的认识,预测出可能的完整基因。,生物信息学的,研究内容,基因组注释,有了完整基因组,人类对自身的认识就更为细致、更为精确。比如:发现在我们的基因组中真正编码蛋白质(称为外显子)等的部分很少,只占,1,1,;外显子与外显子之间的区域(称为内含子)占了,24,;而基因与基因之间的间隔序列却占了,75,,也就是说在人类基因组中不编码蛋白质的区域占了绝大部分。发现人类编码蛋白的基因较之其它生物体的基因更为

15、复杂,有更为丰富的剪接方式。发现基因组中片段重复现象很普遍。发现人的第,13,号染色体比较稳定,而男性的第,12,号染色体和女性的第,16,号染色体是易变的,等等。,生物信息学的,研究内容,发现新基因,发现新基因是当前国际上基因组研究的热点,使用生物信息学的方法是发现新基因的重要手段。比如:啤酒酵母完整基因组所包含的约,6000,个基因,大约,60,是通过信息分析得到的。,生物信息学的,研究内容,Example:,Take a protein sequence and use it as a query in a blastp search of the nr database at NCBI

16、If there is a match with less than 100%identity,If there is a match with100%identity,but to a different species,发现新基因,-,(,1,)基因的电脑克隆,利用,E ST,数据库,发现新基因也被称为基因的电脑克隆。,E ST,序列是基因表达的短,c DNA,序列,它们携带着完整基因的某些片段的信息。到,2001,年,10,月,,GenBank,的,EST,数据库中人类,E ST,序列已超过,380,万条,它大约覆盖了人类基因的,90,以上。我国早在,1996,年就开始了通过电脑克隆寻

17、找新基因的研究。它的原理非常简单,就是找到属于同一基因的所有,E ST,片段,再把它们连接起来。由于,E ST,序列是全世界很多实验室随机产生的,所以属于同一基因的很多,E ST,序列间必然有大量重复小片段,利用这些小片段作为标志就可以把不同的,E ST,连起来,直到发现了它们的全长,这样我们就可以说通过电脑克隆找到了一个基因。如果这个基因以前未曾发现过,那我们就找到了一个新基因。但是进行电脑克隆程序设计是复杂的,计算量是巨大的。,生物信息学的研究内容,发现新基因,-,(,2,)从基因组,DNA,序列中预测新基因,从基因组序列预测新基因,本质上是把基因组上编码蛋白质的区域和非编码蛋白质的区域区

18、分开来。对于理论方法来讲就是要找到在编码区和非编码区哪些数学、物理学特征是不一样的。将这些序列与已知基因数据库进行比较,就可以发现新的基因了。,发现了新基因就会使我们对生命活动的认识加深一步。,1999,年,12,月,2,日,自然,杂志,人的第,22,号染色体数据已鉴定出,679,个基因,其中,55,的基因是未知的。有,35,种疾病与该染色体突变相关,像免疫系统疾病、先天性心脏病和精神分裂症。但是,要将人类的所有基因及其相应的蛋白质以及与它们相关的功能完整而正确地整合到一个索引中,依然是一个十分重要、十分艰巨的任务。,生物信息学的研究内容,发现单核苷酸多态(,S NP,),有的人吸烟喝酒却长寿

19、也有人自幼就病痛缠身;同一种治疗肿瘤的药物对一些人非常有效,对另一些人则完全无效。这是为什么?答案有可能是他们基因组中存在的差异。这种差异很多表现为单个碱基上的变异,也就是单核苷酸的多态性(,SNP,)。,现在普遍认为,SNP,研究是人类基因组计划走向应用的重要步骤。这主要是因为,SNP,将提供一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。,SNP,在基因组中分布相当广泛,近来的研究表明在人类基因组中每,300,碱基对就出现一次。大量存在的,SNP,位点,使人们有机会发现与各种疾病,包括肿瘤相关的基因组突变;从实验操作来看,通过,SNP,发

20、现疾病相关基因突变要比通过家系来得容易;有些,SNP,并不直接导致疾病基因的表达,但由于它与某些疾病基因相邻,而成为重要的标记。,SNP,在基础研究中也发挥了巨大的作用。,生物信息学的,研究内容,基因组中非编码区信息结构分析,近年来的研究表明,在细菌这样的微生物中,非编码蛋白质的区域只占整个基因组序列的,10,到,20,。随着生物由低等到高等,非编码区越来越多,在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分。这表明:这些非编码序列必定具有重要的生物功能。普遍的认识是,它们与基因的表达调控有关。,对人类基因组来说,迄今为止,人们真正掌握规律的只有,D NA,上的编码蛋白质的区域(基

21、因),最新资料说明这部分序列只占基因组的,1,1,。仅占人类基因组,1,1,的编码区的相关研究已经缔造了数十名诺贝尔奖获得者,,98,非编码区蕴含的成果数量将是十分可观的,因此寻找这些区域的编码特征、信息调节与表达规律是未来相当长时间内的热点课题,是取得重要成果的源泉。,生物信息学的,研究内容,基因功能预测,序列同源比较;,寻找蛋白质家族保守顺序;,蛋白质结构的预测。,生物信息学的,研究内容,基因功能预测,mRNA,芯片分析,多伦多大学的,Tim Hughes,和同事利用一种先前只用于简单生物体(如酵母和线虫)的技术对小鼠的基因组进行了研究。在酵母和其它简单有机体中,,具有相同功能的基因的表达

22、往往具有同步调节的特征,。在这些有机体中,确定已知和未知基因的相关联的表达能够帮助预测一个新基因的功能。一直以来人们认为这种技术无法用在哺乳动物上,同一个组织中表达的基因最有可能具有一种功能上的联系并因此产生了组织特异性。,在新的研究中,,Hughes,和同事创造出了含有在,55,种组织中表达的,40000,个已知的小鼠,mRNA,的芯片并对其进行分析。分析结果表明来自同一个,GO-BP,(,Gene Ontology Biological Process,)类别的基因在转录水平上被协同调节而不取决于它们在何种组织中表达。,生物信息学的,研究内容,分子进化的研究:,通过上述种种方法我们可以预测

23、出一个新基因的可能具有的功能。然而预测新基因只是生物信息学研究的一个方面,这门学科的根本目标是,探究隐藏在生物数据后面的生物学知识,。对于基因组研究来说,一个重要的研究方向就是,分子序列的进化,。通过比较不同生物基因组中各种结构成分的异同,可以大大加深我们对生物进化的认识。这种研究已逐步形成一个称为比较基因组学的新学科。从各种基因结构与成分的进化,密码子使用的进化,到,进化树的构建,,各种理论上和实验上的课题都等待生物信息学家的研究。,生物信息学的,研究内容,分子进化的研究:,科学家们对处于不同进化阶段物种的基因组结构和功能进行比较分析,企图最终弄清人类,10,万个基因的起源和进化、结构和功能

24、的演变,发现其间的亲缘关系,,像元素周期表那样,把基 因和蛋白质分类、排序,得到生物学的周期表,根据基因在进化树上的位置,或一小段核苷 酸序列,或蛋白质的基序、模块、折叠等,即可预测其来源、结构、功能等。这项浩大的工 程显然需要大量生物信息学家长期不懈努力才能完成。,生物信息学的,研究内容,在基因组水平研究生物进化,随着基因组序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈。首先发现同一种群基于不同分子序列所重构出的进化树可能不同。同时,对“垂直进化”和“水平演化”之间关系的讨论正逐渐引起人们的重视。也就是近年来发现了,基因,的“,横向迁移,现象”。即:基因可以在同时存在的种群间迁移

25、其结果虽可导致序列差异,但这种差异与进化无关。甚至,对人类基因组的分析发现,有几十个人的基因只与细菌基因相似,而在果蝇、线虫中都不存在。如果以人的这些基因序列来研究进化将会得到荒谬的结论。所以在当前的分子进化研究中必须选择垂直进化的分子作为样本。特别是:在分子进化分析中,“相似性”和“同源性”是两个不同的概念。相似性只反映两者类似,并不包含任何与进化相关的暗示。同源性则是与共同祖先相关的相似性。,生物信息学的,研究内容,完整基因组的比较研究,在后基因组时代,完整基因组数据越来越多,有了这些资料人们就能对若干重大生物学问题进行分析研究,如:生命是从哪里起源的?生命是如何进化的?遗传密码是如何起

26、源的?估计最小独立生活的生物体至少需要多少基因?这些基因是如何使生物体活起来的?等等。,这些重大的问题估计只有在基因组水平上才能回答,。举例来说,鼠和人的基因组大小相似,都含有约,30,亿碱基对,基因的数目也类似,且大部同源。可是鼠和人差异却如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为,0,1,;人猿间差别约为,1,。但他们表型间的差异十分显著。因此,这种差异不仅应从基因、,D NA,序列找原因,也应考虑到整个基因组、考虑染色体组织上的差异。这一工作开创了比较基因组学。,生物信息学的,研究内容,完整基因组的比较研究,科学家们发现:,全部基因可以,按照功能和系统发生,分为

27、若干类,,其中包括与复制、转录、翻译、分子伴娘、能量产生、离子转运、各种代谢相关的基因。当我们比较鼠和人的基因组就会发现,尽管两者基因组大小和基因数目类似,但,基因组的组织却差别很大,。例如存在于鼠,1,号染色体上的基因已分布到人的,1,、,2,、,5,、,6,、,8,、,13,、,18,号,7,个染色体上了。研究表明在同一界中,某些核糖体蛋白排列顺序的差异能反映出物种间的亲缘关系,亲缘关系越近,基因排列顺序越接近。这样就可以通过比较基因的排列顺序来研究物种间的系统发育关系。,生物信息学的,研究内容,从功能基因组到系统生物学,在,不同的组织中表达基因,的数目差别是很大的,脑中基因表达的数目最多

28、约有,3,4,万个转录子,有的组织中只有几十或几百个基因表达。同一组织在不同的个体生长发育阶段,表达基因的种类、数量也是不同的,有些基因是在幼年时期表达的,有些是中年阶段表达的,有些要到老年时期才表达。我们不仅需要了解基因的序列,还要了解基因的功能,也就是要了解在不同的时间、不同的组织中,基因的表达谱,。这就是通常所说的功能基因组研究。,为了得到基因的表达谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是在核酸层次上的,基因芯片,(或称,D NA,芯片)技术和在蛋白质层次上的,大规模蛋白质分离和序列鉴定,技术,也称蛋白质组技术。由于芯片上样品点的密度很大,可以达到每片几十万,因此表达谱

29、数据挖掘和知识发现就成了该研究成功与否的关键。无论是生物芯片还是蛋白质组技术的发展,都更强烈地依赖于生物信息学的理论、技术与数据库。下一步,功能基因组研究将朝着复杂系统的方向发展,即:探讨生物系统中各部分、各层次的相互作用,从而进入系统生物学的领域。,生物信息学的,研究内容,蛋白质结构模拟与药物设计,蛋白的空间结构模拟和药物设计已有二三十年的历史。随着人类基因组研究的飞速发展,这一领域面临着新的态势,即:在找到人类,34,万个基因的碱基序列并确定它们表达产物的氨基酸顺序后,如何预测这些蛋白的空间结构,进而实现针对性的药物设计。,(蛋白质的功能和它们的空间结构密切相关),生物信息学的,研究内容,

30、生物信息学的应用:,基因组分析,基因芯片,药物开发,其他,生物信息学的,应用,基因组(测序组装):,基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码有亿个碱基,而现在的测序仪每个反应只能读取几百到上千个碱基。这样,要得到人的全部遗传密码,首先要把人的基因组打碎,测完一个个小段的序列后再把它们重新拼接起来。而基因组大规模测序的每一个环节,都同信息分析紧密相关,每一步都紧密依赖于生物信息学的软件和数据库。,基因组分析,将已知的,序列,与,功能,联系在一起、从基于常规克隆的基因分类转向基于序列及功能的分析的,基因分类,、从单个基因致病机制的研究转向多个,基因致病机制,的研究、从组织与组织之间

31、的比较来研究,功能基因组,和,蛋白质组,、从基因组和蛋白质组的结构与功能关系来,预测三级结构和功能,,并从三级结构和功能反推可能的序列、通过比较不同生物物种的基因组来进行分子进化研究。,生物信息学的,应用,生物信息学的,应用,蛋白质组:,基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行。由于基因芯片技术只能反映从基因组到的转录水平上的表达情况,而从到蛋白质还有许多中间环节的影响,这样,仅凭基因芯片技术人们还不能最终掌握生物功能的具体执行者,蛋白质的整体表达状况。因此,近年在发展基因芯片的同时,人们还发展了一套研究基因组所有蛋白质产物表达情况的技术,蛋白质组研究技术,包括二维凝胶电泳技

32、术和质谱测序技术。然而,最重要的是,如何运用生物信息学的方法去分析获得的海量数据,,从中还原出生命运转和调控的整体系统的分子机制。,生物信息学的应用:,1.,基因组分析,人类基因组计划,(HGP),:,人类基因组计划(,Human Genome Project,简称,HGP,)是美国科学家在,1985,年率先提出的,其目的在于阐明人类基因组,DNA3109,核苷酸序列,破译人类全部遗传信息,,HGP,于,1990,年正式启动。随着,HGP,产生的数据爆炸,一门新兴学科,-,生物信息学,应运而生。生物信息学是以计算机为主要工具,开发各种软件,对日益增长的,DNA,和蛋白质的序列和结构等相关信息进

33、行收集、储存、发行、提取、加工、分析和研究,同时建立理论模型,指导实验研究,它由数据库、计算机网络和应用软件三大部分构成,,在基因组计划中发挥不可替代的作用,。,生物信息学的应用:,1.,基因组分析,人类基因组计划,(HGP),:,HGP,目的之一,就是,找到人类基因组中的所有基因,。除,功能克隆,和,定位克隆,策略之外,生物信息学为分子生物学家提供了一条,寻找和研究新基因,的新思路,即从高度自动化的实验出发,经过数据的获取与处理、序列片段的拼接、可能基因的寻找、基因功能的预测一直到基因的分子进化研究。这个过程的每一个环节,都是生物信息学研究的重要内容。,生物信息学的应用:,1.,基因组分析,

34、人类基因组计划,(HGP),HGP,的目标大致如下,:,(1),建立一高分辨力的人体基因组图谱。(,2,)建立某 些选择性模型机体(如大肠杆菌、线虫等)的,DNA,和人体染色体的基因物质图谱。(,3,)测定这些人体和选择性机体的,DNA,序列,以俾更好了解正常基因调控、基因遗传性疾病及其演化过程。(,4,)建立软件和数据库以提高应用和判断这些基因信息的效能。(,5,)发明有关的创新技术。(,6,)建立,HGP,的伦理学、法律和社会参与的程序。,生物信息学的应用:,2.,基因芯片,基因微阵列或,DNA,芯片,(gene microarray,或,DNA chips),的原理是将,几万个寡核苷酸或

35、DNA,作为探针,,密集排列于硅片等固相支持物上,将研究样品标记后与微点阵,杂交,并进行检测。根据杂交信号强弱及探针位置和序列,可以,确定靶,DNA,的表达情况,以及,突变和多态性,存在与否。,生物信息学的应用:,3.,药物开发,基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来。要了解它们的功能,只有氨基酸序列是远远不够的。得到这些新蛋白的完整、精确和动态的三维结构,是摆在人们面前的紧迫任务。,生物信息学的应用:,3.,药物开发,近年,随着结构生物学的发展,相当数量的蛋白质以及一些核酸、多糖的三维结构获得了精确的测定。根据生物大分子结构的知识,有针对性地设计药物成为热点。,生物信息学

36、的应用:,4.,其他:,疾病相关的基因信息及相关算法和软件开发,建立与动、植物良种繁育相关的基因组数据库,发展分子标记辅助育种技术,研究与发展药物设计软件和基于生物信息的分子生物学技术,寄生虫与流行病学研究、,农作物基因组分析、,神经科学。,基因组信息学的首要任务,基因组信息学的首要任务之一就是,发现新的基因,和,新的功能,,如人基因组含有,30,亿对核苷酸,,其中大约有,10,万个,决定各种性状和功能的,基因,。这些基因的定位和分离是当前科学家、医生和企业家们最感兴趣的。连一个,小耗子的肥胖基因,都能卖上亿的美元。过去几十年中,科学家运用经典的遗传学分析方法如功能克隆、定位克隆等方法,总共定

37、位了大约,2000,个基因。几年前,美、法、英、加、日等国的,104,位科学家,联合起来利用当时数据库中的,45,万个,DVA,小片段,(,称,EST,,表达序列标签,),和其它有关信息,在很短时间内,(1996),就把,16354,个人类基因进行了定位。,生物信息学的重要研究课题,1.,大规模基因组测序中的信息分析,2.,新基因和新,SNP,的发现与鉴定,3.,非编码区信息结构分析,4.,遗传密码的起源和生物进化,5.,完整基因组的比较研究,6.,大规模基因功能表达谱的分析,7.,生物大分子的结构模拟与药物设计,8.,生物信息学分析方法的研究,9.,建立国家生物医学数据库与服务系统,10.,

38、应用与发展研究,生物信息学的商业价值,生物信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷,成立各种生物信息机构,,建立自立的,生物信息集成系统,,研制这方面的,软件,,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,,缩短药物开发周期,,抢注,基因专利,,获取更大利润。我国如不加大资金投入力度,将来可能会花更多的钱去购买别人的软件,使用专利基因或购买新的药物。所幸,我国也开始重视这一学科:南、北方人类基因组中心的相继建成,北大生物城的破土动工等,标志着我国对生物信息学的重视。我们有理由相信,我国的生物信息学在,21,世纪会有巨大的飞跃。,通过学习逐渐掌握以下内容:,搜索网上生物信息学资源,建立自己的生物信息学数据库和网页,运用,Blast,等工具检索数据库,多序列对位排列,构建系统发育树,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服