1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,计算生物学概述,主讲人:刘振栋,Email:,liuzd2000,计算机科学与技术学院,课时安排,共计32学时,1-16周,理论课无实验,总成绩:平时占 10%、作业20%、考试70%,关于教材,计算生物学导论-图谱、序列和基因组,M.S.Waterman(美)著,黄国泰、王天明 译,科学出版社,2009年8月,第一讲 计算生物学概述,重点,1、计算生物学的发展历史,2、计算生物学的概念,3、计算生物学研究范畴,4、分
2、子生物学初步,难点:计算生物学的概念,1986 年诺贝尔奖获得者R.Dulbecco(杜尔贝科)提出人类基因组计划,测出人类全套基因组的30亿个DNA碱基对(3 X 10,9,bp)。,随着21世纪初人类基因组测序的完成,如何破译大量基因信息,获知生物分子的生物学功能就成为,后基因时代,的重要任务。,计算生物学是一门新兴交叉学科,1、学科的交叉更有利于学科的发展,2、计算生物学是计算机科学、数学、生物学相互融合渗透的交叉学科,1、计算生物学的产生,Introduction to Computational Biology,传统认为:数学、计算机科学、生物学等认定是独立的学科,但在,20世纪后半
3、叶,开始,这些学科间相互渗透,许多边缘学科的产生,各学科之间的分界已渐渐变得模糊,计算生物学的产生,数学与计算机科学逐渐形成,生物现象建模,、,模式识别,的工具,特别是在分析人类基因组拥有,大量数据的研究,中,计算机科学与数学成为必不可少的工具,计算生物学的产生,计算机科学与数学对生命科学的渗透使生物系统的,刻画越来越精细,生物系统的,数学建模,正在演变成生物实验中必不可少的组成部分,2004年,美国Science杂志推出了一期特辑,题为,“,科学下一个浪潮,生物数学,”,(计算生物学),英国皇家学会院士Lan Stewart教授预测:21世纪最令人兴奋、最有进展的科学领域之一必将是,“,生物
4、数学,”,(计算生物学),2、计算生物学的概念,计算生物学,是指开发和应用数据分析及理论的方法、把数学建模和计算机仿真技术用于生物学研究的一门学科,2、计算生物学的概念,计算生物学(computational,biology)是一门典型的,交叉学科,,涉及的学科包括生物学、计算机科学、数学、统计学、化学、物理学等。,3、计算生物学研究范畴,计算生物学最终是以,生命科学,中的,现象和规律,作为研究对象,以,解决生物学,问题为最终目标,计算机和数学仅仅是解决问题的工具和手段。,计算生物学主要侧重于利用,数学模型和计算机仿真技术,对生物学问题进行研究,计算生物学研究范畴,是,应用数学理论与计算机技术
5、研究生命科学中,数量性质,、,空间结构形式,、分析复杂的生物系统的,内在特性,,揭示在大量生物实验数据中所隐含的,生物信息。,DNA的双螺旋结构的发现,1953年4月25日,年仅,25,岁,沃森,(Watson),(美)与同在剑桥大学的合作伙伴弗朗西斯,克里克,(Crick),(英),一起,在英国自然(Nature)杂志上发表了一篇仅两页的论文,提出了,DNA的双螺旋结构,和,自我复制,机制。,这篇论文被普遍视作,分子生物学时代的开端。,DNA的双螺旋结构简图,4、分子生物学基本知识,(1)生物学最基本问题之一是,理解遗传,(2)遗传的基本单位是,基因,(3)基因是由,DNA,构成(1944
6、年),(4)生物大分子有三种类型:DNA、RNA,和蛋白质,DNA是遗传物质的基础,1、DNA-,脱氧核糖核酸,:,核苷酸,的小分子生成的聚合物,(,核苷酸,是,核酸,最小的活性分子,),2、核苷酸有四种,(DNA),:,腺嘌呤,脱氧核糖核苷酸(,A,)、,胞嘧啶,核苷酸(,C,)、,鸟嘌呤,核苷酸(,G,)、,胸腺嘧啶,核苷酸,(T),DNA是遗传物质的基础,DNA分子两条链之间的距离是一定的,为2nm,嘌呤和嘧啶的分子结构不同,嘌呤是,双环,化合物,嘧啶是,单环,化合物,DNA是遗传物质的基础,若两条链上对应的碱基都是嘌呤环,则所占的,空间太大,;若两条链上相对应的碱基都是嘧啶环,则相聚,
7、距离太远,,,不能形成氢键。,只能是一个嘌呤与一个嘧啶配成碱基对,其长才为,2nm,RNA-核糖核酸,RNA-核糖核酸,腺嘌呤(A)、,胞嘧啶(C),、鸟嘌呤(G)、,尿嘧啶(U),RNA存在时间很短,一般小于30分钟,有的仅存在几秒钟,嘌呤和嘧啶,嘌呤是双环、嘧啶是单环,嘌呤只能与嘧啶配对,嘌呤之间或嘧啶之间不能配对,A-T配对通过,2个氢键,链接;G-C配对通过,3个氢键,链接,碱基配对,DNA:A-T(,配对,),T-A,G-C,C-G,RNA:A-G(,配对,),G-A,G-C,C-G,G-U(错配),U-G(错配),蛋白质、氨基酸、核酸与核苷酸,氨基酸,是构成,蛋白质,的基本单位,氨
8、基酸,通过脱水缩合成,肽,,经过折叠加工等过程形成,蛋白质,3个,核酸,确定一个,氨基酸,核苷酸,是,核酸,的基本单位,1200个左右碱基,能确定一个,基因,RNA基本知识,RNA核糖核酸,RNA是单链结构,转录是在原核和真核细胞中以DNA为模板合成RNA的过程,RNA基本知识,在原核和真核生物中,DNA转录RNA过程是相似的。,DNA变性,RNA聚合酶结合在单链DNA上以53方向合成RNA分子。,双链中只有一条链作为转录模板,合成单链RNA分子。,RNA功能的多样性,1、控制蛋白质合成,2、作用于RNA转录后加工与修饰,3、基因表达与细胞功能调节,4、生物催化与其他细胞抽象功能,5、遗传信息
9、加工与进化,病毒RNA,病毒RNA是上述功能RNA的游离成分,病毒只含DNA或只含RNA,未见两者兼有病毒,RNA的分类,mRNA(信使RNA):,是蛋白质合成(翻译)过程中的,模版,,蛋白质 分子中 氨基酸的排列顺序,就是由mRNA 上,每3个相邻,的核苷酸形成的密码子的排列顺序决定的;,tRNA(转运RNA):,是在蛋白质的合成过程中 转运氨基酸,为蛋白质的合成,提供原料,;并可准确识别 其所转运的氨基酸在mRNA 上的密码子;,RNA的分类,rRNA(装配RNA):,约占RNA总量82%,主要是和一些蛋白质 组装成 一类重要的细胞器,核糖体,,而核糖体 就是蛋白质合成的场所,“,装配车间
10、复制机制是现代遗传学的基础,我们提出的特定的配对直接蕴涵遗传物质可能的复制机制,-James Watson&,Francis Crick,中心 定理,一旦,“,信息,”,传入,蛋白,它就不能出来。信息由一个,核酸传给另一个核酸,,也可能从核酸传给蛋白。,但是,,不可能由蛋白质传给核酸。,此外,信息意味着,准确确定的序列,,或者是,核酸中的基序列,,或者是蛋白质中的,氨基酸序列,。,-Francis Crick,中心定理模式,DNA RNA 蛋白质,计算生物学基本知识,限制图谱,多重图谱,求解DDP的算法,克隆与克隆文库,基因组图谱,序列装配,计算生物学基本知识,数据库与快速装配,动态规划、两个序列比对,多重序列比对,RNA二级结构、三级结构,树和序列,思考题和作业,1、什么是计算生物学?,2、DNA和RNA的四种碱基各是什么?,3、你是如何理解计算生物学的?,






