1、华南农业大学生命科学学院 小熊猫制作 分子生物学The Coming of Wisdom With TimeThough leaves are many, the root is oneThrough all the lying days of my youthI swayed my leaves and flowers in the sun;Now I may wither into the truth.- William Butler Yeats (1916)47*绪论进化论与细胞学说结合-现代生物学1859 ,物种起源-Charles Darwin “物竞天择,适者生存” 物种发生变异
2、将生物学归于自然科学的行列19世纪中叶,细胞学说动植物的基本单元是细胞细胞成为生物学研究的首要对象分子生物学在遗传学和生物化学的基础上诞生和发展1857-1864,Gregor Mendel奥地利的修道士,1865发表植物杂交实验 ,1884去世,到1900年他的理论才被重新发现。遗传学的奠基人,对性状遗传产生了理性认识。1910-1915, T.H.Morgan创立了遗传的染色体理论以果蝇为材料。发现了遗传性状的连锁定律。将代表某一特定性状的基因,同某一特定的染色体联系起来。对核酸的化学研究1869年,瑞典的F.Miescher提取了细胞核中的中复合物,不溶于稀酸,可溶于稀碱,含磷的酸性物质
3、,但由于在技术上未能进一步提纯,受到嘲讽,而最终放弃。核酸的化学研究在这之后的50年停滞,直到Avery的研究才有了突破。 18851900年间,Kossel、Johnew、Levine证实核酸最简单的单体结构是碱基-核糖-磷酸构成的核苷酸,有四种类型的碱基A T(U) C G。1929年又确定了核酸有两种,一种是脱氧核糖核酸(DNA),另一种是核糖核酸(RNA)。1928年,Griffith 肺炎双球菌的转化英国人,为揭示DNA是遗传物质奠定了基础第一个以令人信服的实验证明-基因的化学本质是DNA1935-1944年,Oswald Avery 以肺炎链球菌为材料证明,DNA分子是遗传信息的载
4、体。诱导肺炎球菌类型转化的物质 的化学特性研究 19441952年,Hershey和Chase 噬菌体感染实验获1969年诺贝尔奖1956年,A.Gierer和G.Schraman发现 烟草花叶病毒(tobacco mosaic virus,TMV),其遗传物质是RNA。1957年,美国的Heinz Fraenkel-Conrat和B.Singre用重建实验证实了这一结论。分子生物学的概念广义:研究核酸、蛋白质等所有生物大分子的结构、功能及其相互作用的规律,从分子水平上揭示生命现象的本质及生物学规律的科学。狭义:基因分子生物学/核酸分子生物学。在分子水平上研究基因的结构和功能。主要研究基因的复
5、制、转录、表达和调节控制等过程。*遗传物质的分子本质 朊病毒1982年加州大学Stanley B.Prusiner 提出这种病由蛋白质侵染颗粒proteinaceous infectious particle(朊病毒)造成的;1991年Science提出唯蛋白学说,1997年获诺贝尔奖), 核酸病毒的繁殖一向是核酸作为遗传物质的重要证据,而朊病毒是不含核酸的蛋白质 病原体 朊病毒蛋白颗粒进入宿主细胞的“自我复制”繁殖,表明生物大分子的构型也是一种 可以传递的信息。 实验证明朊病毒的繁殖是将自身PrPsc的分子结构信息通过与正常膜蛋白PrPc的结 合,在分子伴侣的辅助下,传递给PrPc并将其转化
6、为PrPsc 信息大分子的构型也是一种信息DNA双螺旋二级结构的多态性B型:正常生理条件,或92%相对湿度,一圈10个碱基,大沟宽,小沟窄。BDNA是细胞内DNA的主要存在形式。A型: 75%相对湿度或低温,一圈11个碱基,相对B型来说,大沟窄而深,小沟宽而浅。RNA局部双螺旋区均呈A构象,RNA-DNA杂交分子呈A构象。Z型:左手螺旋,结构比B型细,只有一个沟槽。Z型构象与基因的表达调控有关。a.增色效应(hyperchromic shift)双链DNA缓慢加热,其溶液对紫外光的吸收值增加,该现象称。DNA溶液(50mg/ml)在260nm的吸光值: 双链DNA A260=1.00 单链DN
7、A A2601.37 自由碱基 A2601.6b.熔链温度(melting temperature,Tm)DNA加热变性时,其紫外吸收光密度值达到最大值的一半时的温度,称熔链温度。c. 影响Tm的因素-破坏DNA双螺旋的条件:DNA的均一性( Tm范围)DNA的GC含量 (Tm0.41 x X% 69.3)溶液的pH溶液的离子强度(离子强度高, Tm高)中和磷酸骨架的负电性。有机溶剂:尿素、甲酰胺、甲醇、甲醛(使Tm下降)一切减弱氢键, 碱基堆积力的因素均将使Tm 值降低影响复性速度的因素a DNA分子的复杂性(复杂性高,复性慢) 表示核酸分子非重复碱基对的数目。b DNA浓度(浓度高,复性快
8、)c DNA片段的大小(片段越大,复性慢)d 温度的影响 Tm - 25 (60-65) e 溶液的离子强度 消除polydNt 间的静电斥力C0t值: 复性单链DNA起始浓度和经过的复性时间的乘积。 C0t曲线:当DNA初始浓度、温度、离子强度、DNA片段大小确定后,以C/C0对logC0t 作图,得C0t曲线。C0t1/2:复性程度达到一半时的 C0t值。从C0t曲线上可以求得C0t1/2。 C0t1/2直接反应DNA顺序的复杂性。COt1/2 有什么用处?(1) 通过COt1/2值可测原核生物基因组的大小; 已知大肠杆菌的基因组为4.2x106bp, COt1/2 = 9M.Sec CO
9、t1/2 (任何基因组DNA)/9M.sec = 任何基因组大小/4.2X106bp(2)原核生物基因组大小不同,复性曲线也不同;(3) 可用以区分真核生物和原核生物基因组。*基因,基因组和基因组学转座因子:基因组上不必借助于同源序列就可以移动的DNA片段,它们可以直接从基因组内的一个位点移到另一个位点。需要转座酶的帮助Pseudogenes假基因:核苷酸序列与相应的正常功能基因基本相同,但不能合成出功能蛋白,这些失活的基因称为假基因。 C值 (C-value): 一个单倍体基因组的DNA的总量,通常称为该物种的C值(大C值)。小c值: 编码结构基因DNA的核苷酸数.拿每一类生物中的最小基因组
10、做比较,每类生物的最小基因组的大小基本上对应于生物在进化上所出地位的高低,进化地位高,形态结构复杂程度高的一类生物,其最小的基因组也较大。C值矛盾:生物形态学的复杂性与C值大小不一致,。1 与预期的编码蛋白质的基因数量相比,基因组DNA的含量过多.2 一些物种之间的复杂性变化范围并不大,但C值却有很大的变化. N值矛盾: 生物体的复杂性与基因数之间并不总是正相关。K值矛盾: 生物体的复杂性与染色体数之间并不总是正相关。心脏叶瓶尔小草染色体数1260重叠基因1977年Sanger首先发现重叠基因他对单链环状的噬菌体FX174进行了测序。 5386Nt 11 基因, 3个转录单位,由3个启动子(p
11、A,pB,pD)启动。FX174含有的5386Nt最多能编码1795个氨基酸,若每个氨基酸的平均分子量为110,则总的蛋白质分子量为197,000Da,但实际蛋白质总分子量却为262,000D。将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现了重叠基因。重叠基因:指调控具有独立性但部分使用共 同基因序列的基因。基因间共同使用部分空间,但编码产物可以互不相关。(不同阅读框,不同的编码链)。提高遗传物质的使用效率,仅在少数原核生物中发现。断裂基因R环的发现: 1977年,冷泉港学术年会,Berget和Roerts小组发现,在腺病毒(adenovirus)复制期间,位于感染细胞核中病毒RNA转录本
12、的前体,由于移去了一至数个中间片段而缩短变成分子量较小的mRNA分子,它们转移到细胞质中成为合成蛋白质的模板。内含子(intron)在初始转录产物 hnRNA 加工产生成熟的mRNA时,被切除的非编码序列。外显子(exon)在成熟的mRNA或蛋白质中存在的序列。 高度重复序列(上万到数百万次)(highly repeated sequence)在基因组中重复106107次,简单的高度重复序列:长度100 bp一般不分散,串联成簇排列在异染色质,特别是在着丝粒和端粒附近缺乏转录必需的启动子,一般不转录 简单的高度重复序列 卫星DNA (satellite DNA)CsCl密度梯度离心时,出现在覆
13、盖一定浮力密度范围的宽带(主带)的附近,呈一条或几条小带均是高度重复序列,串联排列以大的基因簇(100-3000kb)位于异染色质中(着丝粒),不转录富含A/T,浮力密度小*小卫星序列(minisatellite)以小基因簇的形式,重复单位串联排列,小的基因簇( 在100bp-10kb之间),有两种形式,一种为端粒DNA,一种为高度可变的小卫星DNA (variable number of tandem repeats,VNTR序列,可变数目串联重复)位于亚端粒区域,重复的拷贝数在个体间的差异很大(VNTR loci and DNA fingerprints)*微卫星序列(microsatel
14、lite sequence)更小的基因簇( 40 bp转录起始点:90为嘌呤,CAT共有序列(consensus sequence): -10 区(-10 sequence/ Pribnow box):解链区富含AT,影响开放起始复合物形成的速度,决定转录方向. -35 区 (-35 sequence/Sextama box)RNA聚合酶全酶依靠s因子的最初结合位点,影响起始的效率,在很大程度上决定了启动子的强度。-10区与-35区的间距:90为1618bp 有些15 / 20bp 最适为17bp启动子上游部位(upstream part of promoter UP): 是RNA聚合酶结合或
15、其所需要的蛋白质辅助因子的作用位点。* 因子对RNA聚合酶与DNA结合的影响核心酶与DNA有一定的亲和力,这种亲和力主要来自蛋白质中碱性基团与DNA的磷酸根之间的静电引力,是一种与DNA序列无关的非特异性结合,这种结合又称为松弛结合(loose binding site).松弛复合物的半衰期约为60分钟。由于核心酶与DNA的高度亲和力的存在,细胞中只有少量的RNA聚合酶是以游离状态存在,这对于转录能够高效起始非常重要。s因子使RNA聚合酶全酶对非特异性位点的结合能力,结合常数下降104倍。 因子同时使RNA聚合酶全酶和启动子的结合非常紧密,结合常数增加1000倍。转录过程的四阶段 1、模板识别
16、模板识别:核心酶在s 因子的参与下与模板DNA松散的可逆地结合,搜索启动子。 s 因子使RNA聚合酶对特异性位点的亲和性大大提高(106)。识别部位在35区,全酶与启动子结合形成封闭的启动子复合物 (closed promoter complex)开放的起始复合物:全酶与10区紧密地不可逆地结合,10区局部解链,聚合酶构象改变,形成开放的起始复合物 (open-promoter complex)。 2、起始第一个被转录碱基的选择(G/A)及三元复合物(全酶启动子核苷三磷酸)的形成。无效起始(abortive initiations)起始终止:RNA聚合酶成功延伸核苷酸链( 9bp),RNA聚合
17、酶离开启动子位点,s 因子与核心酶解离. 3、延伸转录泡(transcription bubble):转录位点的动态、短暂的解链结构。转录泡的长度为15bp。形成延伸三元复合物(核心酶DNA新生RNA)RNADNA杂交区的长度为89bp。影响RNA延伸速度的因素-暂停 倒退 阻滞:细菌转录的速度约40bp/s(37C),与翻译速度15 a.a/s 相当。暂停信号:GC富集区/反向重复序列,链延伸的速度降低/暂停.暂停的意义:同步化转录和翻译,利于转录调节蛋白发挥功能,或是转录终止所必须. 4、终止(termination)不依赖r因子的终止结构特征:具有一个反向重复顺序,茎环富含GC,转录后形
18、成稳定的茎环结构。茎环后有数个A/T,转录后形成一串AU配对的杂交链,稳定性差。依赖r因子的终止r因子利用位点 rut(40Nt单链)具有依赖RNA的ATPase活性,利用水解ATP的能量,使附着在新生RNA链的r因子延53方向朝RNA聚合酶移动具有53解旋酶活性,使RNA与DNA之间的配对碱基解离,使RNA新生链离开模板。真核:DNA转录 1、真核生物RNA聚合酶RNA聚合酶细胞中的分布转录产物-鹅膏覃碱的敏感性I核仁rRNA(18 S、28 S、5.8 S)不敏感II核质mRNA、snRNA、snoRNA敏感III核质tRNA、5 S rRNA、snRNA 、 其他小RNAs中等敏感(种属
19、特异)有复杂的亚基组成:1417个亚基核心亚基:相当于、共同亚基和特异亚基分子量: 500 kD 700 kD 需多种转录因子的参与才能显示起始活力转录因子: 转录必需但不是RNA聚合酶组成成分的蛋白因子 。针对不同基因 : 普遍性(通用)转录因子 基因特异性转录因子顺式作用元件(cis-acting elements):转录因子结合位点的DNA序列反式作用因子(trans-acting factors): 转录因子2、 RNA聚合酶 II RNA聚合酶II的最大亚基的含有一段7个氨基酸的重复序列,被称作羧基末端结构域(carboxyl terminal domain, CTD ),CTD结构域中,Ser/Tyr可