1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,遗传学,北京理工大学生命科学与技术学院,谭信,Tel:68915957-8001,E-mail:tanxing,第三章 基因的概念与结构,第一节 基因的概念的演变,(一)魏斯曼的,种质连续论,:在胚胎发育的早期生殖细胞就与体细胞分离,只有生殖细胞才有一条代代相传的连续路线。他理论的特点:必须在细胞和个体水平上理解遗传,成体身上发生的事不能遗传后代。,魏斯曼屏障:获得的形状不可能遗传。,(二)孟德尔的遗传因子:决定某个性状
2、遗传的抽象符号。,1909年丹麦遗传学家约翰逊创造,“,基因(,gene),”,,但没有提出基因的物质概念。,(三)20世纪初的基因概念:位于染色体上的,线性排列的遗传功能单位。,基因的,“,三位一体,”,概念:是决定性状的最小单位,突变的最小单位,重组的最小单位。,(四)20世纪40年代发现突变基因的内部可以通过重组而形成野生型基因,因而确定基因不是重组的最小单位。,1957年本则尔(S.Benzer)以T4噬菌体为材料进行研究,提出顺反子(cistron)的概念。,The arrangement of genetic markers in cis and trans heterozygot
3、es.,野生型和突变型,非等位基因之间的相互作用,多因一效和一因多效,复等位基因(,multiple alleles),操纵子与超基因(operon&super gene),断裂基因(interrupted gene),重叠基因(overlapping gene),第二节 基因的结构和种类,一,.野生型和突变型,野生型:指等位基因中能产生有功能的蛋白质,突变型:一般是丧失功能型,产生异常的蛋白质或不能产生蛋白质。,所以野生型对突变型一般是显性的。,1.基因互作(Mutual Action of Genes,Gene interaction):非等位基因间相互作用产生新的性状。,例:鸡冠的遗传:
4、玫瑰冠 X 豌豆冠,RRpp rrPP,胡桃冠 RrPp,胡桃冠 玫瑰冠 豌豆冠 单冠,R-P-R-pp rrP-rrpp,9 :3 :3 :1,二,.非等位基因之间的相互作用:,Comb shapes in chickens of different breeds.,a:玫瑰冠,b:豌豆冠,c:胡桃冠,d:单冠,2.不同基因座的基因可能影响或决定同一性状。当两对独立遗传基因分别处于纯合显性或杂合状态时,共同决定一种性状的出现。当只有一对基因有纯合显性或杂合显性时,则表现为另一种性状。这些非等位基因称为互补基因(complementary gene)。,9A_B_:3A_bb:3aaB_:1
5、aabb,显性:隐性=9 :7,AB,Ab,aB,ab,AB,AABB,AABb,AaBB,AaBb,Ab,AABb,AAbb,AaBb,Aabb,aB,AaBB,AaBb,aaBB,aaBb,ab,AaBb,Aabb,AaBb,aabb,设两对基因的杂合体:,AaBbAaBb,例:香豌豆:,P 白花CCpp,白花,ccPP,F1 紫花CcPp,F2 9紫花(C_P_):7白花(3C_pp,+3ccP_+1ccpp),3.积加作用,两种显性基因同时存在时产生一种性状,单独存在时能分别表现相似的性状,两种显性基因均不存在时又表现第三种性状:,9A_B_:3A_bb:3aaB_:1aabb,9 :
6、6 :1,4.重叠作用,不同对基因互作时,不同的显性基因对表现型产生相同的影响,F2产生15:1的比例:,9A_B_:3A_bb:3aaB_:1aabb,显性 :隐性=15 :1,5.上位效应(epistasis),一对基因可以掩盖另一对非等位基因的显性效应的现象。,上位性:两对独立遗传基因共同对一对,性状发生作用,其中一对基因对另一对基因的表现有遮盖作用。,下位性:后者被前者所遮盖。,(,1)显性上位作用,上位显性基因:起遮盖作用的基因如果是显性基因,则:,9A_B_:3A_bb:3aaB_:1aabb,12 :3 :1,显性上位作用举例:,燕麦穎壳颜色遗传:,黑色 X 黄色,BByy bb
7、YY,黑色BbYy,黑色 黑色 黄色 白色,B-Y-B-yy bbY-bbyy,9 3 3 1,12 :3 :1,(,2)隐性上位作用,在两对互作的基因中,其中一对隐性,基因对另一对基因起上位性作用:,9A_B_:3A_bb:3aaB_:1aabb,9 :3 :4,隐性上位效应举例:,P 黑色 白化,BBCC bbcc,F1 黑色 BbCc,F2 黑色 棕色 白化 白化,B_C_ B_cc (bbC_ bbcc),9 :3 :4,小鼠毛色的隐性上位效应,6.在两对独立基因中,其中一对显性基因,本身并不控制性状的表现,但对另一对基因的表现有抑制作用,称为抑制基因(inhibitor)。如下面A对
8、B的抑制:,9A_B_:3A_bb:3aaB_:1aabb,显性 :隐性=3 :13,抑制基因举例:,欧州白茧 X 黄茧,I I yy ii YY,白蚕茧 Ii Yy,白茧 白蚕 白茧 黄茧,I-Y-I-yy iiyy iiY-,9 3 1 3,13 :3,两对基因互作的模式图,虚线表示合并的表现型,圆圈里数字表示各种比数字,基因内互作:同一位点上的等位基因的相互作用,显性、不完全显性、隐性。,基因间相互作用:不同位点非等位基因相互作用-上位性、下位性,基因相互作用,三,.多因一效和一因多效,多因一效:许多基因影响同一个性状的表现。,玉米正常叶绿素的形成与50多对不同的基因有关,其中的任何一对
9、发生改变,都会造成叶绿素的消失或改变。,一因多效:一个基因影响许多性状的发育,往往是多个性状同时表现出来,复等位基因:群体中的不同个体在同一基因座上有两种以上的等位基因。,一个2倍体的正常细胞最多只能有复等位基因中的2个。,2个等位基因,可以组成3种基因型,3个等位基因,可以组成6种基因型,4个等位基因,可以组成10种基因型,n个等位基因,可以组成 n+n(n-1)/2种基因型。,其中纯合体为n 个,杂合体为n(n-1)/2个。,四,.复等位基因,复等位基因实例,:,血型遗传学,1667年 法国 Denys首次把羊血输给病人。,1818年 英国 Blundell首次人之间输血。,1900年 奥
10、地利 Landsteiner发现了ABO血型系统,1926年奥地利 Landsteiner发现了MN血型系统,1927年奥地利 Landsteiner发现了P血型,1939年奥地利 Landsteiner发现了Rh血型,1930年:Landsteiner获诺贝尔奖,ABO,血型系统的抗原与抗体,A抗原 A抗体 B抗原 B抗体,A血型 ,B血型 ,AB血型 ,O血型 ,ABO血型的遗传特例,A B,O A,O AB(?)孟买血型,ABO,血型系统遗传方式,前体,H物质 抗原,B抗原,无抗原,双亲血型基因型:HhAo X HhBo,子女血型基因型:hhBo X HHAo,HhAB,A,B抗原的生物
11、合成:ABO抗原的前体是H抗原。A基因编码,N-乙酰半乳糖转移酶,,能把,H抗原转化成A抗原,B基因编码,半乳糖转移酶,,能把,H抗原转化成B抗原。O基因是突变的A基因(少一个核苷酸),不能编码有活性的酶。,ABO,血型系统遗传方式,特例:临床中发现有一位病人在验血中确定为B血型,在接受O型血的输血后,引起凝血反应。,在对供血者血液重新检测时发现,其血细胞在与抗A血清反应时,初时无反应,2个小时后呈凝集反应。所以确定供血者为A型,而不是O型。,血型的表型改变,病人 住院时检测为B血型出院以后为O型。,原因,:消化道E.coli K 12 感染,产生类B抗原物质。,ABO,血型的异常遗传现象,有
12、一AB血型男子与O血型女子结婚,生了一个O型孩子和一个AB型的孩子,分析其原因。,解释:,9q34同源染色体不等交换。,ABO血型基因的进化史:A基因是最古老的基因,O基因和B基因都是由A基因先后突变来的。通过计算可知,这个变化发生于几百万年前。也就是说,人类祖先一开始就已经有了三种血型基因、四种血型了。,目前已发现14种A基因(以A1,A2,表示),,14种B基因和8种O基因。,关于血型的误用:,1910年,海德堡大学医生范顿根声称纯种欧洲人的血型是A型,纯种亚洲人的血型是B型,或者说,那些B型血的 欧洲人不是纯种欧洲人。两位波兰研究者将人类划分成了三个人种:A型占多数的欧洲人,B型占多数的
13、亚非人,和过渡型。他们并描绘了一幅人类进化的图景:人类的祖先原先都只有O型血,之后分化出了A型和B型两个不同的人种。1930年在给兰特斯坦纳颁发诺贝尔奖时,诺贝尔奖委员会主席:,“,兰特斯坦纳的发现为研究一个民族的种族纯洁程度的决定性开创了新的领域。,”,ABO,血型的新生儿溶血症,O血型的母亲怀有A,B,AB型血型的胎儿,在母亲胎盘异常情况下,临产时会出现母亲的抗体进入新生儿血液中,与婴儿的抗原产生免疫反应,造成婴儿溶血。,Rh,血型的遗传机制,恒河猴红细胞(Rhesus monkeys抗原)免疫家兔,兔抗猴血清 检测人红细胞。,85 产生凝集反应,15 无凝集反应,定名恒河猴红细胞抗原为R
14、h抗原。,Rh,血型的新生儿溶血症,Rh阳性血型的红细胞带有Rh抗原,无抗体。,Rh阴性血型的红细胞没有Rh抗原,一般情况也没有抗体。,Rh阴性血型的母亲怀有Rh阳性血型的胎儿,在母亲胎盘异常情况下,临产时会出现母亲的抗体进入新生儿血液中,与婴儿的抗原产生免疫反应,造成婴儿溶血。,人类白细胞抗原(,human leucocyte antigen,HLA,),异体移植的免疫作用:,抗宿主反应:受体抗原供体抗体,排斥反应:受体抗体供体抗原,主要组织相容性抗原系统,(major histocompatibility antigen system),主要组织相容性复合体基因,(major histoc
15、ompatibility complex gene,MHC),HLA的遗传机制,主要组织相容性抗原按免疫性分为三类:,第一类:移植抗原(,transplantation antigen),位于T淋巴细胞上,,编码基因为:HLA,A,B,,第二类:免疫反应的信息传递抗原。,编码基因为:HLA,DR,DQ,DP,第三类:补体蛋白,与抗原抗体复合物作用。,编码基因为:HLA,C2,C4,Bf,白细胞抗原的基因,HLA-A HLA-B HLA-C HLA-DR HLA-DQ HLA-DP,A1 B5 Cw1 DR1 DQ1 DPw1,A2 B7 Cw2 DR2 DQ2 DPw2,A3 B8 Cw3 D
16、R3 DQ3 DPw3,A9 B12 Cw4 DR4,.DPw4,A11 B13 Cw5 DR5,.,Aw19 B14 Cw6 DRw6,Aw33 Bw22 Cw7 DR7,Aw36 Bw59 Cw8 DRw8,.,.,.,.,55种 212种 51种 122种,白细胞抗原基因连锁图,HLA:6p21-23.,DP DQ DR C4 C2 B C A,70 41 123 212 51 55,第II类 第三类 第一类,一组功能相近,紧密连锁的基因,称为超基因(Super gene)。,同一条染色体上的基因组成被称为单倍型(,haplotype),白细胞抗原的基因分布,HLA-A 白人 黑人 黄种
17、人,A1 0.15 0.03 /,A2 0.26 0.15 0.30,A3 0.12 0.07 0.01,A11 0.06 0.01 0.25,A25 0.02 /白人抗原,Aw43 /0.01 /南非黑人抗原,Aw36 /0.02 /黑人人抗原,白细胞抗原的基因分布,HLA-B 白人 黑人 黄种人,Bw4 0.41 0.41 0.35,B7 0.09 0.09 0.02,B13 0.03 0.01 0.03,B38 0.03 /0.02,Bw45 0.04 0.04 /,Bw46 /0.05 黄种人抗原,白细胞抗原的基因分布,强关联:连锁基因实际出现的频率的大于理论频,率的现象,A26 B3
18、8 A2 Bw46,犹太人单倍型 黄种人单倍型,Bw45在黄种人中极少,在美洲的印第安人,爱斯基摩人等人群中,该抗原也极少,推测与种族的起源有关。,白细胞抗原与人类疾病,B27抗原与强直性脊椎炎强关联。,患者中90以上都是B27抗原。如果一个人有,50的可能是强直性脊椎炎,检查他的白细胞抗原,有B27抗原,他的患病的机会就大大增高。反之,则减少有病的可能性。,白细胞抗原的单倍型分析,父抗原:,A2,A 11 ,B13,Bw46,母抗原:A3,A 9 ,B5,B7,子1抗原:A2 A3 B7 Bw46,子2抗原:A11 A9 B5 B13,子3抗原:A2 A9 B5 Bw46,子4抗原:A3 A
19、11 B7 B13,子5抗原:A3 A11 B7 Bw46,MN,血型的遗传分析,人群中存在着MN血型系统,受M和N两个基因控制,并显性。,M N,M MM MN,N MN NN,Xg,血型的遗传分析,Xg抗原是目前发现的第一个与性别有关的抗原,基因:Xga 有Xg抗原,Xg 无Xg抗原,Xga对 Xg显性,Xg,血型的遗传分析,Xg抗原,Xga,五,.操纵子与多基因家族,(一)操纵子(operon),1961年F.Jacob和J.Monod提出大肠杆菌的乳糖操纵子模型。指出基因不仅是传递遗传信息的载体,一些基因有调控其他基因表达活性的功能。,大肠杆菌的乳糖降解代谢途径:,Monod等发现,当
20、大肠杆菌生长在含有乳糖的培养基上时,乳糖代谢酶浓度急剧增加;当培养基中没有乳糖时,乳糖代谢基因不表达,乳糖代谢酶合成停止。,乳糖,-,半乳糖苷酶,(Z),+,半乳糖苷乙酰基转移酶,(A),乙酰半乳糖,乙酰辅酶,A,辅酶,A,半乳糖苷透过酶,(Y),大肠杆菌,乳糖操纵子是一个完整的基因调控单元,由结构基因,启动子,操纵基因和调节基因等组成。结构基因有三个基因顺序排列:-半乳糖苷转移酶(Z),透性酶(Y),硫半乳糖苷乙酰转移酶(A)。三个基因共用一个启动子。操纵基因位于启动子和三个结构基因之间。,调节基因,操纵子,Lac 阻遏物,半乳糖苷酶,半乳糖苷,透性酶,半乳糖苷,乙酰基转移酶,E.Coli,
21、诱导型,Lac操纵子结构模型,基因 长度,PI:i基因启动子 gene i:调节基因 P:结构基因启动子 gene Z,Y,A:结构基因 O:操纵单元,诱导物的加入和去除对lac mRNA的影响,乳糖操纵子的正调控,除了阻遏蛋白能抑制lac操纵元转录外,其它因子也能有效地抑制lac mRNA转录,这个因子的活性与葡萄糖有关:,葡萄糖抑制腺苷酸环化酶的活性,腺苷酸环化酶催化ATP前体cAMP,cAMP+代谢激活蛋白(CAP)cAMP-CAP复合物,作为操纵元的正调控因子。,当cAMP-CAP复合物的二聚体插入到lac启动子区域特异核苷酸序列时,使启动子DNA弯曲形成新的构型,RNA聚合酶与这种
22、DNA 新构型的结合更加牢固,因而转录效率更高。,在有葡萄糖存在时,不能形成cAMP,也就没有操纵元的正调控因子cAMP-CAP复合物,因此基因不表达。,扩展:原核生物的基因转录水平的调控,原核生物基因表达的调控主要发生在转录水平。,当需要某一特定基因产物时,合成这种mRNA。当不需要这种产物时,mRNA转录受到抑制。,正调控:是经诱导物诱导转录的调控机制,即诱导物与另一蛋白质结合形成一种激活子复合物,与基因启动子DNA序列结合,激活基因起始转录。,负调控:阻遏物阻止转录过程的调控,即阻遏物与DNA分子结合,阻碍RNA聚合酶转录,使基因处于关闭状态。只有当阻遏物被除去之后,转录才能起动,产生m
23、RNA分子。,原核生物中基因表达以负调控为主。真核生物中则主要是正调控机制。,(二),多基因家族(,multigene family),由某一祖先基因经过多次重复和(或)突变所产生的一组基因,它们在序列上只有微小的差别,并行使相同或相关的功能。可分为两种类型,一种类型是基因家族的各个成员具有几乎相同的碱基顺序,串联排列集中在一条染色体上,称为基因簇(gene cluster);另一类型是一个基因家族的成员可分为若干群,分别成簇地分布在不同的染色体上。,在多基因家族之上还可以有基因超家族(superfamily)。,人类珠蛋白基因家族,(三)假基因,假基因(pseudogene):多基因家族成员
24、中与某些有功能的基因结构相似而不能表达出基因产物的序列。起因:(1)有功能的基因因突变而失去功能。(2)逆转录cDNA的插入。这样形成的假基因不含内含子和与启动基因转录有关的侧翼DNA序列,但在5,端有,mRNA特有的多聚腺苷酸序列。,六,.断裂基因,(,interrupted gene),(一)外显子和内含子,绝大多数真核生物编码蛋白质的基因为断裂基因(split gene),即结构基因是不连续排列的,中间被不编码的插入序列隔开。编码序列称为,外显子,(,exon),编码序列中间的插入序列称为,内含子,(,intron),也称间隔序列(intervening sequence,IVS)。每个
25、结构基因在第一个和最后一个外显子的外侧,都有一段不被转录的非编码区,称,侧翼序列,(,flanking sequence),它对基因的有效表达起着调控作用。,内含子与外显子,DNA上的基因排列,核内不均一RNA,(,heterogenous nuclear RNA,hnRNA):平均分子长度为8-10Kb(2Kb14Kb)左右。比mRNA的平均长 度(1.8-2Kb)要大4-5倍。,hnRNA仅有总量的1/2转移到细胞质内,其余的都在核内被降解掉。hnRNA是mRNA的前体,证据是:,(1)hnRNA和mRNA有相同的序列;,(2)hnRNA在体外能作为模板翻译蛋白;,(3)两者5端都有帽子结
26、构;,(4)二者为相同的聚合酶所合成;,(5)两者的3端都有多聚腺苷有尾巴。,剪接位点,intron,NNA,64,G,73,G,100,T,100,A,68,A,68,G,84,T,63,TACTAACC,65,A,100,G,100,NN,D,分支点,A,GTAG法则,外显子与内含子接头,:内含子的,5端碱基顺序总是以GT开始,3端 碱基顺序则以AG结束,为一段高度保守序列。这种接头形式称为GT-AG法则,为hnRNA剪接加工的信号。通过该信号,实现内含子的剪切和外显子的拼接。,分枝点顺序,:为,PyNPyPuAPy,其中A为百分之百的保守,且具有2-OH。,(二)RNA剪接(RNA sp
27、licing),所有内含子都通过转酯作用实现剪接。,可变剪接,(,alternative,splicing,),1 I类类含子的剪接,Cech等1981年用四膜虫分离得到了35S的前体rRNA,它含有一个长413bp的内含子。此35S rRNA要加入一价或二价阳离子及GTP就可以在体外释放出413b的线性的内含子,若继续保温,那么线形内含子又可形成环状的RNA。说明35S RNA在GTP的作用下可以,自我剪接。,(三)内含子的类型和剪接机制,第,I类内含子的自我拼接的第一步反应是鸟苷对位于内含子5端的外显子和内含子之间的3,5-磷酸二酯键进行亲核攻击。游离的鸟苷的3羟基起着一个亲核体的作用,结
28、果与内含子中的5核苷酸形成一个新的3,5-磷酸二酯键,释放出上游的外显子。,在第二次转酯基反应中,上游外显子的3羟基作为一个亲核体攻击位于内含子外显子交界处的3,5-磷酸二酯键。结果切去内含子序列,同时通过3,5-磷酸二酯键将两个外显子共价连接。,第,I类内含子的自我拼接是借助于外部的一个鸟苷催化的。,2.,类内含子的剪接,第II类内含子自我拼接是借助于内部的一个腺苷酸催化的。,1)无需鸟苷的辅助,但需镁离子的存在。,2)分枝点A的2-OH对5端交界处的磷酸二酯键发动亲核进攻,导致腺苷酸和内含子中的5核苷酸之间形成一个不常见的2,5-磷酸二酯键。产生了套索(lariat)结构;,3)切下的外显
29、子1其3-OH继续对内含子3端的交界序列进行亲核进攻,同时释放出套索状的内含子。,通过自我拼接除去第,II类内含子的反应过程,hnRNA拼接需要一个snRNP拼接复合物,这一反应类似于第,II类拼接:第一步反应导致套索结构的形成,然后经第二步转酯基反应将5和3外显子连接起来,并释放出内含子。,与自我拼接的区别是hnRNA拼接依赖于,核内小核糖核蛋白,(,small nuclear nucleoproteins,snRNP),snRNP是由核内小RNA(small nuclear RNA,snRNA)和相关蛋白组成的。存在5种snRNP:U1 snRNP,U2 snRNP,U5 snRNP和U4
30、U6 snRNP,它们与内含子形成剪接复合体(spliceosome),。,3.,核,mRNA的剪接,剪接体(,spliceosome)由蛋白质和核内小RNA构成。,剪接的过程是5,位置切割 套马索形成,3,位置切割 外显子连接。,结构特点:,1)边界顺序:符合GU-AG法则。,2)分枝点顺序:为Py80NPy87Pu75APy95其中A为百分之百的保守,且具有2-OH。,3)内含子5端有一保守序列可以和U1 snRNA的5端的保守顺序互补。,剪接需剪接因子的作用:,snRNPs:,U1,U2,U5和,U4/U6。,剪接因子,snRNPs:U1,U2,U5和,U4/U6。,顺式剪接,(,ci
31、s-splicing):同一RNA分子序列的剪接。,反式剪接,(,trans-splicing):不同RNA分子外显子之间的剪接。可在体外实现。一般需在内含子中引入互补序列。,反式剪接较典型的例子是:1)锥虫表面糖蛋白基因VSG(variable surface glycoprotein)。2)线虫的肌动蛋白基因(actin genes)。3)衣藻(chlamydomonas)叶绿体DNA中含有的psa基因。,4.,反式剪接反应,(四)自我剪接内含子与核酶,核酶是个位置特异的核酸内切酶,在研究RNA催化的四膜虫rRNA内含子的切除反应的过程中,Cech 和他的合作者发现,这个RNA非常类似于酶
32、因为它可加速转酯基速率,而且特异性高。他们发现,称之L-19IVS(间插序列)的rRNA内含子序列能够象一个真正的酶那样促进寡核苷酸底物之间的多核苷酸基转移反应。在这个反应中,核苷酸被除去或加到寡核苷酸底物上,米氏动力学参数Km42,M,kcat2/min。尽管这个反应的速率比大多数的蛋白酶催化的反应的速率低,但使催化速率提高了10,10,。根据这些特性,具有催化功能的,RNA分子称为,核酶,(,ribozymes)。,人工合成的核酶已经出现,其作用象位点特异的内切酶。这些,RNA酶含有一个起着催化部位作用的大约20个核苷酸序列和与靶RNA底物互补的侧翼序列。有一种在类植物病毒中发现核酶,因
33、其二级结构象锤头,所以称为锤头核酶(hammerhead ribozyme)。锤头核酶的实验分析已经揭示了核酶和底物中特异切割部位序列和需要的核苷酸残基。,重叠基因,:指同一段DNA的编码顺序,由于阅读框架(ORF)的不同或终止早晚的不同,同时编码两个或两个以上多肽链的现象。,重叠基因是,基因转录起始点不同,但是共用同一段DNA序列或几个核苷酸的不同基因。,七,.重叠基因(overlapping gene),赏花归去马如飞,去马如飞酒力微,酒力微醒时已暮,醒时已暮赏花归。,-苏东波,1977年 Sanger测定,X 174 Phage。有,5386Nt,11 基因,3个转录单位,由3个启动子(
34、pA,pB,pD)启动。5386Nt最多能编码1795个氨基酸,若每个氨基酸的平均分子量为110,则总的蛋白质分子量为197,000Da,但实际蛋白质总分子量却为262,000D。将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现了重叠基因。,在高等生物和人的基因组中也发现有重叠基因。有些重叠基因转录方向相反,有的重叠基因位于内含子内部。因此,内含子的概念是相对的。,第三节 可动基因或转座元件,有些基因在染色体上的位置是可以移动的,称为,可动基因,(,mobile gene),也称为,转座元件或转座因子,(,transposable element),一,.可动基因(mobile gene)的
35、发现,1932年,美国遗传学家B.McClintock 发现玉米籽粒色斑不稳定遗传现象。1951年首次提出转座子的概念,认为在基因组的不同区域存在可移动的控制因子(controlling element)。1983年获诺贝尔奖。,植物双受精示意图,玉米的转座因子:,玉米色粒调控元件Ac-Ds系统,位于第9染色体短臂。上面可有:,(1)C基因,色素合成基因。,(2)Ac基因,自主移动的调节因子。4.5 kb,5个exon,编码转座酶。,(3)Ds基因,非自主移动的受体因子。,0.5-4.0 kb,与Ac有同源序列。,插入引起色素不能合成。,玉米粒颜色的遗传(C基因决定有色),。,C Ac 有色,
36、C Ds Ac 花斑,C Ds 无色,在,Ds和Ac同时存在时,一些细胞中的Ds因转座而离开,所以这些细胞能合成色素,从而造成花斑。,Ac与Ds因子的结构,Ac因子:4.563kb;两端有11个bp的反向重复序列:,5,CAGGGATGAAA,.TTTCATCCCTG3,3,GT CCC TACTTT,.AAAGTAGGGAC5,Ds因子:与Ac序列具有很大相同,但是中间缺,失序列。有0.5-4.0kb。,插入序列,是仅含有转座酶基因的简单转移序列。长度多在7001500bp左右。,插入序列,由末端反向重复序列(IR),转座酶基因组成。,插入基因组中时,在靶位上生成正向重复序列(DR),二,.
37、插入序列(insertion sequence,IS),常见的IS结构,IS 长度 末端IR 靶位DR 插入选择,IS1 768 23 9 随机,IS2 1327 41 95 热点,IS4 1428 18 11 AAAN20TTT,IS5 1195 16 4 热点,IS10 1329 22 9 TNAGCN,IS50 1531 9 9 热点,三,.转座子(transposon,Tn),转座子,是带有转座酶基因等必需基因及与转座无关基因的转座因子。,与转座无关基因可包括抗药性基因等。,结构特征:两端具有同向或反向插入序列(IS),两端的IS可能相同或不同。,常见的转座子:,转座子 长度 标记 末
38、端 取向,Tn 5 5700 KanR IS50 反向,Tn10 9300 TetR IS10 反向,Tn 9 2500 CamR IS 1 正向,转座子在染色体上的解离方式,原位解离:转座因子直接从原来位置解离,插入新的位置。,复制后解离:转座因子在原来位置留有一份拷贝,另一份拷贝插入新的位置。,精确解离,非精确解离,复制后解离的过程,复制后解离的过程,反转录转座子:,通过,RNA为中介,反转录成DNA后进行转座的可动元件。,病毒超家族,(,viral super family),可编码反转录酶或整和酶,自主转录。呈DNA时,具有LTR序列。,非病毒超家族,(,nonviral super
39、family),不可编码反转录酶或整和酶,不能自主转录。呈DNA时,无LTR序列。,四,.反转录转座子(retrotransposon),反转录病毒,RNA的末端是正向重复序列。,反转录病毒线型DNA的末端是LTRs,整合到宿主DNA中时,两端各丢失了2 bp,(一),反转录病毒,RNA:R U5 gag pol env U3 R,DNA:U3 R U5 gag pol env U3 R U5,LTR LTR,基因组 -DR-U3 R U5 gag pol env U3 R U5 DR-,逆转录病毒的,RNA基因组,的结构,LTR,:长末端重复序列,组成:U3 R U5。是逆转录病毒特有的DN
40、A结构。在RNA基因组中不存在。,LTR的形成机制不清。,LTR对病毒DNA整合进宿主基因组和控制病毒RNA合成有重要意义。具有真核生物基因表达时所需的基本功能:与真核细胞启动子相似的序列,poly A聚合作用的信号,等等。,LTR有增强子序列,可增强基因转录。,艾兹病病毒,艾兹病病毒,vpr rev rev,gag,vif tat vpu tat nef,LTR pol env,LTR,LTR,长末端重复序列,gag,核心蛋白,反转录酶,pol,蛋白酶,vif,感染因子,vpr,vpu,复制因子,tat,反式激活因子,rev,(,art,抗阻遏翻译基因活化,trs,trans regulat
41、or of splicing,),调节因子,env,衣壳蛋白,nef,(,3,orf,)negative factor 抑制复制模板,艾滋病毒的基因结构,反转录病毒整合入宿主,DNA中的分子机制,其本质是转座。,人类基因组中含有几千种几乎完整的病毒基因组,占人类基因组,1.3%。大多数不活跃。,(三)长散在重复序列(,long interspersed elements,LINE),长散在重复序列(LINE)又称长序列型。是可自主转座的反转录转座子。来源于RNA聚合酶II的转录物。长度5000 7000bp,拷贝数为10,2,-10,4,,散在分布于哺乳动物基因组中,如:,Kpn I家族。Kp
42、n I家族是中度重复序列中一种长分散片断,平均长度为3500 5000bp。,L1是LINE中的一个重复序列,被认为是人类基因组中主要的可动因子,可自主转座,并可促使非自主转座因子反转录转座。一些人类致病基因的形成与L1的插入有关:凝血因子VIII基因中的插入;DMD基因中的插入,等等。,(四)非自主反转录元件,SINE,Alu和假基因,短分散元件,(,short interspersing element,SINE,),又称短序列型。来源于,RNA聚合酶III的转录物。长度为300-500bp,拷贝数可达10,5,以上,散在分布于基因组中。如,Alu家族。,Alu家族是人类基因组中存在最广泛
43、的一种中度重复序列,约占人类基因组DNA总量的36,基因组中拷贝数为3050万,序列长300bp,在170位碱基附近的AGCT顺序是限制性内切酶Alu I的酶切位点。故Alu序列可被Alu I切割成130bp和170bp两段,所以得名Alu家族。Alu 两端各有正向重复序列,末端有poly(A)尾。Alu家族散在分布于整个人类基因组,平均每5kbDNA就有一个Alu序列。,Alu家族具有种属特异性,其功能可能与DNA复制的启动、转录的调节、hnRNA的加工有关。,假基因,假基因不含内含子和与启动基因转录有关的侧翼,DNA序列,但在5,端有,mRNA特有的多聚腺苷酸序列。两端有短的正向重复序列。
44、说明其反转录转座的起源。这类假基因可能起源于反转录病毒为中介的转座过程。,转座引起a的遗传效应,插入突变,插入失活,插入带来新的基因,非精确解离形成突变(缺失,重复,到位),插入激活,第四节 癌基因和抑癌基因,遗传基因的异常是导致细胞恶性转化的原因。目前已知这类基因有癌基因(oncogene)和肿瘤抑制基因(tumor suppressor gene,抗癌基因:anti-oncogene)等,。,此外,一些病毒具有导致肿瘤的能力,这种能力与病毒基因的活动有关。,(一)癌基因的发现:首先发现病毒可以导致肿瘤。,1911年 Rous发现鸡肉瘤病毒(RSV)能使鸡胚成纤维细胞转化,也能使鸡诱发肿瘤。
45、1973年发现单个的癌基因就可使正常细胞转化成癌细胞。,1976年从RVS病毒中发现了src癌基因。克隆了该基因,是第一个克隆的病毒癌基因Vonc。,1982年从人膀胱癌细胞中分离出了细胞癌基因ras基因。是第一个 C-onc。,一,.癌基因(oncogene),(二)细胞癌基因,(c-onc),1976年,Bishop从Rous病毒中分离出癌基因src,并在动物正常细胞中发现有同源序列。以后在许多病毒癌基因都在细胞中都发现了它的同源序列,这些序列被称为细胞癌基因。,癌基因概念,癌基因是能引起细胞恶性转化的核酸片段。是在体外能引起细胞转化,在体内诱发肿瘤的基因。,癌基因分病毒癌基因(,v-)
46、和它在真核细胞中的同源的序列,细胞癌基因(c-)或原癌基因两种。,病毒癌基因源于细胞癌基因。,细胞内的原癌基因高度保留,是从酵母到人都存在的正常基因。这些基因与细胞生长,增殖,分化有关,并受到精细和严格的控制。可促进个体的生长发育。在暂时不生长分裂的细胞中癌基因处于封闭状态,不转录表达。一旦在错误的时间不适当的表达,即可导致恶性转化。称为原癌基因的激活。,原癌基因具有的生物学功能:,生长因子;生长因子受体;参与信号传导的蛋白激酶;核内蛋白等。,病毒癌基因与细胞癌基因,为什么同,源?,原癌基因由反转录病毒摄取,反转录病毒按传播方式可分外源性病毒和内源性病毒。前者通过传染途径。后者整合在宿主生殖
47、细胞中而向后代传递。,内源性病毒一般有缺陷不传染,但在一些因素的作用下引起宿主细胞癌变。,反转录病毒带的癌基因一般位于,3端,可不影响病毒原有的基因组。,反转录病毒诱发肿瘤有组织特异性,病毒癌基因和它在真核细胞中的同源的细胞癌基因的区别:,1)病毒癌基因常缺失两端的编码序列,产生与病毒基因相融合的蛋白质。,2)病毒癌基因一般没有内含子。,3)在进化过程中编码序列发生变化,。,1.点突变,例:原癌基因ras 编码189个氨基酸的蛋白是一个细胞信号传导中起着开关作用的蛋白,当ras gene 突变时,ras 蛋白一直处于开的状态,细胞生长。,ras proto-oncogene,1 12 61 1
48、89,gly,arg (G C),k-ras oncogene,(三)细胞癌基因异常激活的机制,2.启动子的插入:ras 附近插入了启动子,启动癌基因表达。,3.ras的CCGG甲基化程度降低,癌基因异常高表达。,DNA的CpG岛的甲基化,干扰了转录因子与启动子识别位点的结合,降低了基因的表达。,癌基因去甲基化,引起高表达致癌。,抑癌基因高甲基化,引起低表达致癌。,4.癌基因扩增:出现染色体外的癌基因片段:双微体。基因扩增往往出现在肿瘤的进展阶段,与愈后有关。,5.,染色体易位,染色体易位产生融合基因,或启动了原癌基因,使得细胞发生转化。,慢性粒细胞白血病(CML):,Ph 染色体:T(9;2
49、2)(q34.1;q11.21):,chr 22 chr 9,5,bcr 3,5,c-abl 3,5,bcr/c-abl 3,大小8.5kb,表达融合蛋白:210KD,该融合蛋白活性强于,ABL,且不受生长因子-受体系统的控制,,影响了造血干细胞的分化。导致白血病(,CML),。,Gene c-onc protein v-onc protein,src 膜 膜,ras 膜 膜,myc 核 核,fps 质 质和膜,abl 核 质,(四)癌基因的作用位置和分类,作用位置:,举例:,Abl:细胞内信号传导物,erbB:生长因子受体,Fos:细胞核转录因子,Ras:细胞内信号传导物,Sis:生长因子,
50、Src:细胞内信号传导物,Myc:细胞核转录因子,已发现100多种癌基因。,1.生长因子,2.生长因子受体,3.细胞内信号传导物,4.细胞核转录因子,分类:,1.ras 癌基因家族,根据不同时期,不同组织的癌基因表达,将,ras基因家族分为三类:,H-ras 11p15.5 胃癌 膀胱癌 宫颈癌,N-ras 1p13.2 白血病 肝癌,K-ras 12p12.1 胰腺癌 肺癌结 肠癌,(五)重要的癌基因,功能:,1)传导生长信号:,cell G S ras.GDP ras.GTP,失活 激活,传导生长信号,细胞生长,2)参与细胞周期调控:,ras 表达蛋白 激活cyclin D,cell分裂,






