1、目目 录录第二十五章第二十五章基因结构分析基本策基因结构分析基本策略略Basic strategy for analyzing gene structure 第1页目目 录录主要内容:主要内容:第一节第一节 基因序列结构生物信息学检索和比对基因序列结构生物信息学检索和比对 分析分析第二节第二节 基因转录起始点判定基因转录起始点判定第三节第三节 开启子结构及功效分析开启子结构及功效分析第四节第四节 编码序列结构分析编码序列结构分析 第2页目目 录录第一节第一节 基因序列结构生物信息学检基因序列结构生物信息学检索和比对分析索和比对分析第3页目目 录录就就是是在在数数据据库库中中对对基基因因序序列列
2、或或DNADNA序序列列进进行行 比比对对分分析析,以以其其能能够够推推测测出出其其结结构构、功功效效及及在在进化上联络进化上联络.比对方法:比对方法:1.1.双重比对双重比对 2.2.多序列比对多序列比对序列比对目标:序列比对目标:判断两个或多个序列间是判断两个或多个序列间是否含有足够相同性否含有足够相同性从而判断二者之间是否含从而判断二者之间是否含有同源性有同源性直接数量关系直接数量关系进化上曾含有共同祖先进化上曾含有共同祖先基因或基因或DNADNA序列比对序列比对第4页目目 录录序列比对结果:取代插入缺失Mouse:GGKDSCQGDSGGPVVCNG-QLQGVVSWGDGCAQKNK
3、PGVYTKVYNYVKWIKNTIAANCrayfish:GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV-缺失?缺失?保守序列保守序列保守序列:保守序列:可能是共同进化标志可能是共同进化标志可能并不代表功效主要性可能并不代表功效主要性插入?插入?当两个序列非常相同时,是否一定当两个序列非常相同时,是否一定说明它们含有相同功效?说明它们含有相同功效?第5页目目 录录NCBI数据库数据库NCBI首先创建首先创建GenBank数据库数据库 于于19911991年年开开发发了了Entrez数数据据库库检检索索系系统统,该该系系统统
4、整整合合了了GenBank、EMBL、PIR和和SWISS-PROT等等数数据据库库序序列列信信息息以以及及MEDLINEMEDLINE相相关关序序列列文文件件信信息息,并并经经过过相相关关链链接接,将将他他们们有有机地结合在一起机地结合在一起NCBI还还提提供供了了其其它它数数据据库库,包包含含在在线线人人类类孟孟德德尔尔遗遗传传(OMIM)、三三维维蛋蛋白白结结构构分分子子模模型型数数据据库库(MMDB)、人人类类基基 因因 序序 列列 集集 成成(UniGene)、人人 类类 基基 因因 组组 基基 因因 图图 谱谱(GMHG)、生物门类()、生物门类(Toxonomy)等数据库等数据库
5、第6页目目 录录第7页目目 录录1.1.各种数据库介绍各种数据库介绍(1)Nucleotide该数据库由国际核苷酸序列数据库组员美国该数据库由国际核苷酸序列数据库组员美国国立卫生研究院国立卫生研究院GenBank、日本、日本DNADNA数据库数据库(DDBJ)和英国和英国Hinxton Hall欧洲分子生物学试欧洲分子生物学试验室数据库验室数据库(EMBL)三部分数据组成)三部分数据组成三个组织天天交换各自数据库中新增序列实三个组织天天交换各自数据库中新增序列实现数据共享现数据共享第8页目目 录录(2)Genome即即基基因因组组数数据据库库,提提供供了了各各种种基基因因组组、完完全全染染色体
6、、重合序列图谱以及一体化基因物理图谱色体、重合序列图谱以及一体化基因物理图谱(3)Structures即结构数据库或称分子模型数据库即结构数据库或称分子模型数据库(MMDB),包,包含来自含来自X X线晶体学和三维结构试验数据线晶体学和三维结构试验数据NCBI已已经经将将结结构构数数据据交交叉叉链链接接到到书书目目信信息息、序序列列数数据据库库和和NCBITaxonomy中中利利用用NCBI3D结结构构浏浏览览器器和和Cn3D,能能够够很很轻轻易地从易地从Entrez取得分子分子结构间相互作用图像取得分子分子结构间相互作用图像第9页目目 录录(4)Taxonomy即生物学门类数据库,能够按生物
7、学门类进行检即生物学门类数据库,能够按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等索或浏览其核苷酸序列、蛋白质序列、结构等(5)PopSet包含研究一个人群、一个种系发生或描述人群包含研究一个人群、一个种系发生或描述人群改变一组组联合序列改变一组组联合序列PopSet既包含了核酸序列数据又包含了蛋白质既包含了核酸序列数据又包含了蛋白质序列数据序列数据第10页目目 录录(7)(7)文件数据库文件数据库PubMed:生物医药科学检索系统生物医药科学检索系统 OMIM:孟孟德德尔尔遗遗传传学学数数据据库库是是人人类类基基因因和和基基因疾病目录数据库因疾病目录数据库其它:书目,杂志,文章引
8、用匹配等其它:书目,杂志,文章引用匹配等该该数数据据库库包包含含原原文文信信息息、图图片片和和参参考考信信息息,同同时时还还能能够够链链接接到到Entrez系系统统MEDLINE数数据据库中相关文件和序列信息库中相关文件和序列信息 第11页目目 录录2.NCBI数据库检索数据库检索 在检索框中输入检索词,检索词间默认逻辑关在检索框中输入检索词,检索词间默认逻辑关系为系为AND,检索规则基本同,检索规则基本同PubMed 能能够够经经过过下下拉拉菜菜单单项项选选择择择择统统计计显显示示格格式式,通通常常选选择择GenBank Report格式或格式或FASTA Report格式。格式。当当选选择
9、择GenBank Report格格式式后后,屏屏幕幕显显示示较较完完整整基基因因统统计计,包包含含:基基 因因 位位 点点(Locus)、基基 因因 定定 义义(Definition)、基基 因因 存存 取取 号号(Accession)、核核酸酸编编号号(NID )、关关键键词词(Keywords)、起起源源(Source)、组组织织分分类类(Organism)、参参考考文文件件(Reference)、著著者者(Author)、题题 目目(Title)、期期 刊刊(Journal)、Medline存存 取取 号号(Medline)、序序列列特特征征(Features)、基基因因(Gene)、C
10、DS(cDNA)、等等位位基基因因(Allele)对对等等肽肽(Mat-Peptide )、计计算算碱碱基基数数(Base Count)、原序列)、原序列(Origin)。)。而而FASTA Report格式仅包含检出序列简明特征描述。格式仅包含检出序列简明特征描述。第12页目目 录录比如:人比如:人EPOEPO基因序列检索基因序列检索输入关键词,选择适当程序输入关键词,选择适当程序第13页目目 录录向下拉寻找符合目标条目向下拉寻找符合目标条目第14页目目 录录点击此条打开连接点击此条打开连接第15页目目 录录向下拉寻找关注内容向下拉寻找关注内容第16页目目 录录凡是连接地方都能够点击查看凡是
11、连接地方都能够点击查看能够直接拷贝保留相关内容能够直接拷贝保留相关内容第17页目目 录录Entrez:是一个用以整合是一个用以整合NCBI数据库中信息搜数据库中信息搜寻和检索工具寻和检索工具 3.3.NCBI数据库搜索工具数据库搜索工具 BLAST:是是一一个个NCBINCBI开开发发序序列列相相同同搜搜索索程程序序,还还可可作作为为判别基因和遗传特点伎俩判别基因和遗传特点伎俩 NCBI提提供供附附加加软软件件工工含含有有:开开放放阅阅读读框框寻寻觅觅器器(ORF Finder),电电子子PCR,和和序序列列提提交交工工具具,Sequin和和BankIt Entrez一一个个强强大大和和独独特
12、特特特点点是是检检索索相相关关序序列列,结结构构,和和参参考考文文件件能能力力 第18页目目 录录Entrez:第19页目目 录录BLAST:第20页目目 录录BLAST程序程序程序程序 数据库数据库 查询查询 内容内容Blastp 蛋白质蛋白质 蛋白质蛋白质 使用取代矩阵寻找较远关系:使用取代矩阵寻找较远关系:能够进行能够进行SEG过滤过滤Blastn 核苷酸核苷酸 核苷酸核苷酸 寻找较高分值匹配,对较远关系寻找较高分值匹配,对较远关系 不太适用不太适用Blastx 核苷酸核苷酸 蛋白质蛋白质 对于新对于新DNA序列和序列和ESTs分析极分析极 (翻译)(翻译)为有用为有用Tblastn 蛋
13、白质蛋白质 核苷酸核苷酸 对于寻找数据库中没有标注编码对于寻找数据库中没有标注编码 (翻译)(翻译)区极为有用区极为有用Tblastx 核苷酸核苷酸 核苷酸核苷酸 对于分析对于分析EST极为有用极为有用 (翻译)(翻译)(翻译)(翻译)第21页目目 录录点击核酸序列点击核酸序列blast,在框内输入序列:,在框内输入序列:第22页目目 录录选择搜索条件:选择搜索条件:第23页目目 录录选择特殊程序:选择特殊程序:第24页目目 录录比较两个序列之间相同性:比较两个序列之间相同性:第25页目目 录录 以上仅介绍了以上仅介绍了NCBI相关数据库及工具软相关数据库及工具软件关于其它数据库及软件工具等信
14、息见书中件关于其它数据库及软件工具等信息见书中第二十五章表第二十五章表1-51-5。第26页目目 录录第二节第二节 基因转录起始点判定基因转录起始点判定第27页目目 录录主要内容:主要内容:一、基因转录起始点序列特征一、基因转录起始点序列特征二、基因转录起始点序列分析二、基因转录起始点序列分析第28页目目 录录一、基因转录起始点序列特征一、基因转录起始点序列特征 TATA box CAAT box GC box 增强子增强子 顺式作用元件顺式作用元件 结构基因结构基因-GCGC-CAAT-TATA转录起始点转录起始点1.1.真核基因及其调控元件真核基因及其调控元件第29页目目 录录II 型开启
15、子型开启子TSS:没有明确保守序列没有明确保守序列有有一一个个趋趋势势,即即mRNA 第第一一个个碱碱基基是是A,其其侧翼碱基倾向于是嘧啶侧翼碱基倾向于是嘧啶与与mRNA第一个碱基对应位置标识为第一个碱基对应位置标识为-1-1区区-3 +5-3 +5区域被称作起始子区域被称作起始子 (initiator)2.2.转录起始点(转录起始点(TSS)+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator Initiator PyPy2 2CAPyCAPy5 5第30页目目 录录二、基因转录起始点序列分析二、基因转录起始点序列分析思索:思索:转录起始点转录起
16、始点 (TSS)位于基因编码序列位于基因编码序列5 5 端端基基因因编编码码区区是是指指能能表表达达在在多多肽肽链链中中核核苷苷酸酸序序列列多肽链是以多肽链是以mRNA为模板经翻译合成为模板经翻译合成所以,所以,分析判定分析判定TSS方法都是以方法都是以cDNA为切入点为切入点第31页目目 录录1.1.cDNA克隆测序克隆测序AAAAAnAAAAAnAAAAAnmRNA反转录酶AAAAAnOligo(dT)15-18TTTTT15-18cDNA第一链CCCCCTTTTT15-18cDNA第一链nCCCCnGGGGcDNA第二链克隆扩增,5端测序分析反转录酶末端转移酶活性Oligo(dG)15-
17、18mRNA与线性载体相连接要求:cDNA5端完整无缺第32页目目 录录2.2.cDNA末端快速扩增技术末端快速扩增技术(RACE)传统传统RACE:AAAAAnmRNAAAAAAnTTTTT15-18cDNAmRNA-53-反转录酶Oligo(dT)15-18末端转移酶dGTPTTTTT15-18nGGGGG锚定PCR扩增TTTTT15-18nGGGGGnCCCCC锚定引物特异引物PCR产物第33页目目 录录Deep-RACE:用寡核苷酸替换mRNA5端帽结构以及发光标识巢氏PCR引物实现高通量判定转录起始点 AAAAAn5-p 帽mRNA牛小肠磷酸酶(CIP)AAAAAn5-帽烟草酸焦磷酸
18、酶(TAP)AAAAAn5-将5-RACE adaptor(寡核苷酸)加到脱帽RNA分子上AAAAAn5-RACE adaptor(寡核苷酸)反转录酶10nt 随机引物第34页目目 录录5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptor长短不一样cDNA随机引物用10nt随机引物与5-RACE引物进行PCR扩增5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptorPCR产物随机引物以5-RACE引物和5端甩尾基因特异性反向引物进行巢氏PCR 5-RACE adaptor以5-
19、RACE发光标识引物对PCR混合物直接进行一次性测序分析基因转录起始点第35页目目 录录3.3.连续分析基因转录起始点连续分析基因转录起始点 在RACE基础上,经过在转录本5 端引入一个特殊II型限制性核酸内切酶识别位点,实现了基因5 端短片段串联连接产物一次测序分析多个基因转录起始点目标主要有两种方法:主要有两种方法:5 端连续分析基因表示(5 -end serial analysis of gene expression,5 SAGE)帽分析基因表示(cap analysis gene expression,CAGE)第36页目目 录录(1)5 SAGE5SAGE是在PCR过程中将MmeI
20、酶切位点引物cDNA5端,经过酶切和连接取得不一样短片段重复序列,并对重复序列进行测序取得大量片段序列信息 不一样序列短片段代表不一样基因转录起始点(TSS)MmeI:是一个特殊II型限制性核酸内切酶识别序列不是回文结构,而是不对称DNA序列5-TCCRAC-3(R代表G或A)在识别位点下游1820碱基处切开双链DNA 第37页目目 录录GpppAAAAAAAAnmRNA用BAP和TAP处理AAAAAAAAnp在RNA5端加上寡核苷酸帽AAAAAAAAn5XhoIMmeI反转录酶RT5AAAAAAAAn5cDNAPCRBiotin-标识引物随机引物55BiotinMmeI酶切消化520 mer
21、5Biotin亲和素用亲和素-生物素,能够将5-端片段与其它片段分离开第38页目目 录录520 mer连接5Biotin5Biotin520 merPCR扩增55Biotin5Biotin5XhoI酶切消化本身连接串联体测序分析第39页目目 录录(2)CAGECAGE与5SAGE非常相同所不一样是:CAGE不 需 要 在 RNA上 加 接 头,而 是 用oligo(dT)引物先进行第一链cDNA合成然后经过捕捉帽结构,将含有MmeI和另一内切酶位点如XmaJIlinker加到单链全长cDNA3末端 第40页目目 录录AAAAAAnCapmRNA反转录酶Oligo(dT)1518AAAAAAnC
22、apTTTTTTTncDNA捕捉5-帽结构单链linker连接TTTTTTTnBiotincDNA第二链合成TTTTTTTnAAAAAAnMmeIXmaJIMmeI酶切亲和素20 mer用亲和素-生物素,能够将5-端片段与其它片段分离开第41页目目 录录连接第二个linkerXbaIXmaJIXmaJI,Xbal酶切消化PCR(用linker1和linker2作引物)Linker 1Linker 2纯化,串联连接,克隆20 merXmaJI和XbaI是同尾酶:XmaJI:CCTAGGXbaI:TCTAGA串联体测序分析第42页目目 录录第三节第三节 开启子结构及功效分析开启子结构及功效分析第4
23、3页目目 录录主要内容:主要内容:一、开启子结构分析一、开启子结构分析二、开启子功效分析二、开启子功效分析第44页目目 录录开启子(开启子(promoter)是一段能被蛋白质识别、参加特定基因转录调控DNA序列II型开启子通常位于结构基因上游共通序列(consensus sequence)是其特征性序列共通序列和开启子所处位置是研究开启子主要线索第45页目目 录录+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator Initiator 共通序列共通序列比如:原核基因共通序列:-10区:Pribnow box(T77A76T60A61A56T82序列
24、)-35区:T69T79G61A56C54A54 序列 真核基因共通序列:真核基因开启子在-50区域附近(大约5%30%基因开启子在-25-30区域)有TATA box(TATAAA序列)TATAATTTGACA第46页目目 录录一、开启子结构分析一、开启子结构分析主要方法:主要方法:利用利用PCR技术克隆开启子技术克隆开启子利用核酸利用核酸-蛋白质相互作用方法研究开启子蛋白质相互作用方法研究开启子生物信息学预测开启子生物信息学预测开启子第47页目目 录录(一)利用(一)利用PCRPCR技术克隆开启子技术克隆开启子特异性基因序列基因上游序列基因组DNA依据基因序列合成一条反向引物正向引物用随机
25、引物PCR扩增随机引物特异引物克隆及测序分析注意:真核基因有内含子,应该依据mRNA序列设计特异性引物特异性引物尽可能靠近基因5端1.1.依据已知基因序列直接进行依据已知基因序列直接进行PCR扩增扩增第48页目目 录录2.2.利用利用TSS钓取开启子钓取开启子AAAAAAnCap 5-mRNA反转录AAAAAAnTTTTTTncDNA插入载体,克隆扩增Cap 5-以基因特异引物与载体引物配对PCR扩增5-测序分析基因转录起始点序列以TSS序列为引物,基因组序列为模板,与随机引物配对进行TSS上游序列PCR扩增第49页目目 录录3.3.利用环状利用环状PCR钓取开启子钓取开启子基因组DNA酶切消
26、化基因组DNA片段直接环化连接加上接头后环化连接依据基因上游序列设计一对反向互补引物PCR扩增依据接头序列设计引物PCR扩增克隆测序分析克隆测序分析加接头环化PCR不依赖特异基因序列可用于筛选开启子接头第50页目目 录录(二)利用核酸(二)利用核酸-蛋白质互作方法研究开启子蛋白质互作方法研究开启子开启子是一段能被蛋白质识别和结合DNA序列,所以,能够检测核酸-蛋白质相互作用研究方法都能够用于开启子研究中 主要方法:足迹法(酶足迹法,化学足迹法)电泳迁移率变动试验(EMSA)染色体免疫沉淀(ChIP)第51页目目 录录1.1.用足迹法研究开启子用足迹法研究开启子足迹法(Footprinting)
27、利用DNA电泳条带连续性中止图谱特点判断与蛋白质结合DNA区域 基本流程:DNA与蛋白质相互作用切割DNA凝胶电泳分析电泳图谱蛋白与未标识竞争DNA结合蛋白与标识DNA结合凝胶电泳放射自显影第52页目目 录录(1 1)酶足迹法)酶足迹法 (Enzymatic footprinting)利用能切割DNA酶处理DNA-蛋白质混合物,然后经过电泳进行分析 DNase I足迹法足迹法(DNase I footprinting)是一个利用DNase I 随机切割双链DNA,从而确定DNA结合蛋白在DNA上结合位点方法 核酸外切酶核酸外切酶IIIIII足迹法足迹法 (Exonucleoase III fo
28、otprinting)是利用核酸外切酶III(Exo III)35外切酶活性从3末端切割双链DNA特征,确定蛋白质在DNA上结合位点惯用方法 第53页目目 录录DNase I 足迹法足迹法dsDNA单链末端标识DNA结合蛋白DNase I酶切消化(控制反应时间)产生长短不一样片段但蛋白质结合区被保护第54页目目 录录蛋白质结合区MNo-proPro-DNA对在凝胶上出现空白区域DNA进行克隆测序,即可确定结合蛋白质DNA序列变性凝胶电泳第55页目目 录录(2 2)化学足迹法)化学足迹法 (Chemical footprinting)是利用能切断DNA骨架化学试剂处理DNA-蛋白质复合物,从而经
29、过化学试剂无法靠近结合蛋白质DNA区域而确定DNA蛋白质结合位点主要方法:羟自由基足迹法 体内足迹法第56页目目 录录1 1)羟自由基足迹法)羟自由基足迹法(Hydroxyl radical footprinting)化学试剂羟自由基利用化学试剂产生羟自由基攻击DNA分子表面脱氧核糖骨架使DNA断裂当DNA结合蛋白将脱氧核糖遮盖时,自由羟基无法攻击而使这个区域DNA受到保护 电泳图谱上出现空白区地方就是结合蛋白质DNA变性凝胶电泳第57页目目 录录2 2)体内基足迹法)体内基足迹法(In vivo footprinting)用化学试剂对活细胞进行体内处理,使DNA在细胞内受到化学修饰,然后裂解
30、细胞,用化学法或酶法进行足迹试验。甲基化干扰试验甲基化干扰试验(Methylation interference assay)是利用化学试剂如硫酸二甲酯(Dimethyl sulfate,DMS)对活细胞DNA进行甲基化修饰,从而干扰蛋白质与DNA结合。乙基化干扰试验乙基化干扰试验(Ethylation interference assay)是利用化学试剂对活细胞DNA进行乙基化修饰,从而干扰蛋白质与DNA结合。第58页目目 录录化学试剂提取DNADNase I 或化学试剂变性凝胶电泳分析切割DNA化学修饰对蛋白质与DNA结合有干扰,所以,体内足迹试验也叫干扰试验电泳图谱需与未修饰DNA样品进
31、行比较,在未修饰样品中出现空白区位置是体内发生化学修饰DNA区域正常对照化学修饰提取DNA第59页目目 录录2.2.用电泳迁移率变动试验研究开启子用电泳迁移率变动试验研究开启子电泳迁移率变动试验电泳迁移率变动试验(Electrophoretic mobility shift assay,EMSA)是利用结合蛋白质DNA片段在凝胶中迁移滞后特点,经过电泳分离研究核酸-蛋白质互作方法又称为凝胶阻滞试验(Gel retardation assay)第60页目目 录录细胞蛋白质提取物标识DNA片段蛋白质与DNA结合蛋白质-DNA复合物电泳迁移滞后凝胶电泳显影滞后条带表明DNA是与蛋白质结合区域第61页
32、目目 录录3.3.用染色体免疫沉淀技术研究开启子用染色体免疫沉淀技术研究开启子染色体免疫沉淀染色体免疫沉淀(Chromatin immunoprecipitation,ChIP)是在保持蛋白质与染色体DNA结合同时,将染色体切割成小片段并沉淀下来 非变性非变性ChIP:是先用核酸酶处理细胞核,将染色体消化成碎片,然后用适当抗体将结合有蛋白质染色体片段经过免疫沉淀选择出来,再以PCR或核酸杂交技术对DNA序列进行分析 变性变性ChIP:是先用甲醛处理细胞,使蛋白质与DNA在细胞内发生交联,然后分离染色体并进行剪切,用特异性抗体与DNA结合蛋白相结合,以沉淀法分离DNA-蛋白质复合体 前面章节已介
33、绍,这里不再详述第62页目目 录录(三)生物信息学预测开启子(三)生物信息学预测开启子真核基因组测序正在以不停增加速度进行着,当前已经能够取得大约50个完整真核生物基因组序列信息,预计在未来几年内将会完成更多基因组测序工作对基因组注释工作中最难就是准确判定和描绘开启子,所以,开启子预测就显得非常主要 预测开启子切入点开启子结构特征开启子在染色体上位置第63页目目 录录1.1.开启子结构特征开启子结构特征经典开启子关键开启子:普通在TSS上游-35区域以内近端开启子:普通包括TSS上游几百个碱基远端开启子:普通包括TSS上游几千个碱基 含有增强子或缄默子一些特征性结构 TSS附近CG岛经常出现在
34、开启子中共通序列(consensus sequence)第64页目目 录录2.2.开启子预测分析开启子预测分析EPD(Eukaryotic promoter databases)TRRD(Transcription regulatory regions databases)基因转录起始点数据库(DBTSS)开启子数据库开启子数据库 这些数据库主要经过计算机识别、判断及分析,在数据库中寻找开启子特异性特征结构。第65页目目 录录二、开启子功效分析二、开启子功效分析开启子通常是基因上游参加基因转录调控DNA序列。因为开启子中顺式作用元件在基因特异性表示中发挥主要作用,所以,能够经过连接汇报基因研究
35、开启子功效。1.1.汇报基因汇报基因 (Reporter gene)是研究者们为了制造一个可在细胞培养条件下或动植物体内作为筛选标志易检测信号,经过分子生物学操作将发光蛋白或酶编码基因附加到一个感兴趣基因上或插入基因调控序列下游,从而监测感兴趣基因表示或分析基因调控序列活性。第66页目目 录录惯用汇报基因惯用汇报基因荧光蛋白编码基因:绿色荧光蛋白(GFP)红色荧光蛋白(dsRed)蛋白酶:荧光素酶(luciferase)-半乳糖苷酶在蓝色光源照射下发绿光能催化荧光素(luciferin)发生氧化反应发光能使细菌在X-gal存在条件下变成蓝色第67页目目 录录2.2.汇报基因应用汇报基因应用监测
36、基因转染效率监测基因转染效率 汇报基因与目标基因分别插入各自开启子下游,实现汇报基因组成性表示模式监控目标基因表示监控目标基因表示 汇报基因与目标基因融合共同受控于一个开启子,汇报基因表示即代表目标基因表示研究开启子活性研究开启子活性 汇报基因插入被研究开启子下游,经过观察汇报基因表示情况推测开启子活性第68页目目 录录开启子捕捉技术(promoter trapping):是一个研究开启子活性筛选方法基本流程:构建开启子捕捉载体观察汇报基因表示 汇报基因MCSori候选开启子序列插入MCS转染细胞观察汇报基因表示开启子捕捉载体第69页目目 录录第四节第四节 编码序列结构分析编码序列结构分析 第
37、70页目目 录录编码序列编码序列 (coding sequence):通常是指能表达在蛋白质氨基酸序列中基因信息 主要内容主要内容一、基因编码序列结构特征一、基因编码序列结构特征二、基因编码序列结构分析二、基因编码序列结构分析第71页目目 录录一、基因编码序列结构特征一、基因编码序列结构特征基因编码序列含有一些特征性序列比如:开放阅读框架蛋白质翻译起始密码子和终止密码子真核基因外显子(编码序列)和内含子(非编码序列)之间有特殊序列 第72页目目 录录(一)开放阅读框架(一)开放阅读框架开放阅读框架(open reading frame,ORF)是指生物基因组中含有能潜在编码蛋白质一段核苷酸序列
38、 在基因序列中,ORF位于起始密码子(start codon)和终止密码子(stop codon)之间 密码子:是由三个核苷酸组成DNA序列,也称作三联密码子生物体基因组中总共有64种密码子,其中三个终止密码子,61个编码氨基酸密码子 第73页目目 录录分析一段DNA序列中是否存在ORF:从理论上说,普通需要对双链DNA序列6种阅读框架进行分析,每一条链分析三种阅读框架 比如:1)5-UCU AAA AUG GGU GAC-3 (其中AUG是起始密码子)2)5-U CUA AAA UGG GUG AC-33)5-UC UAA AAU GGG UGA C-3 (其中UAA是终止密码子)只有真正O
39、RF能够不碰到终止密码子 第74页目目 录录(二)(二)mRNAmRNA选择性剪接序列特征选择性剪接序列特征 mRNA选择性剪接(alternative splicing):是指基因外显子转录产物RNA以不一样方式进行切割再连接过程经剪接所产生mRNA能够翻译成不一样蛋白质,从而造成一个基因能够编码一个以上蛋白质 真核基因内含子在与外显子交界区域有共通序列(consensus sequences):内含子5端有GU序列,3端有AG序列 第75页目目 录录(三)基因外显子序列特征(三)基因外显子序列特征基因外显子能够被分成三部分能够被翻译成蛋白质编码区5-非翻译区(5UTR)3-非翻译区(3UT
40、R)有作为蛋白质翻译起始主要元件Kozak序列:由起始密码子AUG及其周围序列组成 3UTR位于终止密码子下游,含有poly A尾加尾信号AATAAA序列 第76页目目 录录二、基因编码序列结构分析二、基因编码序列结构分析基因编码序列是指能表达在成熟mRNA中核苷酸序列,所以,与mRNA互补cDNA成为研究编码序列主要切入点.主要方法:cDNA文库编码序列筛选RNA剪接分析编码序列用数据库分析编码序列高通量分析RNA剪接方法主要有三种:基于DNA微点阵分析、交联免疫沉淀(CLIP)和体外汇报基因测定法 对各种方法所取得cDNA片段序列在基因数据库中进行同源性比对,经过染色体定位分析、内含子/外显子分析、ORF分析及表示谱分析等 第77页目目 录录小结:小结:基因结构分析切入点已经从一个基因克隆测序,发展到如今在基因组范围高通量筛选,所以,研究策略也发生了改变,基因数据库在不知不觉中占据了主要地位。基因结构特点成为基因组范围内高通量扫描基因主要靶标,基因转录起始点、开启子以及编码序列是基因主要结构特征第78页