收藏 分销(赏)

培训生物芯片理论知识.pdf

上传人:wei****ing 文档编号:4467455 上传时间:2024-09-23 格式:PDF 页数:108 大小:8.37MB
下载 相关 举报
培训生物芯片理论知识.pdf_第1页
第1页 / 共108页
培训生物芯片理论知识.pdf_第2页
第2页 / 共108页
培训生物芯片理论知识.pdf_第3页
第3页 / 共108页
培训生物芯片理论知识.pdf_第4页
第4页 / 共108页
培训生物芯片理论知识.pdf_第5页
第5页 / 共108页
点击查看更多>>
资源描述

1、生物芯片分析:理论部分王永贵产品经理生物科技事业部博奥生物有限公司生物芯片北京国家工程研究中心2 2细胞质细胞核基因组DNA基因组DNA(外偏修饰)(外偏修饰)刺激(物理、化学、生物配体)胞内响应*#多肽多肽蛋白蛋白RNAmRNAmRNAAAACAAA转录调控转录调控转录后调控转录后调控翻译后调控翻译后调控细胞基因表达调控转录因子转录因子(无活性)*转录因子转录因子(有活性)(有活性)microRNAmicroRNADNA水平DNA水平染色体变染色体变异;异;序列变异:序列变异:SNPSNP CNV;CNV;表观修饰:表观修饰:DNADNA甲基化甲基化RNA水平RNA水平表达谱:表达谱:mRN

2、AmRNA miRNA、ncRNA;miRNA、ncRNA;RNA突变、可变剪接RNA突变、可变剪接Protein水平Protein水平蛋白质表达蛋白质表达蛋白修饰蛋白修饰RNA结合蛋白RNA结合蛋白*AAACAAAC3系统化生物芯片平台Tissue Array TissueArray-based HLA Genotyping&SNP DetectionArray-based CGH DNADNA Methylation MicroarrayChIP-chipTranscription Factor ProfilingProteinRheumatic Autoimmune Antibody P

3、rofilingGene Expression Profiling MicroarrayRNAMicroRNA MicroarrayNeuronal Network Electrophysiological MonitoringElectrorotation Chip CellCentral Dogma4“生物芯片技术自90年代初期诞生以来,每年利用生物芯片技术公开发表有文献有数千篇。15年来,关于芯片技术的重复性还一直存在着争论。2006年9月,美国FDA组织51家学术机构和商业公司参与的MicroArray Quality Control(MAQC)芯片实验设计和数据分析结果发表在Natu

4、re Biotechnology 9月刊物上,共计有12篇。”MAQCs main conclusions confirm that,with careful experimental design and appropriate data transformation and analysis,microarray data can indeed be reproducible and comparable among different formats and laboratories,irrespective of sample labeling format.The data also

5、 demonstrate that fold change results from microarray experiments correlate closely with results from assays like quantitative reverse transcription PCR.5Nature Biotechnology,24(9):1140-1150(2006)6在什么情况下用到生物芯片技术?生物芯片的技术特点?1、高通量;2、半定量以下研究中,哪些情况适合使用生物芯片技术?A、检测某个药物处理细胞后,观察细胞所有基因的表达水平(全基因组表达谱)。B、检测食品中是否

6、有对人体有害的5 种微生物存在。C、检测HPV 病毒中的是否存在能引发子宫癌的11 种高危亚型。D、检测牛奶中是否有结核杆菌存在。E、检测在造血干细胞的分化过程中miR-223 是否有变化。7基因表达谱芯片技术基因芯片技术不是凭空产生的,它的检测原理基于核酸杂交,是从传统Northern blot或Southern blot基础上演变而来的。一种新的检测手段必须用传统手段加以验证,确认其可行性。用一个经典的实验模型:酿酒酵母的热激(Heat shock)反应,来演示基因表达谱芯片技术是如何检测基因表达变化的。大量的文献都报道过,酵母通过热激处理后,很多编码热激蛋白的基因表达上调,而一些编码核糖

7、体蛋白的基因表达下调。这些已知现象可以用来判断表达谱技术检测的准确性。8传统Northern blot方法制备(放射性标记)探针:cDNA(32P)dCTP,primer DNA polymeraseradioactive DNA probe RNA样品电泳、转印、杂交、显影:Dry and expose to X-ray film9转录水平检测的传统分子生物学技术传统的Northern blot方法来验证酵母细胞受热激后,HSP26与HSP12两个基因表达发生的变化。1与3是25培养细胞的RNA样,2与4是40培养细胞的RNA样。ABCDEFABCDEFab12 3 4 5 612 3 4

8、5 6a:40培养的酵母细胞芯片扫描图,b:25培养的酵母细胞芯片扫描图,Northern blot方法和芯片检测方法分别提取RNAmRNAmRNA通过酶学反应标记荧光素Cy5 标记cDNACy3 标记cDNA原始TIFF图片伪彩色标记产物混合组织样品和点制好的芯片进行杂交基因组测序把探针溶解在优化过的点样液中针对每个基因设计探针基因芯片点样仪双通道激光扫描仪扫描芯片数据分析基因表达谱芯片检测流程12表达谱芯片实验的过程 构建芯片:探针、点样、基片、固定、外标系统。样品标记:直接、间接、体外转录扩增标记。杂交:杂交仪、杂交严谨度的控制。扫描:扫描分辨率设置、伪色图。数据归一化:线性归一化、Lo

9、wess归一化。差异表达基因:数据类型、SAM软件。基因功能注释:MAS在线分析工具。13构建芯片:原核生物用cDNA 芯片对于原核生物,设计PCR 产物的cDNA 芯片比较合适。原因:A、原核微生物的RNA 不带PolyA 的尾巴,难以和rRNA 区分开,因此对mRNA进行特异性的标记比较困难,获得较好的芯片杂交信号是原核表达谱芯片技术中的主要矛盾;B、原核微生物基因组DNA 上所含内含子少,易于以基因组DNA 序列为模板设计PCR引物。14 通过生物信息方法可以实现高通量引物或探针设计。高通量自动设计PCR 引物的原则:A、引物针对靶基因具有序列的特异性;B、PCR 产物和其他的基因同源性

10、尽可能小。C、上游、下游引物之间不容易形成引物二聚体;D、每条引物自身不容易形成发卡结构;构建芯片:引物或探针设计15构建芯片:PCR产物扩增效果PCR扩增目的片断:例如以细菌基因组DNA为模板进行扩增,一般可选用100 l扩增体系。PCR扩增后,取2l进行琼脂糖电泳检测,电泳图的效果一般如下:绝大多数片断的特异性强,每个PCR产物带的亮度较Maker单条带亮度(此图中Marker每条带是50 ng)相当即可。16构建芯片:PCR产物纯化 PCR产物用等体积的异丙醇或者2倍体积的乙醇沉淀即可。异丙醇室温放置30min,乙醇-20放置30 min以上即可离心,4000rpm 4离心30 min。

11、弃上清,然后用100l 75乙醇洗一次,PCR产物沉淀风干。PCR产物溶于12 l水中,再取0.5 l电泳检测,看纯化过程中是否有丢失。此96孔PCR板转至点样的384孔板中用于点制芯片。17构建芯片:PCR产物纯化对于PCR 扩增产物,是否需要过柱纯化除去引物二聚体,引物二聚体残留是否会影响杂交信号?根据经验,PCR 产物不需要过柱纯化,某些时候,过柱纯化时由于各种商品化洗脱液中盐的成分不确定,可能导致PCR 产物难以在芯片上进行固定,这样反而造成了问题。残留引物二聚体和检测物种间一般没有同源序列,不会造成问题。18构建芯片:PCR产物纯化 异丙醇和Kit 过柱纯化点样效果:不同纯化方式对表

12、达谱芯片PCR 产物点样的影响。用异丙醇沉淀并纯化PCR 产物足以满足PCR 产品制备芯片的需求。当用过柱纯化PCR 产物时,可能由于Kit 所用的洗脱液中含有一些盐成分,导致DNA 点样的样点形状不好。19构建芯片:真核生物用长Oligo探针的芯片对于真核生物,若基因序列已知,设计长Oligo 探针的芯片比较合适。理由:A、真核生物的基因组比较复杂,基因家族间的同源性较高,设计Oligo 探针具有更好的特异性;B、真核生物的mRNA 含有PolyA 的尾巴,容易对mRNA 进行特异性的标记,在Oligo 芯片上获得较好的杂交信号已不是主要矛盾。20构建芯片:长Oligo探针设计原则 高通量设

13、计芯片上Oligo 探针的原则主要包括:A、探针设计在60-70 个碱基长度能保持杂交特异性和杂交信号强度的平衡;B、尽可能在靠近3 端1.5Kb 内设计探针(原因和RNA 的标记方法有关);C、不同探针之间的Tm 值相差不超过5;D、探针序列和其他基因同源性小于70;E、探针本身内部不能含有连续7 个相同的碱基PolyN。21构建芯片:点样液芯片点样过程中的最主要特点是点样体积非常小。防止点样针里的样品挥发而导致点样失败,这是点样过程的关键。例如,点样针一次取样,往往不超过0.3 l,而需要持续点多个点(可以多至上千个点)。最初点样的溶液是盐溶液,例如3SSC,磷酸盐缓冲液等,点样液容易挥发

14、。2222点样液用得较多的是50二甲基亚砜(DMSO)。分子结构如下:其中的氧原子可以和水中的氢原子之间形成氢键,使水分子不容易蒸发。但用DMSO 作为点样液,DNA 固定率较少,并且容易产生样点“空心点”现象。构建芯片:点样液2323构建芯片:点样液博奥研发的晶芯基因芯片点样液,其中含有核酸稳定剂、防水分挥发剂和粘度增稠剂等成分。能降低点制DNA 芯片时的漏点率,能够增加核酸在芯片上的固定效率,提高DNA 芯片上点杂交信号的强度和均匀性。适用于cDNA 和寡聚核苷酸芯片的点制。通过杂交比较点样效果:用晶芯基因芯片点样液具有点较小、信号较强、点形状均匀规则特点。50%DMSO晶芯基因芯片点样液

15、2424构建芯片:芯片制备方式 目前制备DNA 芯片主要有两种方式:A.在基片上直接合成DNA(原位合成)。例如Affymetrix 公司利用光引导原位合成方式;Agilent 公司利用喷墨(ink-jet)方式;LC Science 公司利用酸碱法合成等。一般分子生物学实验室不具备这种复杂的设备和技术。B.点样方式。先利用DNA 合成仪上合成Oligo探针(离线方式),或者制备PCR 产物,然后用精密机械手把核酸产物点样到基片表面上。这种方法所需要的硬件设备和操作技能容易被一般分子生物学实验室所掌握。并且,点制法是一个开放的平台,可以根据研究兴趣进行多种类型生物芯片的研发,适合实验室自行利用

16、生物芯片技术进行研究。2525构建芯片:芯片点制常见问题举例A.样点拖尾,针和基片之间不垂直B.样点太小(100 fold amplificationcRNAcRNA Fragmentation51NNNN.53Key reagents:N6/9 PrimerSuperScript II(逆转录酶)NNNN.TTTTT53cRNAAAAAAKey reagents:Klenow(DNA Pol.)dNTP Mix;Cy-dCTP3NNNN5Key reagents:OH-3NNNN55252有利于杂交动力学过程的产物大小9N随机引物引发,Klenow 酶进行标记反应后的DNA 片段主要分布在2

17、00 bp 左右。Klenow 酶对Cy5/3亲合性较好,很适合标记。左泳道是DL2000 Marker,由上到下:2 kb,1 kb,750 bp,500 bp,250 bp,100 bp.500 bp250 bp100 bp53基因芯片杂交条件:杂交严谨度杂交条件的严谨性(stringency):指杂交反应体系中,避免非同源性或部分同源性的核酸序列形成杂交复合物的严格程度。杂交严谨性的控制是核酸杂交的核心问题。主要与杂交反应的温度、离子强度和甲酰胺浓度有关。实际操作时,一般采用较低严谨性杂交以提高反应速率;以较高严谨性洗片(2SSC,0.2SSC)以尽量洗去非特异性结合和配对较差的探针,从

18、而提高杂交特异性。5454DNA熔解温度(Tm)DNA热变性过程中,双螺旋结构失去一半时DNA溶液体系所处的温度称为DNA的熔点或熔解温度(melting temperature,Tm)。核酸变性后,在260nm处光吸收值上升,称为增色效应(hyperchromic effect)。增色效应可用来衡量DNA变性的程度。当正好处于Tm温度时,DNA分子内50%的双链结构被打开,增色效应达到一半,在S型曲线上,Tm值对应于光吸收增加的中点处的横坐标。55基因芯片杂交条件:杂交温度 适当的杂交温度、洗膜温度是核酸分子杂交成败的关键因素之一。判断DNA:DNA 杂交体的Tm 值可用以下经验公式:(其中

19、L是杂交体链的长度(碱基对),P是错配的百分比。)5656杂交条件:(盐)离子强度 盐:高离子强度溶液中,其阳离子可中和DNA 链骨架上磷酸基团的负电荷,消除其间的静电斥力,有利于杂交分子的形成。一般杂交体系的离子强度为5SSC 或6SSC。在低离子强度下,核酸杂交非常缓慢,随着离子强度的增加,杂交反应率增加。此效应在低盐浓度(0.1 mol/L Na+)更明显,浓度每增加2 倍,反应速率增加510 倍。Na浓度主要由SSC溶液提供:应用:应用:高浓度的盐使碱基错配的双体更稳定,故测定不完全同源的交叉杂交测定不完全同源的交叉杂交时(例如猴子RNA样品杂交人芯片),必须维持较高的杂交反应盐浓度。

20、57DNA链磷酸基团的负电荷58杂交条件:甲酰胺浓度 甲酰胺:甲酰胺由于其分子结构的特点,它既是很强的电子供体电子供体,也是很强的电子受体电子受体。DNA 溶液中加入甲酰胺以后,甲酰胺分子和DNA 的碱基之间能形成氢键,破坏DNA 双链碱基之间原有的配对(尤其是错配尤其是错配),从而降低DNA 杂交体系的Tm值。59甲酰胺对DNA碱基配对的影响60杂交条件:如何设定杂交温度杂交温度选择还要考虑下列因素的影响:(1)RNA:DNA 杂交体的稳定性较DNA:DNA 的稳定性高,Tm 值应相应地增加1015。RNA:RNA 杂交体的Tm 值应相应地增加2025。因此采用RNA 探针时,加入适量的甲酰

21、胺以降低Tm 值是必须的。(2)寡核苷酸探针杂交反应的Tm值可用下式简单估算:Tm4(GC)2(AT)(3)错配率每增加1,Tm 值估算可相应地下降11.5。(4)寡核苷酸的杂交反应一般可以设定在比Tm 值低5进行。61杂交条件:甲酰胺浓度选择经验上,杂交液中加入1(v/v)的甲酰胺可以降低杂交体系Tm 值0.50.75。杂交可以参考选择的甲酰胺浓度:cDNA芯片:42 杂交,50甲酰胺;Oligo探针芯片:42 杂交,25甲酰胺;区分SNP的短探针芯片:42 杂交,15甲酰胺。62杂交过程静态杂交:把标记产物溶解在12l-80l 杂交液中,然后盖上盖玻片在水浴中恒温静止杂交过夜。静态杂交过程

22、杂交完全是依靠液体分子的布朗运动,杂交液中的靶分子和芯片上的探针分子通过随机碰撞发生的,杂交液的探针分子难以充分发生杂交;另外,还需要保持水浴锅的水平位置。芯片杂交仪杂交:许多公司生产的杂交仪或者需要较大的杂交液体积,导致探针浓度被稀释;或者需要额外的耗材,造成较高费用。博奥研发的三维旋转杂交仪BioMixer II,和静止杂交比较,不需要消耗更多的耗材;杂交液体积没有额外增加;并且BioMixer II 能促进盖玻片下杂交液的流动,使得杂交比静止杂交信号增强并均匀。63三维旋转杂交仪BioMixer II(B)和传统静止杂交(A)效果的比较A B6464基因芯片扫描:Cy5 和Cy3荧光特性

23、最大激发波长649 nm特征发射波长670 nm最大激发波长649 nm特征发射波长670 nm最大激发波长550 nm特征发射波长570 nm实际激发波长532 nm最大激发波长550 nm特征发射波长570 nm实际激发波长532 nm实际激发波长632 nm实际激发波长632 nmCy5 和Cy3 激发光和发射光谱。Cy5Cy365Cy3在532nm激发表现为绿色的背景这是一张由于清洗不干净造成的Cy3通道扫描背景过高的典型图片。66扫描分辨率的设置共聚焦扫描仪的扫描分辨率有多个精度可选,例如博奥生产的LuxScan扫描仪,扫描分辨率可以设定为5m,10 m,20 m和40 m。扫描芯片

24、时,一般扫描分辨率不低于芯片上杂交点直径的1/10。例如,杂交点的直径大小是150 m,那么要求的扫描分辨率小于15m,以便在一个点中至少有100个像素组成的数据,因此扫描分辨率选择10 m,足以满足后续数据分析的需求。6767扫描分辨率的设置180m180m芯片扫描时对扫描仪的分辨率要求是小于杂交点直径的1/10即可。图A是对一个杂交点的放大图,一个小方格就是一个象素,分辨率10 m;图B是芯片扫描的整体图。68饱和信号芯片扫描在信号采集时的采集装置一般是16位的光电倍增管(PMT),最高信号值为:216-165535;但也有采集装置是14位的PMT,最高信号值为214-116383。在一台

25、16位PMT扫描仪上,当一个点的杂交信号得到了65535的饱和数据时,此点的数据分析已经不准确了。在芯片上,一般要求信号饱和的点不超过全部点的5。69饱和信号70扫描芯片图片的可视化扫描仪扫描的原始图片是216灰阶的TIFF黑白图片,后续的数据提取都是来自此TIFF;为了方便芯片扫描图片的视觉判断,可以给图片不同信号强度区域或不同标记赋予不同颜色,这样产生了伪色图,例如彩虹模式图、红绿叠加图等。双通道芯片2个通道的扫描会产生2个杂交TIFF图片。当单独展示一张TIFF图片时,可以通过芯片图像分析软件,如博奥生物公司的LuxScan.3.0扫描软件,把不同的颜色赋予给TIFF图片上不同灰阶的点。

26、71彩虹模式图72红绿叠加图TiffCy5通道通道Cy3通道通道红绿叠加图73双通道芯片的数据归一化前提:先要选择芯片上的某些点,认为这些点Cy5 和Cy3 的荧光信号比值应该是接近1 的(不变化基因)。不同的数据归一化方法选择不同的点,主要包括四种:1)芯片上所有的基因;2)芯片上的看家基因;3)芯片上的外标;4)基因组DNA。74归一化信号点的选择目前认为在一些实验条件下,看家基因也会发生变化,实验者很难选择一定数目、表达完全不会发生变化的看家基因;另外看家基因表达水平往往比较高,难于对中低水平表达的基因进行归一化。利用芯片上的外标进行数据归一化比较合理,但要求实验者在设计芯片时在芯片上点

27、有足够数量的、并且代表不同杂交信号强度的外标,才能让按照外标作出的归一化结果能够代表芯片上的全部基因。而基因组DNA 由于结构复杂,带有大量的不表达序列,它得到的杂交信号往往比较弱,难于对整个芯片的数据进行归一化。目前应用比较多的是利用芯片上所有基因来进行数据的归一化。75线性归一化和非线性归一化利用芯片上所有基因来进行数据归一化方法,分为两种,线性归一化和非线性归一化。基本原理:设R-红色荧光信号强度,即Cy5 荧光信号的强度;设G-绿色荧光信号强度,即Cy3 荧光信号的强度;线性归一化方法认为:R=kG;可以衍生出等式:log2R/G-c=log2R/(kG);非线性归一化Lowess方法

28、认为:log2R/G-c(A)=log2R/(k(A)G);c(A)不是一个常数,而是一个与R、G 相关的变量,是通过Lowess对M vs.A 散点图拟合的函数。76Lowess归一化非线性归一化Lowess(locally weighted scatterplot smoothing)方法:log2R/G-c(A)=log2R/(k(A)G);引进参数M=log2R/G,A=1/2log2RG;一般当芯片上有少于10的基因表达发生变化时,可以认为M vs.A的散点图的分布趋向于M=0,用这种全部基因信号非线性归一化方法比较合适。可以通过统计学软件Splus语言或者R语言包中的Lowess

29、fit 命令来作出M vs.A 的散点图。77数据转换:Why log scale?对数转化后数据更接近正态分布。7878M-A 散点图Lowess归一化的基本思想是若没有系统误差的影响,R=G,则M vs.A 的散点图的分布应该趋向于M=0。数据归一化前后M-A 散点图比较(左:归一化之前;右:归一化之后)MMAA7979整张芯片上基因的归一化在利用芯片上全部基因的杂交信号来做归一化时,还需要考虑玻片不同杂交区域的影响,即空间位置的影响。一个芯片上的DNA 样品在点样时往往是由多根钢针点样,每一根针点的样就组成空间位置上相对靠近的一个小子阵。用上述方法认为每个小子阵上的基因(往往超过400

30、个)的Cy5 和Cy3 的荧光信号存在相同的系统误差,先做小子阵内部的归一化,再做不同子阵之间,即整张芯片上基因的归一化。8080数据类型:单通道荧光强度值数据根据不同的芯片平台和不同的实验设计得到的数据可能具有不同的类型,我们对常见的几种类型分别举例。例1:对于单通道芯片产生的表达谱数据,例如用Affymetrix 的芯片,对一组患有某种疾病的个体进行检测,同时检测另一组对照的正常个体,得到的荧光强度值数据如下所示:8181数据类型:双通道比值数据例2:对于双通道芯片产生的表达谱数据,例如用博奥人全基因组表达谱芯片,设置共同对照(Common Reference,CR)样品,对一组患病个体和

31、另一组对照个体进行检测,得到的比值数据如下所示:82用SAM软件挑选差异表达基因:界面 对数据进行归一化后,常用SAM软件挑选差异表达基因。83SAM过程:数据格式 癌与癌旁的样品各有12个,进行全基因表达谱芯片分析;选择非肿瘤组织的RNA混合做一个共同参照物,每个癌与癌旁组织都和共同参照物和芯片进行杂交。84用SAM软件挑选差异表达基因:SAM-Plot85通过SAM-Plot对差异基因的总体判断这是SAM manual里面给的3个例子,通过SAM plot散点图可以判断差异大小。每个例子分别输入1000个基因表达数据,进行Two Class unparied 数据分析(对照组和实验组各有4

32、列数据,共有8列数据)。(A)在Delta0.5,发现65个差异表达基因,FDR0.059;(B)基本上没有差异表达基因,在Delta0.5,发现2个差异基因,FDR0.65,也就是说,这2个基因中有1.3个是假阳性的;(C)有非常多的差异表达基因,在Delta0.3,发现800个差异基因,FDR0.029(尽管差异倍数可能很小)。86SAM结果输出87利用可视化工具展示所得到的差异基因在上面SAM分析的例子中,报告的差异基因数目是505个,要把这样的结果在文章中体现出来,就需要可视化工具。右图是用Cluster3.0对这505个数据进行聚类分析,再用TreeView软件进行展示。这张聚类图可

33、以很清楚地表示出所检测的24个样品中505个基因的表达状况。8888比值基因处理1/对照1处理2/对照2处理3/对照3A9.055.458.34B0.831.231.01C0.120.230.181 2 1 2 A AB BC C数据可视化:直观显示基因表达数据3.18 3.18 2.45 2.45 3.06 3.06-0.27-0.27 0.30 0.30 0.01 0.01-3.06-3.06-2.12-2.12-2.47-2.47 Log2(Ratio)数据可视化数据可视化89J.Cell.Physiol,2007,212:126136.可视化工具方便数据展示90可视化工具方便数据展示T

34、he Plant Cell,2006.18:651664.91表达谱芯片数据的注释 对大量的差异表达基因数据后如何进行分析,是一个一个基因去查文献,还是先进行批处理,找到分析的重点后再进行详细的分析?博奥开发的在线分子注释系统(MAS),可以进行如下分析内容:1、Pathway统计学分析,按照Pathway进行聚类2、GO terms统计学分析,功能分类作百分比图3、是否存在共表达情况4、是否可能受到miRNA的调节情况5、这些变化的基因和已知的疾病有什么关系92分子注释系统MAS:log inDownload detailedmanual here93对差异基因进行Pathway的注释得到差

35、异表达基因后,可以从统计学角度来考虑pathway 的重要性,以便生物学家在后续的生物学实验中能集中精力分析几个pathway 来确认生物学现象。对于模式生物,例如人、小鼠、大鼠、拟南芥、酵母等,可以利用KEGG,BioCarta,GenMAPP 等数据库中已有的pathway;对于非模式生物,特别是定制芯片,例如棉花、荔枝等物种,需要先进行序列的比对工作,根据非模式生物序列在核酸与蛋白水平上和模式生物的同源性比对,再利用比对的结果对非模式生物的序列进行pathway 的注释,并按照统计学重要性排序。94单看变化基因的数目而不观察富集度是不可取的Endocrinology,2006 147(1

36、):232-24695MAPK signaling pathwayEndocrinology,2006 147(1):232-2469696通过p值来体现基因的富集度算法:超几何分布(Hypergeometric Distribution)NMnm(M和n的交集)某物种在MAS库中收录的基因个数(基因组范围)特定Pathway包含的所有此物种基因数输入的基因中含有Pathway注释的个数特定Pathway包含用户输入基因的个数97Pathway 显著性分析Plant Cell,2006,18:651-664.98对差异表达基因进行Gene Ontology注释目的:通过对差异表达基因进行GO

37、terms 的注释,从统计学角度考虑GO terms 的重要性,以便生物学家对生物学实验的分子机制进行解释。对于模式生物,可以利用Gene Ontologoy 数据库中GO terms 进行解释;对于非模式生物,也需要先经过序列的比对后,再进行GO terms 的注释。当实验处理有多次时,还可以针对变化基因GO terms 的统计学权重进行聚类分析,以深入分析生物实验背后的分子机制。99对差异的基因进行GO terms 注释BMC.Bioinformatics,2006,7:426.100100GO terms统计学权重进行聚类分析当实验处理有多次时,还可以针对变化基因GO terms 的统计

38、学权重进行聚类分析,以深入分析生物实验背后的分子机制。BMC.Bioinformatics.6,168(2005).101GO terms分析的应用Guo,et al.,Rat toxicogenomic study reveals analytical consistency across microarray platforms.Nature Biotechnology,2006,24(9):1162-1169目的:用基因表达谱芯片研究植物来源的致癌物质的分子毒理机制。背景知识:Aristolochic Acid:多年的临床应用表明含有马兜铃酸的植物制品与肾中毒相联系;Comfrey ex

39、tract:多年的临床应用已经观察到紫草提取物里面的吡咯里西啶类生物碱(pyrrolizidine alkaloids)对肝细胞具有毒性。102用含有马兜铃酸的饲料喂养大鼠,同时设空白对照。取大鼠的肝脏、肾脏进行表达谱芯片分析,发现肝脏中变化的基因少于肾脏中变化的基因,因而认为肾脏是马兜铃酸致癌的靶器官。It was also determined that aristolochic acid-treated liver samples showed a relatively small difference in expression profiles when compared to th

40、eir tissue-matched control group.This result was reproduced across all platforms and is consistent with previous observations that kidney,not liver,is the target organ of aristolochic acid-mediated carcinogesis.Guo,et al.Nat.Biotech.2006,24(9):1162-1169马兜铃酸处理的肝脏马兜铃酸处理的肝脏马兜铃酸处理的肾脏马兜铃酸处理的肾脏103利用GO分析结果

41、解释化合物的毒性从紫草抽提物处理的大鼠肝脏组织变化的基因分析,发现101个有显著变化的功能类(GO),其中两个最值得关注:一个是铜离子平衡(GO:0006878);一个是维生素A代谢(GO:0006776)。而以前的药理研究发现吡咯里西啶类生物碱能降低肝脏组织中维生素A的水平,同时能增加肝组织中铜离子的水平。这些结果提示,含有吡咯里西啶类生物碱类植物,通过影响肝组织维生素A代谢和铜离子的水平造成毒性的。Examination of the 101 significant GO terms revealed at least two that were noteworthy:copper ion

42、 homeostasis(GO:0006878)and Vitamin A metabolism(GO:0006776).Dietary or medicinal exposure to several pyrrolizidine alkaloids-containing plants has been shown to result in decreased levels of vitamin A in the liver and increased liver levels of copper,but there is no indication that these effects ha

43、ve been observed in response to comfrey exposure.These results suggest that comfrey influences copper and vitamin A levels similar to other pyrrolizidine alkaloids-containing plants.104104从表达数据中挖掘共表达的基因功能相关的基因往往表现共表达模式,在不同处理因素和动态过程中表达都升高或降低。挖掘共表达的基因一般需要有较多的生物学实验,例如在一个时间梯度(不同时间点)内观察基因的表达变化情况。有这样的实验设计

44、和芯片数据,则可以挖掘共表达的基因。Dev.Cell 5,59-72(2003).105105表达谱数据中挖掘所检测样品的聚类关系利用芯片所检测的基因表达信息,能对所测样品进行分类,例如用主成分分析方法(PCA)对组织起源,不同化合物的作用机制或者病理组织类型进行分类。利用PCA 聚类方法对不同病理类型的样品进行聚类分析。Cancer Res.64,1255(2004)106106共表达基因的注释Zhou J,L,et al,Global genome expression analysis of rice in response to drought and high-salinity stresses in shoot,flag leaf,and panicle,Plant Molecular Biology,2007,63(5):591-608默认假设有4个基因共物理定位在1 Mb的染色体片段上,认为这些基因的转录起始位点相邻,甚至可能共用相同转录起始位点.107RT-PCR 验证芯片检测数据J.Biol.3,21(2004).108谢 谢谢 谢!

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服