ImageVerifierCode 换一换
格式:PPT , 页数:37 ,大小:4.48MB ,
资源ID:10038991      下载积分:12 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10038991.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(GEO数据库简介.ppt)为本站上传会员【快乐****生活】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

GEO数据库简介.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,GEO(Gene Expression Omnibus,),数据库简介,报告人:沈健,2014.3.8,1,近几年来,随着分子生物学技术的发展,,微阵列芯片技术,已成为生物学研究最重要的实验之一,尤其是,基因芯片,的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。,2,基因芯片发展历程,(,DNA&RNA,印记杂交),(斑点印迹法),3,基因芯片概述,基因芯片(,DNA,芯片)是通过微阵列技术,根据核酸杂交

2、的原理,将大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布来进行分析。,4,基因芯片技术流程,5,基因芯片技术流程,6,基因芯片检测结果,7,什么是,GEO,数据库,随着微阵列芯片技术尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。迫切需要一个统一管理的公共数据库。,基因表达数据库,(Gene Expression Omnibus,GEO),隶属于美国国立卫生研究院的,NCBI,。,GEO,是当今最大、最全面的公共基因表达数据资源。,网址,:,www.ncbi.nlm.nih.gov/geo/,8,GEO,数据库的构成,1.,用户

3、提交的原始数据,2.GEO,数据库整理后的数据,9,平台(,Platform,),平台是描述一联串在特定实验中被检测或被定量分析的因素,同一个提交者、许多样本有关,是,关于用于以高通量方式检查样本的物理试剂的信息。,比如寡核苷酸探针组,cDNA,SAGE标签,抗体等。,10,平台(,Platform,),平台数据包含阵列或序列以及阵列平台的简要描述,每一个平台都分配了一个特有的检索号,GPL*,。,例如平台,GPL341,:,www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL341,11,样本(,Sample,),样本是指以一个平台为基础、描述某个杂交

4、实验或者实验条件的所有特征因素的大量测量信息,即关于被检查的,mRNA,样本,实验条件,和实验产生的基因表达测量数据信息。每个样品有一个而且只有一个必须先前被确定的亲代平台,同一个提交者,一个平台和许多系列有关。,12,样本(,Sample,),样本数据描述了每个样本的操作环境、处理方法和分离出的各个成分的丰度测量。每个样本均分配了一个特有的检索号,GSM,*。,例如样本,GSM81022,,www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc,=GSM81022,13,系列(,Series,),系列是把构成某个实验的相关样本集中到一个有生物意义的数据集,同时可

5、能还收集一些已被递呈者注明的重要基因或者分析结果纲要,即样本收集,样本是如何相关的,如何排序的,分析是如何进行的,和聚类数据是如何获得的信息。一个系列中的样品是通过某一共同的属性联结在一起的,同一个提交者,许多样本有关。,14,系列(,Series,),系列数据将一系列相关的样本联系起来,提供了整个研究的关注点和描述,也包含了描述提取数据、简要结论和分析的表格。每个系列均分配了一个特有的检索号,GSE,*。,例如系列,GSE3541,,www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc,=GSE3541,15,数据集组(,DataSets,),GEO存储的是一

6、个分类广泛的、经过多种手段处理和不同方法分析的高通量实验数据。为了说明这些内容,GEO还增添了一个辅助分析工具,该工具可以把被提交的样本归纳集中到有生物学意义和在统计学上可比较的GEO数据集组(GEO DataSets),,能,提供关于一个实验的相关梗概,以此作为下游数据挖掘和数据显示工具的基础。,GEO,数据集组(,Datasets,)储存了所有的元数据,提供了,GEO,数据以“实验为中心”的主要观点。,数据集组的检索为,GDS*,。例如:,GDS2225,.,16,表达谱(,Profiles,),表达谱数据储存了来自于DataSets基因表达谱信息。每一个表达谱都表现为一个能反映一个数据集

7、组中所有样本的基因表达量的统计图。,GEO 表达谱(Profiles)储存了单个基因表达的数据资料,提供了GEO数据以“基因为中心”的主要看法。,17,数据集组和表达谱的关系,在GEO DataSets中每个数据集组个体都各自确定一个实验,而在GEO Profiles中每个数据集组都对应多个表达谱个体。,对平台上的每个基因(比如基因,A,),有多个样本)测量值。多个相关样本构成一个数据集,从中可以产生单个或多个基因的表达谱比较图。,18,GEO数据的数据检索方法,从,GEO,数据库主页面,右侧找到搜索栏,直接输入要查找信息的关键词或者检索词,如“,mir29a”,或者“,GDS2225 AND

8、fto,”,,就会搜索到相应的,DataSets,和,Profiles,。,从主页面右侧直接打开库浏览器,从中按照不同的“系列”、“平台”、“样本”、“物种”、“历史”来进行选择需要的数据类型。,直接从,GEO,数据库的,ftp,服务器下载。,ftp:/,ftp.ncbi.nlm.nih.gov,/geo/,19,GEO数据的数据检索方法,直接从,NCBI,主页,用,Entrez,进行检索,。,GEO,数据主要存放在,GEO,DataSets,和,GEO Profiles,两个数据库内。,Entrez,是,NCBI,建立的生物医学数据库集成检索系统。,Entrez,集成系统的最大特点是通过任

9、何一个数据库检索出的信息可直接链接到,Entrez,其它数据库并找到相关的检索结果。,20,GEO数据的数据检索关键词,GEO,可和其他,NCBI,数据库一样用标准,关键词,的方法和基于文本布尔检索、基于序列检索、基于特有表达行为挖掘检索或结合这些参数来进行检索查询,例如:在,GEO DataSets,中可以用,检索词“,prostate cancer AND humanOrganism”,寻找有关人类前列腺癌微阵列实验数据集。,21,GEO数据的数据检索关键词,例如:在,GEO Profiles,数据库中可以用,检索词,ftoGene Symbol AND(Smok*),搜索所有与吸烟相关并

10、包含肥胖基因的相关实验的基因表达谱。,22,GEO数据的处理,以数据集组,GDS402,为例来介绍一下GEO数据库提供的一些数据挖掘分析工具。,非加权组平均法聚类小图,实验数据下载,数据分析工具,23,Find genes,:,Find gene name or symbol,:直接查找数据集组中该基因的基因表达谱。,Find genes that are up/down for this,condition(s,),:可以根据选择的实验筛选条件,来找到一系列随该筛选条件有较明显表达差异的基因表达谱。,数据分析工具1,24,基因表达谱图,以,Fto,(肥胖基因)在二型糖尿病与肾脏功能试验中的表

11、达谱为例:从原始样本记录中提取的基因表达值以红色的条形柱表示。蓝色条形柱代表内部样本的百分等级信息,以提供该基因与阵列上所有其它基因相互比较的相对表达水平值。,改变实验条件对数据进行重新排列。,点击各个样本,可以打开相关样本的页面。,25,数据分析工具2,2.,Compare 2 sets of samples,:,选择比较方式和显著性水平,选择,A,和,B,两组样本组,进行,A,、,B,样本组的比较,查看两组基因可供比较的表达谱。,26,数据分析工具3,3.,Cluster heatmaps,聚类分析图(,Cluster analyses are one of the most powerf

12、ul methods to mine and visualize high-dimensional data.,)包含三种聚类算法:,层级聚类方法:(,Single-Link:,最近距离、,Complete-Link,:最远距离、,Average-Link,:平均距离),分散性聚类方法:,K-,Medioids,算法(特点:用类中的某个点来代表该聚类;优点:能处理任意类型的属性;对异常数据不敏感),K-Means,算法,(特点:聚类中心用各类别中所有数据的平均值表示;优点:应用最为广泛;收敛速度快;能扩展以用于大规模的数据集;缺点:倾向于识别凸形分布、大小相近、密度相近的聚类;中心选择和噪声聚

13、类对结果影响大),按基因处于染色体上位置来聚类,27,数据分析工具3,可以对聚类图的聚类方法、高低表达状态颜色重新进行选择。,在聚类图中框选其中一部分,可以以,txt,格式下载这一部分基因数据,也可以产生框选的这部分基因对不同样本的表达量的比较图。还可以在,GEO Profiles,库里对这些基因进行比较。,28,数据分析工具4,4.,Experiment design and value distribution,(箱线图),a box plot,displaying the distribution of expression values of each Sample within a

14、DataSet.The plot is useful for determining whether the DataSet is normalized,i.e.,the value distributions are median-centered across Samples.,29,GEO BLAST,可以在,GEO,核酸数据库中进行序列比对。,30,GEO2R工具,GEO2R,is an interactive web tool that allows users to compare two or more groups of Samples in a GEO Series in o

15、rder to identify genes that are differentially expressed across experimental conditions.Results are presented as a table of genes ordered by significance.,Unlike GEOs otherDataSet analysis tools,GEO2R does not rely on curated DataSets and interrogates the original Series Matrix data file directly.Th

16、is allows a greater proportion of GEO data to be analyzed in a timely manner.,GEO2R,能利用开源软件,R,平台和,bioconductor,进行数据处理。,31,基因芯片数据分析软件,bioconductor,和,R平台,MATLAB BioinformaticsToolbox,32,利用,GEO2R,比较同一系列中不同样本中的基因表达量差异,33,利用,GEO2R,求对比组的各样本中基因表达值在样本中的分布状况。(包括箱线图和可供导出的数值),34,通过输入实验平台的某个指针项目,ID,,可以直接检索到该指针对应的基因在不同样本中的表达谱图。,35,GEO2R程序在R平台上运行,36,Thanks,37,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服