1、wgMLST流行病学菌株分型的新标准BioNumerics是全球唯一集电泳数据、色谱数据、光谱数据、表型特征数据、基因芯片、基因组序列、氨基酸序列等多种生物信息数据格式存储和处理分析的软件平台,包括数据存储、数据分析和数据分享三大功能。优化整合不同基因组与表型来源的数据,方便用户进行数据分析管理并进行回归分析。引进业界领先的数据库引擎Oracle 和 Microsoft SQL Server,为大数据管理分析提供了前提。金云台是官方授权中文版BioNumerics 软件中国区总代理以及英文版经销商。在海量数据的网络采集、传输、处理、上报和分析统计、垂直搜索引擎核心技术、数据挖掘与分析利用、数据
2、远程比对、数据仓库建设、检验机构大型精密仪器数据自动采集等领域拥有国内领先的核心技术,并能够提供软件定制开发和运行维护为一体的完善服务体系。一、wgMLST数据分析简介多位点序列分型(Multilocus sequence typing,MLST)是一种基于序列的微生物分子分型手段,其技术原理是通过测定7个管家基因的序列,并根据每个位点序列的不同为其分配等位基因号,七个管家基因的等位基因号共同组成了细菌的序列型(Sequence Type,ST)。传统的基于7个管家基因序列的多位点序列分型在过去的15年中已经证明其在细菌分型领域中不可或缺的作用。致病菌进化速度快,耐药基因变化大,传统分型方式跟
3、不上疫情爆发的节奏,菌株高精度分型wgMLST,以其高精度、高可靠性的分型结果,成为流行病学菌株分型的新标准。wgMLST,全称为全基因组多位点序列分型(Whole Genome Multilocus Sequence Typing),是多位点序列分型(MLST)的一个拓展方法,由于wgMLST包含更多的基因位点(1500-4000),因此相较于传统的基于7个基因位点的MLST分型手段有着更高的精度及分辨率。随着二代测序数据成本的降低,基于二代测序数据的分型手段正在逐渐替代传统的分子分型手段。二、wgMLST数据分析内容1.原始下机数据处理 此步骤过滤测序质量值低的reads,保留高质量rea
4、ds,进行数据质控;2.样品组装 使用Velvet算法进行基因组组装,得到能反映样品基因组基本情况的序列文件,并对组装结果进行评价;3.等位基因ID获取 基于Assemblybased和Assembly free两种算法对基因组内的基因位点进行等位基因ID号的获取;4.功能注释 针对编码基因序列进行不同数据库的功能注释和致病及耐药分析等;5.进化分析 利用wgMLST数据构建高分辨率物种分型结果,对传染病的爆发进行解释,分析目标菌种的群体结构和进化规律,为疾病预防和控制提供数据基础;6.基因组可视化分析 结合基因组组分分析结果和功能注释结果,展示基因组的基础研究结果。三、wgMLST数据分析范
5、围目前我们向用户提供以下菌种的全功能的wgMLST分析,包括:Brucellaspp.Campylobactercoli - C. jejuniClostridiumdifficileCronobacterspp.EnterococcusraffinosusEscherichiacoli / ShigellaKlebsiellaoxytocaKlebsiellapneumoniaeLegionellapneumophilaListeriamonocytogenesMycobacteriumtuberculosisNeisseriagonorrhoeaeSalmonellaentericaStaphylococcusaureus