收藏 分销(赏)

细菌高通量数据荟萃分析的可行性研究.pdf

上传人:自信****多点 文档编号:734722 上传时间:2024-02-27 格式:PDF 页数:8 大小:3.47MB
下载 相关 举报
细菌高通量数据荟萃分析的可行性研究.pdf_第1页
第1页 / 共8页
细菌高通量数据荟萃分析的可行性研究.pdf_第2页
第2页 / 共8页
细菌高通量数据荟萃分析的可行性研究.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、基金项目:四川省科技厅应用基础重点项目()西华师范大学博士科研启动项目()四川省自然科学基金项目()作者简介:肖海钰 女硕士研究生 研究方向为微生物生态学:.通讯作者 男教授博士 研究方向为微生物生态学和微生物资源学:.收稿日期:细菌高通量数据荟萃分析的可行性研究肖海钰 李 蕾 王 琳 秦明森 唐 贇(西华师范大学 生命科学学院四川 南充)摘 要 细菌作为重要的分解者对于生态系统功能至关重要其群落多样性一直是生态研究的热点 通过荟萃分析整理已发表的细菌高通量数据已经取得一些重要的全球性研究结果 这些荟萃分析的核心是将不同引物来源序列提取统一区段进行细菌群落分析但该方法的可行性和准确性还一直未被

2、探究 使用了含有三种引物扩增的同一细菌 高通量数据分析了不同引物和提取统一区段后细菌群落情况 结果显示不同引物以及提取统一区段后得到细菌群落组成和多样性显著不同且提取同一区段后的群落主要受原始引物的影响较大 结果表明细菌高通量数据荟萃分析中引物差异会影响其统一分析的群落结果荟萃方法需要慎重使用关键词 高通量测序荟萃分析扩增引物 截取引物中图分类号.文献标识码 文章编号 ():./.(.).细菌()作为 最 重 要 的 微 生 物 类群其分布涵盖地球主要生境包括各类极端环境参与各生境中的物质和能量循环对于维持生态系统的功能和稳定具有极其重要的作用 据估算目前仅约 的细菌被详细调查研究 测序技术的

3、兴起为细菌多样性研究带来了重要变革第二、三代高通量测序的普及和应用导致更多的细菌种类被发现其更多的生微生物学杂志 年 月第 卷 第 期 .态功能正不断被揭示 随着、等高通量数据库的开放以及、等高通量数据分析软件的完善通过收集已发表的细菌高通量数据进行整理、再分析可以打通不同研究的壁垒扩大了其研究尺度取得了一些全球性的研究成果 一部分荟萃分析()对细菌高通量数据采取了类似的处理策略例如 等使用/引物剪切不同引物来源的细菌序列得到目标 区段用以研究全球污水处理厂中细菌群落和代谢功能 等利用 个全球数据集通过对目标序列进行剪切提取得到了细菌 中 区段序列最终确定了全球不同生境中细菌群落情况而 等针对

4、主流的细菌高通量注释数据库使用特定序列将其 中的 和 区段提取出通过分析将不同数据库中细菌种类进行统一注释为人类肠道细菌群落的探究提供了重要参考 这些荟萃分析的核心是将不同来源的原始序列先进行标准化即用同一序列(通常为细菌特定引物可以理解为伪“引物”)对序列进行剪切提取得到统一区段序列之后进行再分析 然而这种剪切得到的目标区段(可称“伪”区段)与“真”引物扩增得到的区段是否存在差异这一核心问题在上述研究中均未被考虑过 避免讨论该问题将忽略不同引物所造成的测序影响从而影响以上研究结果的准确性 为此本研究使用了 个包含、以及 区段的 高通量测序数据并使用 平台比较了 和 串联区截取得到的“伪”区段

5、与“真”区段(即原生 扩增片段)所得到的细菌群落来探究提取细菌统一扩增区段的荟萃分析方法的可行性和准确性该研究能为今后类似分析方法提供重要的参考 材料与方法.材料使用 等测定的 个海水样品中的细菌 数据该数据已上传至 接收号为 该数据集包含四对不同引物的测序结果选取了其中、以及 区段的高通量数据进行分析对应的测序引物信息如表 所示 为排除较低测序对后续结果的影响将包含任意测序深度低于 的样品剔除共得到 份高通量数据表 扩增 不同区段的引物信息 目标区段引物名称引物序列()扩增长度/.方法所有高通量分析使用(.)平台进行主要步骤:第一训练分类集()使 用 (.)全长数据库作为参考数据库 从全长数

6、据库中截取目标区段提高物种分类精度主要使用 剔除原本重复序列和截取引物后目标序列的重复序列使用 命令分别截取对应引物序列设置 的运算通量来训练细菌分类数据 集 第 二 合 并 双 端 测 序 结 果 使 用.按照 .的参数进行合并先合并序列能避免在下一步引物剪切后各双端剩余序列过短影响序列合并 第三剪切前段引物以保留 区段该步骤主要对 区段使用 引物进行剪切保留后端序列即为“伪”区段 使用 剪切对应引物 第四细菌群落分析 该分析主要分为三部分:单独分析各扩增区段即对 区段、区段以及 分别截取至、以及 长度后进行单独分析 单独分析 以及区段截取后的 区段包括 区段剪切后的“伪”区段(剪切至 )以

7、及截取至 的 区段(剩余序列即为 区段)将所有 区段整合至一起进行分析即将所有 区段序列合并后截取至 进行分析 序列使用 进行嵌合体筛选和划分扩增子序列变异(期 肖海钰等:细菌高通量数据荟萃分析的可行性研究 可简单理解为 相似度进行聚类)使用 命令结合对应区段的训练分类集进行细菌 物种鉴定其中置信度最低为.最后将所有细菌矩阵 数抽平至 以避免不同测序深度对结果的影响.数据分析细菌群落多样性、群落组成等均在 语言平台分析完成主要使用“”程序包 多样性差异使用配对的 检验进行采用最小二乘法()拟合多样性和相对丰度之间的线性关系使用 进行群落相似性分析 结果与分析.不同扩增片段下细菌群落差异同样测序

8、深度下不同扩增区段得到的细菌各纲相对丰度存在明显差异(图)得到的多样性也有显著不同(图)其中扩增 区段得到的细菌丰富度()最高区段次之 群落均匀度()也有显著差异扩增 区段的均匀度最高 区段次之(图)三种扩增区段下细菌丰富度相关性显著(表)其中 与 扩增下细菌丰富度相关程度最高(表)就均匀度来看 与 扩增下细菌群落均匀度相关性最高(表)通过对群落相似性距离的相关性分析发现三种扩增区段所构建的群落存在着一定程度的相似其中扩增 与 之间相似程度最高(表)进一步对丰度最高的三种细菌纲之间的相关性分析发现 和 扩增得到的三种细菌纲相对丰度的相关性最高(表)图 不同引物下细菌组成和多样性的差异.:主要细

9、菌纲:丰富度:均匀度 下同:.微 生 物 学 杂 志 卷表 不同引物或剪切区段细菌多样性相关性 比较区段目标区段丰富度均匀度原始区段 .原始区段与 区段 ().().所有 区段().()().().注:后面括号代表原引物扩增区段下同表 不同引物和剪切区段细菌群落组成的相关性 比较区段目标区段群落相似性原始区段 .原始区段与 区段 ().().().所有 区段()().().表 不同引物和剪切区段主要细菌纲丰度的相关性 比较内容目标区段原始区段 .原始与 区段 ().().所有 区段().()().().同种引物下不同区段的细菌群落差异通过对 以及 区段进行剪切得到“伪”区段分析发现“伪”区段主

10、要细菌纲的组成与原始区段差别不大(图)但物种多样性差异明显(图、)剪切后的“伪”区段丰富度高于剪切前区段(图)所得的均匀度低于剪切前区段(图)剪切前后的区段所得的细菌多样性之间相关性显著但区段剪切前后均匀度相关程度相对较低(表)剪切前后细菌群落之间具有极为显著的相关性其中 区段剪切前后群落相似性更高(表)且主要的三种细菌纲相对丰度之间相关性也高于 剪切前后(表).同一区段下不同引物细菌群落差异将来自三种不同引物的 区段合并分析发现细菌纲的相对丰度存在明显差异(图)群 期 肖海钰等:细菌高通量数据荟萃分析的可行性研究 落多样性也有显著不同其中 截取后的 区段细菌群落丰富度最高(图)扩增 区段所得

11、的均匀度最高(图)截取后的 区段与 截取后的 区段细菌群落丰富度相关性最高 区段与 截取后的 区段均匀度相关性最高而 截取后的 区段与 区段均匀度并无明显相关关系(表)不同扩增序列 区段下细菌群落间具有极为显著的相关性其中来自 与 的 区段群落相似程度最高(表)该结果与群落排序结果一致(图)且来自 与 的 区段细菌纲相对丰度相关性最高(表)图 剪切至 区段后细菌组成和多样性的差异.微 生 物 学 杂 志 卷图 不同引物的 区段细菌组成和多样性的差异.图 不同引物的 区段细菌群落 排序.()椭圆圈代表对应颜色细菌群落的 置信区间 讨 论 基因的可变区具有属或种的特异性通过单一可变区或可变区串联测

12、序可以确定微生物物种组成 然而研究发现不同可变区或串联组合测序所得到的结果均相同 本研究不同引物扩增不同区段下在纲水平上其群落组成具有较大差异一方面有可能来自于不同可变区的鉴定差异另一方面不同细菌可变区的引物有不同的扩增偏差 本研究通过对不同扩增引物进行剪切得到统一的 区段数据分析结果来看同种引物下剪切前后的群落主要细菌纲相对丰度几乎相同 该结果表明不同区段引物扩增导致的群落差异并非由不同可变区对细菌种鉴定差异引起而是由引物特异性导致 另外 等研究表明、这两个可 期 肖海钰等:细菌高通量数据荟萃分析的可行性研究 变区串联组合对细菌的鉴定准确性较高而本研究中 区段引物扩增后细菌丰富度最高表明即使

13、 区段引物/受到地球微生物组计划()的推荐但该引物有可能会高估细菌多样性并损失细菌物种鉴定的准确性本研究使用了相似度阈值在的 进行代表序列划分该分析中单个碱基的差异将导致划分出新的 基于该分析方法理论上序列长度越长 变异的 也会越多 本研究和 剪切至 区段后部分前段()或后段()的可变区序列被移除理论上序列变短将导致检测到的 数量下降而实际结果与此相反这与理论结果不相符这是因为 会将丰度极低的物种当做测序错误而剔除部分 前段和 后段涵盖不同碱基的低丰度序列被剪切后剩余 区段的低丰度序列将被被识别为“较高”丰度序列从而纳入分析最终提高了群落的丰度 剪切后群落更低的均匀度也能佐证部分低丰度的序列被

14、纳入最终群落分析合并“伪”和“真”区段序列统一分析发现不同引物的同段序列群落组成和多样性具有显著差异该结果表明通过截取同一段序列进行荟萃分析的方法受原始引物的影响比较大不能进行整合分析 但考虑到群落组成的显著相关性该方法对于群落组成分析具有一定的可行性本研究主要对细菌纲进行了分析而纲的分类鉴定来自于更细的种属分类结果细菌纲的差异能够体现其种属注释结果的差异巨大 总之本研究发现不同引物对于群落结构和多样性的调查结果均会产生显著影响采用序列截取的方法得到同一区段的荟萃分析也会引入引物差异其结果值得重新分析考虑部分真菌、原生生物等其他微生物高通量数据的荟萃分析结果是否会引入引物误差还需要更多的研究来探讨参考文献:.():.():.():.():.():.():.():.():.:.:.:.:.():.():.():.():.:.():.:微 生 物 学 杂 志 卷.():.:.:.:.():.():.:.:.薛毅 陈立萍.统计建模与 软件.北京:清华大学出版社:.朱诗应 戚中田.扩增及测序在细菌鉴定与分类中的应用.微生物与感染 ():.刘赛.基于 序列可变区的微生物物种鉴定及分析.西安:西安电子科技大学.刘瑛 张琼琼 张蕾 等.不同 高变区选择对细菌性阴道病菌群研究差异比较.现代妇产科进展():.():.():.():.():.:.期 肖海钰等:细菌高通量数据荟萃分析的可行性研究

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服