1、 .():/.:./.韩霜 徐浩 余静雅 等.藏茵陈基源植物皱边喉毛花的全长转录组信息分析.广西植物():.“”.():.藏茵陈基源植物皱边喉毛花的全长转录组信息分析韩 霜 徐 浩 余静雅 韩 赟 张发起(.中国科学院西北高原生物研究所 高原生物适应与进化重点实验室 西宁 .中国科学院大学 生命科学学院 北京 )摘 要:皱边喉毛花为藏药藏茵陈基源植物之一其包含丰富的药用成分 为进一步了解皱边喉毛花转录组丰富其基因注释、代谢通路等遗传信息该研究利用 测序平台对皱边喉毛花叶片进行全长转录组测序 结果表明:()全长转录组测序共获得 的高质量数据对 个环形一致性序列()序列进行聚类和去冗余最终获得 条
2、高质量的全长转录本()与 个数据库比对后共有 条转录本注释成功其中注释到 数据库的转录本最多有 条 条转录本成功注释到 数据库中共有 个子类 条转录本注释到 数据库中涉及 个主要通路和 个子通路 条转录本注释到 数据库中按分子功能、生物学过程和细胞成分 大类对注释成功的转录本进行分类()分析共鉴定到 个 其中单碱基重复最为丰富共检测到 个转录因子和 个长非编码()而注释到转录本最多的转录因子家族是 ()筛选出 条与单萜类及黄酮类化合物合成相关的转录本 该研究结果丰富了皱边喉毛花的转录组信息为进一步筛选皱边喉毛花药用成分合成相关的关键基因提供了重要的遗传资源关键词:皱边喉毛花 全长转录组 代谢通
3、路 转录因子 长非编码 中图分类号:文献标识码:文章编号:()“”(.):“”.:()收稿日期:基金项目:第二次青藏高原科学考察研究项目()青海省科技国际合作专项()第一作者:韩霜()硕士研究生主要从事高山植物多样性研究().通信作者:张发起博士研究员研究方向为高山植物多样性().().().:.().().().:藏茵陈是青藏高原藏药八珍之一龙胆科植物是藏茵陈入药源植物中的主要植物多以川西獐牙菜、湿生扁蕾、椭圆叶花锚和喉毛花属植物入药常用于热症、肝胆病及血液病等疾病的治疗(唐丽等)近年来的研究表明这些基源植物包含丰富的药用成分主要为环烯醚萜、黄酮类化合物在保肝、抗氧化、抗病毒等方面具有显著效
4、果(延玺等董天骄等杨青松等)龙 胆 科()喉 毛 花 属()植物是藏茵陈基源植物之一(钟国跃等)对喉毛花属植物的研究目前主要集中在细胞学、胚胎学、生态学、系统发育研究及天然产物学上(刘建全和何廷农张婵等刘 小 翠 等 .刘 真 等)刘真等()在长梗喉毛花的化学成分研究中发现 个化合物其抗炎活性较高并对人体癌细胞株具有抑制作用 乔涌起等()在长梗喉毛花植物中分离得到正丁醇化学成分为进一步深入研究其化学成分奠定基础 然而有关喉毛花属植物的基因注释信息尚未见报道限制了对次级代谢产物合成相关代谢通路及功能基因的研究 因此需要利用测序技术丰富喉毛花植物的转录组遗传信息随着测序技术的发展越来越多的学者将高
5、通量测序技术应用到植物转录组研究(.朱兴正等)二代测序读长的限制导致所拼接得到的转录本不够完整而三代测序技术正好弥补了这一缺点其能够完成长读长测序测序过程无需打断严格执行 样品提取与检测、建库及测序等环节的工作最终得到高质量的全长转录本信息(王瑞娴和李川张子敬等)对没有参考基因组的植物而言全长转录组()测序为其研究提供了可能解决了转录本拼接较短、信息不完整的难题(赵陆滟等)因此三代测序技术成为深入挖掘基因组数据的有效手段之一(赵陆滟等)近年来有许多学者研究了青藏高原地区药用植物的全长转录组 在这些研究案例中对老芒麦()的转录组解析成功并挖掘到其落粒相关候选基因为筛选低落粒老芒麦新品种提供了参考
6、(张俊超)丹参()的全长转录组揭示了丹参酮二萜类化合物的生物合成的相关基因(.)蒙 古 黄 芪(.)全长转录组解析了次生代谢产物生物合成的相关基因(.)这些研究案例说明全长转录组对药用植物关键基因的挖掘具有显著优势为进一步研究药用植物的功能基因提供了新的思路和参考喉 毛 花 属 的 皱 边 喉 毛 花()为青藏高原特有植物()目前对皱边喉毛花的研究主要集中在系统发育研究上 为进一步了解喉毛花属下物种植物体内的次级代谢产物应对相关转录组进行深入研究本研究以皱边喉毛花为对象基于 测序平台对其全长转录组进行测序获取的数据用于功能注释、可变剪切分析、分析、转录因子分析及长非编码 等分析 通过与公共数广
7、 西 植 物 卷据库比对筛选药用相关成分合成相关的代谢通路和转录本 全长转录组能够为皱边喉毛花药用成分合成相关的关键基因的筛选提供重要的遗传资源材料与方法.试验材料新鲜幼叶采集于海南藏族自治州共和县(地理坐标为.、.海拔为 )采集后迅速置于液氮罐中保存后将其转移至 的超低温冰箱中用于后续 提取凭证标本()存放于中国科学院西北高原生物研究所青藏高原生物标本馆().方法.提 取 和 文 库 构 建 采 用 ()试剂法(.)提取皱边喉毛花的总 琼脂糖凝胶电泳检测 降解程度及污染情况并评估其质量和完整性 检测合格的 样品用于构建皱边喉毛花全长转录组测序文库 具体操作如下:在反转录酶的作用下以 为引物、
8、目标 为模板进 行 反 转 录 通 过 低 循 环 扩 增 全 长利用 /末端修读及加()尾 试剂盒及 用于测序接头的连接 建好的文库采用(公司英国)测序平台进行测序.数据处理测序完成后对原始数据进行过滤去 除 接 头 以 及 低 质 量 的 采 用 软 件.(:/./)进行过滤和处理 参数设置:(最小长度为 )(最大长度为 )(最小的 数为)利用.文件得到环形 一 致 性 序 列()对其进行分类搜寻并聚类 序列得到 序 列 利 用 软 件 对 得 到 的 序列进行校正获得高质量的全长优化序列()用于后续分析最终统计得到 有 效 数 据 为 提 高 数 据 的 准 确 性 利 用 软件()对转
9、录本进行校正生成校正序列()利用 软件(.)对校正后的转录本进行冗余分析.全长转录组序列分析对去冗余后的序列进行基因功能注释所使用的数据库包括非冗余蛋白数据库(.)、蛋白质家族域数据库(.)、蛋白质真核同源数据库(.)、蛋白质原核同源数据库(.)、东 京 基 因 与 基 金 组 百 科 全 书(.)、基因本体论数据库(.)、核酸序列数据库()和 数 据 库()等以此获得更全面的基因功能信息.全长转录组结构分析利用 .软件(参数设置:)对皱边喉毛花进行转录因子()预测(.)利用().软件 检 测 简 单 重 复 序 列 标 记()设置单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸及六核苷酸的最
10、少重复次数分别为、其余参数默认(.)利 用 (.)、.(.)、.(.)软件以及 数据库(.)对 测序数据进行编码潜能预测(参数设为默认)获得的长非编码()用于后续分析结果与分析.全长转录组测序及组装经 ()测序共获得 的 原 始 数 据 对 其 过 滤 后 获 得 个 基于.文件获得 个 序列 长度为 最 期韩霜等:藏茵陈基源植物皱边喉毛花的全长转录组信息分析大长度为 最小长度为 平均长度为 (表)经分类获得 条 序列 长度为 最大长度为 最小长度为 对其聚类后获得 条 序列最大长度为 最小长度为 长度为 对 序列进行校正后获得 条校正序列 长度为 我们对冗余前后的序列长度频数分布情况进行了统
11、计(图)表 测序数据统计 类别总数最小长度()最大长度()平均长度()长度()环形一致性序列 优化序列 校正序列 图 皱边喉毛花全长转录组 和 长度分布图.全长转录组功能注释共有 条转录本成功注释到 个数据库中其中注释到 数据库的转录本最多有 条注释到 数据库的转录本最少有 条(图)、条转录本分别注释到 数据库和 数据库中 条转录本注释到至少一个数据库中 条转录本注释到所有数据库中 从不同数据库中选择 个常用的数据库进行韦恩图绘制(图)图 转录本注释结果.图 转录本功能注释韦恩图.注释与 数据库比对后共有 条基因被注释成功 按 分类可分为 广 西 植 物 卷个类型(图)其中注释到只有一般功能预
12、测(条)、翻译后修饰、蛋白转运(条)和信号传递机制(条)的基因最多 然而细胞活性(条)和未命名蛋白(条)注释到的基因最少.加工和修饰.染色体结构和动力学.能源生产与转化.细胞周期调控、细胞分裂、染色体分离.氨基酸转运和代谢.核酸转运和代谢.碳水化合物转运和代谢.辅酶转运和代谢.脂类转运和代谢.翻译、核糖体结构和生物发生.转录.复制、重组和修饰.细胞壁/细胞膜生物发生.细胞活性.翻译后修饰、蛋白转运.无机离子转运和代谢.次生代谢物合成、转运和代谢.只有一般功能预测.未知功能.信号传递机制.细胞间运输、分泌物和囊泡运动.防御机制.细胞外结构.未命名蛋白.核结构.细胞骨架./.图 转录本 注释结果.
13、注释 是描述基因功能的一套分类系统可全面描述生物体中基因和基因产物的属性()共有 条转录本注释到了 数据库根据注释结果对得到的转录本进行分类(图)注释到生物过程、细胞成分、分子功能 大类分别有 个、个、个子类共 个子类 然而注释到细胞杀死(条)和行为(条)的基因最少 在细胞成分中注释到细胞和细胞部分的基因最多(均为 个)而突触(条)、突触部分(条)和细胞连接(条)子类中涉及的基因最少在分子功能中注释到结合(条)和催化活性(条)的基因最多而金属伴活动分子功能调节器(条)子类中涉及的基因最少在生物过程中注释到代谢过程(条)和细胞过程(条)的基因最多而细胞杀死(条)和行为(条)子类中涉及的基因最少.
14、注释根据 与 的关联性进行 代谢通路分类 与 数据库比对后成功注释的基因有 条 这些注释基因被分到 个主要通路(代谢、遗传信息处理、细胞过程、环境信息处理、组织系统和人类疾病)和 个子通路中(表)其中涉及基因最多的主通路为代谢(条)其次为组织系统(条)、人类疾病(条)和环境信息处理(条)最少为细胞过程(条)和遗传信息处理(条)涉及基因最多的子通路为信号转导(条)其次为碳代谢(条)和翻译(条)最少为信号分子和互作作用(条).药用相关的代谢通路龙胆科植物包含环烯醚萜、黄酮类及三萜类化合 物 等 药 效 成 分(杨 青 松 等)根 据 转录本注释结果统计及分析与药效成分相关的次级代谢通路(表)其中包
15、括单萜类生物合成(条)、倍半萜类和三萜类生物合成(条)、类黄酮生物合成(条)、黄酮和黄酮醇生物合成(条)统计这些代谢通路中可能与环烯醚萜、黄酮等药效成分合成相关的转录本.分析对皱边喉毛花的全长转录组进行 分析后共检测到 个 信息位点 共获得 种 重复类型其中单碱基重复类型(个)最丰富其次为三碱基重复类型(个)、二碱基重复类型(个)、四碱基重复类型(个)和六碱基重复类型(个)而五碱 期韩霜等:藏茵陈基源植物皱边喉毛花的全长转录组信息分析.膜部分.膜封闭腔.细胞连接.超分子纤维.病毒.膜.病毒部分.细胞器.大分子复合物.胞外区域部分.胞外区域.其他有机体.细胞.细胞器部分.突触.突触部分.其他有机
16、体部分.细胞部分.结构分子活性.核酸结合转录因子活性.金属伴活动分子功能调节器.转录因子活性与蛋白质结合.分子功能调控.分子转导活性.抗氧化活性.结合.信号转导活性.催化活性.转运蛋白活性.生物黏附.生物过程负调控.代谢过程.多细胞生物过程.生殖过程.细胞过程.生物过程的调节.细胞杀死.生殖过程对刺激的反应.繁殖.单一生物体过程.生物调节.细胞成分组织或生物合成.生物过程正调控.生长.定位.生物相.节律过程.发育过程.免疫系统过程.解毒.行为.信号.多组织过程.转运.图 转录本 注释结果.基重复类型(个)最少 统计 个重复类型中不同长度范围重复序列的分布情况结果显示 长度的重复序列最丰富其次是
17、 、长度的重复序列而 长度的重复序列最少(图).转录因子分析转录因子是一些表达的蛋白质分子能与基因顺式作用元件专一性结合对基因转录进行调控(刘强等)本研究预测结果显示共获得 个转录因子(图)其中注释到转录本最多的转录因子家族是(个)其次为(个)、(/个)和 (个)而(个)、(个)转录因子家族数量最少广 西 植 物 卷表 转录本 注释结果 主通路 子通路 转录本数量 主通路 子通路 转录本数量 代谢碳代谢 组织系统环境适应 脂肪代谢 老龄化 辅助因子和维生素代谢 循环系统 能量代谢 发育 氨基酸代谢 内分泌系统 核苷酸代谢 免疫系统 其他次生代谢物的生物合成 神经系统 萜类化合物和聚酮类化合物的
18、代谢 感官系统 异种生物降解和新陈代谢 人类疾病 药物抵抗 其他氨基酸代谢 内分泌和代谢疾病 聚糖的生物合成和代谢 神经退行性疾病 全局和概览图 药物依赖 环境信息处理膜运输 感染疾病:细菌:信号转导 感染疾病:病毒:信号分子和互作作用 感染疾病:寄生生物:遗传信息处理 翻译 癌症:特殊类型:折叠、分类和降解 心血管疾病 复制和修复 免疫疾病 细胞过程 细胞群落原核生物 运输和分解代谢 细胞生长和死亡 细胞运动 .长非编码 分析长链非编码()不编码蛋白质利用、和 方法对其进行编码潜能预测 共检测到 个 其中、和 分别检测到 个、个、个、个 种软件检测到的共有 有 个 统计 种方法预测的 数目绘
19、制韦恩图(图)讨论与结论皱边喉毛花是藏茵陈基源植物之一植物体内含有大量的药用成分但对其转录组的认识较浅 基因功能相关研究的报道较少 为进一步了 期韩霜等:藏茵陈基源植物皱边喉毛花的全长转录组信息分析表 萜类及黄酮化合物生物合成相关转录本 代谢通路 通路编号.转录本编号 单萜类生物合成 倍半萜类和三萜类生物合成 类黄酮生物合成 黄酮和黄酮醇生物合成 图 皱边喉毛花全长转录组 分析.解皱边喉毛花药用价值我们开展次级代谢产物合成相关基因功能研究 利用 测序平台解析全长转录组获取更完整的转录本信息 通过测序共获得 条 平均长度为 长度为 说明全长转录组测序读长较长且连续性较高 为获得更准确且可靠的数
20、据 对 进 行 聚 类 及 校 正 后 得 到 条高质量的全长转录本 长度大于 ()说明其组装完整性较好能够满足后续转录组信息分析的要求通过与 个公共数据库的比对我们获得了大量有用的转录本注释信息共有 条转录本成功注释到这些数据库中其中注释到、数据库中的转录本数量最多 数据库比对结果显示与皱边喉毛花比对率排名前十的物种为咖啡()、芝麻()、牵牛()等表明皱边喉毛花与这些植物具有较高同源性 然而能与皱边喉毛花比对上的同科植物较少这反映出公共数据库中龙胆科植物的基因组信息十分匮乏藏茵陈基源植物包含丰富的环烯醚萜、黄酮及三萜类等药用成分(杨青松等)本研究从对皱边喉毛花全长转录组的分析中检测到与其药用
21、合成相关的 条转录本包括生物碱、萜类、苯丙素类、黄酮类、糖苷类、醌类、聚酮类、有机酸及酚类等 黄酮作为具有多种生物活性的多酚类化合物广泛存在于植物体内在人体疾病治疗中起到显著效果(.)萜类化合物在植物的生长和发育中发挥重要作用常应用于食品、制药和化学工业中()本研究分析得到多个黄酮类与萜类化合物合成相关的转录本有助于挖掘黄酮类及萜类化合物合成相关的关键基因这为我们今后开展皱边喉毛花关键基因克隆研究提供基础数据 位点广泛分布于真核生物基因组(张楠等)本研究 分析结果显示单碱基重复类型最为丰富类似情况在其他药用植物中也有 体 现 如 山 莨 菪()、凤 丹()、罗布麻()等(谢 冬 梅 等 张 雨
22、 等 赵 雪 艳 等)除去对单碱基重复的统计皱边喉毛花植物中三碱基重复类型最为丰富这与药用植物甘葛藤()和 全 萼 秦 艽()结果一致而在红花这个物种中二碱基重复最为丰富这种差异可能与 位点进化速率广 西 植 物 卷图 皱边喉毛花全长转录组转录因子家族分析.图 皱边喉毛花长非编码 分析结果.不同、设定的检索参数以及样品来源有关(.李延龙等梅瑜等)转录因子是一类能够特异结合 且调节转录的蛋白质(刘强等)本研究鉴定出的 个转录因子中、及 转录因子家族在皱边喉毛花中数量较多丰富了喉毛花属的转录因子信息 作为植物中最大的转录因子家族参与调控植物的生长发育、次生代谢及逆境胁迫等生物学过程(陈清等)在关于
23、 转录因子家族的研究中前人已证实该基因家族能够提高植物的耐寒能力促进果实着色并在盐胁迫调控中发挥重要作用(.陈娜等)转录因子作为真核生物转录因子中分布最广、最保守的一类转录因子参与植物的生长发育、光信号转导、生物和非生物胁迫应答(杨颖等)已有研究证实 转录因子家族能够增强拟南芥抗旱能力并参与其低温、高盐等胁迫的应答反应(.)作为植物中最大的转录因子家族之一在细胞发育和细胞活性中发挥着重要作用并参与植物中次级代谢产物合成相关基因表达的调控如类黄酮、花青素等次级代谢物(.张 全 琪 等 .)和 转录因子家族与植物的非生物胁迫相关皱边喉毛花主要分布在青藏高原地区该地区气温低昼夜温差大这些转录因子家
24、期韩霜等:藏茵陈基源植物皱边喉毛花的全长转录组信息分析族是否参与皱边喉毛花的响应胁迫应答反应还需进一步研究 是一类长度超过 、能够调控基因的表达、参与多个生物学过程和通路的长非编码(.)本研究共预测到 个 丰富了喉毛花属植物的长 非 编 码 信 息 为 后 续 进 一 步 探 索 在喉毛花属植物中的具体生物功能及作用机制提供了数据支持本研究利用 测序平台对皱边喉毛花进行了测序及拼接 获得的大量测序数据用于功能注释、可变剪切分析、分析、转录因子分析及长非编码 预测等 通过与 的比对筛选出药用相关成分合成相关的代谢通路和转录本为皱边喉毛花药用成分合成相关的关键基因的筛选提供重要的遗传资源参考文献:
25、.():.:.():.:.():.():.():.():.():.陈娜 迟晓元潘丽娟 等.转录因子在植物盐胁迫调控中的研究进展.植物生理学报():.():.陈清 汤浩茹 董晓莉 等.植物 转录因子的研究进展.基因组学与应用生物学():.():.():.:./.():.():.董天骄 崔元璐 田俊生 等.天然环烯醚萜类化合物研究进展.中草药():.():.:.():.:.():./.():.:.:.:.():.():.():.:.():.():.:广 西 植 物 卷 .:.:.():.李 延 龙 张 华 敏 崔 蕴 刚 等.韭菜全长转录组 信息分析及分子标记开发.园艺学报():.().():.刘
26、建全 何廷农.喉毛花的胚胎学研究.植物分类学报():.():.刘 强张 贵 友陈 受 宜.植物转录因子的结构与调控作用.科学通报():.():.刘真 祁艳艳 吴海燕 等.藏药长梗喉毛花的活性成分研究.中药材():.():.刘小翠 赵英 曾擎屹 等.法测定喉毛花植物中 种有效成分的含量.中华中医药杂志():.():.梅瑜 李向荣 蔡时可 等.药食同源植物甘葛藤的全长转录组分析.华北农学报():.():.():.乔涌起崔保松 唐丽 等.长梗喉毛花正丁醇部位化学成分研究.中国中药杂志():.:.():.():.()():.唐丽 金振南 门美佳 等.藏药藏茵陈的研究进展及开发利用.中央民族大学学报(自
27、然科学版)():.:.:.:.():.:.():.王瑞娴李川.全长转录组测序技术在非模式植物转录组学研究中的应用.分子植物育种():.():.谢冬梅 俞年军 黄璐琦等.基于高通量测序的药用植物“凤丹”根皮的转录组分析.中国中药杂志():.():.徐家洪 曾晴叶富余 等.基于全长转录组序列、核基因与叶绿体基因分析琼岛杨在杨属的亲缘关系.北京林业大学学报():.():.():.延玺 刘会青 邹永青等.黄酮类化合物生理活性及合成研究进展.有机化学():.期韩霜等:藏茵陈基源植物皱边喉毛花的全长转录组信息分析 .()():.杨青松 赵艳 张海浩 等.龙胆科藏茵陈类民族药原植物在滇西北的地理分布与资源利
28、用.云南民族大学学报(自然科学版)():.():.杨颖 高世庆 唐益苗 等.植物 转录因子的研究进展.麦类作物学报():.():.余静雅 夏铭泽 徐浩 等.青藏高原地区 种蒿属植物转录组比较分析.植物研究():.():.():.赵陆滟 曹绍玉 龙云树 等.全长转录组测序在植物中的应用研究进展.植物遗传资源学报():.():.赵雪艳 王琪 杨莎 等.药用植物罗布麻的转录组测序及分析.分子植物育种():.().():.张婵 胡莉娟 王赟.三种同域分布喉毛花的繁殖分配.广西植物():.:.张俊超.基于转录组测序挖掘老芒麦落粒候选基因及其功能分析.兰州:兰州大学:.():.张楠 孙桂玲戴均贵 等.银杏
29、细胞转录组高通量测序及分析.中国生物工程杂志():.():.张全琪 朱家红 倪燕妹等.植物 转录因子的结构特点及其生物学功能.热带亚热带植物学报():.():.张雨 夏铭泽 张发起.药用资源植物山莨菪的转录组信息分析.植物研究():.().():.():.张子敬 刘燕蓉 张顺进 等.第三代测序技术的方法原理及其在生物领域的应用.中国畜牧杂志():.:.():.“”.():.钟国跃 王昌华 刘翔 等.常用藏药“蒂达(藏茵陈)”的资源与使用现状调查.世界科学技术:中医药现代化():.():.(.).():.朱兴正 夏丽飞 陈林波 等.保护品种云茶 号茶树全长转录组测序分析.茶叶科学():.(责任编辑 邓斯丽)广 西 植 物 卷