1、南方农业South China Agriculture第17卷第15期Vol.17 No.152023年8月Aug.2023板蓝(Strobilanthes cusia)是爵床科灌木状多年生草本植物,广泛分布在我国的四川、贵州、浙江和福建等地。板蓝全身皆可入药,根被称为“南板蓝根”,茎和叶经加工后可得青黛,能够治疗病毒性肝炎、流感、感冒、肺炎、炎症、疱疹、丹毒、蛇咬伤等1,青黛是牛黄消炎丸、桂林西瓜霜等的主要原料2-3。其中,福建马蓝(板蓝)青黛品质最佳,是福建省大宗地道药材之一4。最近,高质量板蓝基因组数据可获得5,为进一步探究板蓝基因组进化历史及生物学特征奠定了基础。多倍化(polyplo
2、idy)是物种多样性演化的重要基因组动力,为地球上绿色植物的庞大类群的出现做出了巨大贡献,尤其在被子植物的演化过程中尤为突出6。物种经历多倍化,其早期基因组将以古老的多倍体形式存在,而后会出现大规模的染色体重排,以及伴随发生的重复基因丢失现象,这就导致现存物种基因组相对其祖先,已经发生了复杂的变化,因此也为研究其古老的演化历史带来了挑战。板蓝作为真双子叶植物,至少经历了3次多倍化事件,包括种子植物共享的全基因组加倍(zeta)事件和被子植物共有的 (epsilon)事件,以及最近发生的一次核心真双子叶植物共同经历的古老六倍体 (gamma)事件。多倍化事件的鉴定及对物种进化的影响,是基因组研究
3、的一个热点,其中对于古老时期、且在一个较短的时间里,发生的潜在的由多倍化导致的基因组激变事件的鉴定是一个难点。地球上真双子叶植物出现距今有约1.5亿年7-9,早期分化关键节点几乎是在同一历史时期,对于板蓝而言,其从核心双子叶中分化出来的时间较早且分化较快,受到辐射性演化的影响,因而增加了这一分化前后的全基因组加倍事件的分析难度。本研究通过使用前人开发的方法10,将板蓝基因组与两个优良的参考基因组葡萄(Vitis vinifera)和漾濞槭(Acer yangbiense)进行共线性分析和全基因组比对分析,旨在厘清板蓝基因组的进化历程,探究板蓝的生物学功能。1材料与方法1.1植物基因组数据从不同
4、的网站下载了每个基因组项目的基因组序列和注释文件。葡萄的基因组数据可以在NCBI上找到(https:/www.ncbi.nlm.nih.gov/),漾濞槭的基因组信息可以在 GenBank 找到(http:/www.ncbi.nlm.nih.gov/genbank/),板蓝的基因组数据可以在CNGB Sequence收稿日期:2023-02-16作者简介:肖启蒙(1995),女,四川西昌人,在读硕士,研究方向为植物生物信息学。E-mail:。肖启蒙.板蓝与葡萄、漾濞槭基因组的共线性分析J.南方农业,2023,17(15):12-15.板蓝与葡萄、漾濞槭基因组的共线性分析肖启蒙(华北理工大学生命
5、科学学院,河北唐山 063210)摘要板蓝(Strobilanthes cusia)具有极高的药用价值,全草可入药,是中草药南板蓝根的主要成分。为了厘清板蓝基因组的进化历程,探究板蓝的生物学功能,通过将板蓝基因组与葡萄(Vitis vinifera)、漾濞槭(Acer yangbiense)基因组进行全基因组比对,采用推断基因组同源性、同义碱基替换、Ks的核函数分析、鉴定染色体的直系和旁系同源区域、全基因组与局部比对等方法,发现板蓝在经历了核心真双子叶共享的三倍化事件后,还额外经历了一次三倍化事件,并且确定时间节点在106120个百万年前。关键词板蓝;共线性;多倍化;全基因组比对;同义核苷酸替
6、换率中图分类号:S567.23+9文献标志码:ADOI:10.19415/ki.1673-890 x.2023.15.00312南方农业South China Agriculture第17卷第15期Vol.17 No.152023年8月Aug.2023Archive(CNSA)找 到(https:/gb.org/pub/CNSA/data3/CNP0001632/CNS0343944/CNA0019301/)。1.2推断基因组同源性基因共线性表明基因组之间的基因和基因顺序在一定程度上是保守的,这可以反映共同祖先的同源染色体结构;这对于理解基因组变化,特别是推断复杂植物基因组的进化至关重要。通过
7、BLAST对蛋白质序列进行比较11,E值1e-5,得分100。随后,来自BLAST的同源基因信息被用作ColinerScan软件12的输入,为了定位同源基因对,笔者将同源基因之间的最大间隙分别设置为10、20、40、50、60、80、100和200个干预基因,并通过使用这些信息获得同源基因点图13-14。最后,当阈值设置为50时,发现了最清晰的共线性片段,并确定出旁系同源和直系同源基因。1.3同义碱基替换使用 Nei-Gojobori 方法15,通过使用 Bioperl 统计模块,估计同义位点(Ks)上的同义核苷酸替换。然后,对齐多个基因CDS,并使用ClustalW v2.0设置默认参数16
8、。1.4Ks的核函数分析使用核函数来分析基因组内和基因组之间的同基因同源物的 Ks分布。Ks分布被认为是正态分布的混合。MATLAB v9.2.017用于估计每个Ks列表的密度并获得密度分布曲线,而核平滑密度函数的宽度参数设置为0.05。通过在拟合工具箱工具中执行高斯函数来拟合曲线,评估拟合优度的参数R2通常设置为不小于95%。本文使用Ks分布曲线的最大似然估计(Ks峰值)。1.5鉴定染色体的直系和旁系同源区域通过比较与物种分化和特定多倍体事件相关的同源区域的Ks值,确定了同源和旁系的染色体区域。1.6全基因组与局部比对基于多基因组比对关系,使用McScanX的jcvi模型展示笔者在参考基因组
9、和板蓝基因组之间选择的同源基因深度比关系的信息18。2结果与分析2.1共线性基因及Ks分布表征为了探究板蓝的多倍化历程,笔者比较了板蓝基因组与葡萄、漾濞槭基因组间的共线性关系(见表1)。在葡萄和漾濞槭基因组中,当共线性区域所包含的共线性基因对大于4对时,分别鉴定出了位于385和670个同源共线性区域上的3 558和4 853对共线性基因对。然而,在相同条件下,在板蓝基因组内鉴定出13 225对共线性基因对位于1 520个同源区域上,这大约是葡萄和漾濞槭基因组内共线性基因对的3倍左右。随后,笔者对基因组间也进行了比较,发现板蓝与葡萄、漾濞槭间分别存在50、51个长片段(连续基因对数量大于50对)
10、,包括了4 016和4 673对共线性基因对,值得注意的是,在葡萄与漾濞槭基因组间存在8 611对共线性基因对,这大约是板蓝与两个参考基因组间的2倍。这些基因组比较表明,板蓝基因组中有更多的区块,并且它们更小,这表明板蓝可能在ECH后经历了进一步的多倍化事件。表1板蓝与参考基因组中位于基因组内或基因组之间推测的共线性片段中的同源基因对数量单位:个样本葡萄漾濞槭板蓝葡萄 VS漾濞槭葡萄 VS 板蓝漾濞槭 VS 板蓝BLa43 558/3854 853/67013 225/1 52017 939/1 08321 472/1 80222 359/2 035BL101 956/731 763/716
11、500/28313 863/32014 728/59714 077/542BL201 636/491 193/294 298/11011 961/17710 090/2529 818/227BL50448/8555/81 564/228 611/714 016/504 673/51ACGPb9.24,26.79,33.39,56.017.24,24.83,41.14,69.388.72,22.98,39.08,75.1816.56,43.32,67.58,121.2811.92,24.68,40.05,80.3210.99,25.98,43.26,91.63LDBc67911626271772
12、39LDB on chromosomesVvi6-Vvi8Aya6-Aya10Scu6-Scu11Vvi18-Aya10Vvi19-Scu11Aya8-Scu1注:BLa片段长度,ACGPb片段中共线性基因对的平均数,LDBc最长的共线性区域所含的基因对数。笔者对共线性基因对所处的同源区域进行了同义核苷酸替换分析,计算了多倍化事件和物种分化所对应的Ks峰,并进一步推断了进化关键事件发生的时间节点(见封三图1)。葡萄、漾濞槭和板蓝基因组中的共线性基因对分别在 0.978 9、1.251和 1.09处存在峰值,并且板蓝基因组存在一个更小的峰,约为0.929 8,因此笔者推测前面三个峰对应核心真双子
13、叶共享的多倍化事件(core eudicots hexaploidy,ECH),板蓝的较小峰对应板蓝额外经历的多倍化事件。此外,笔者发现板蓝与葡萄、漾濞槭分化的峰分别为 1.31和 1.43,均大于葡萄与漾濞槭分化的峰(0.946 9),表明板蓝先于葡萄、漾濞槭分化,随后葡萄和漾濞槭再分开。13南方农业South China Agriculture第17卷第15期Vol.17 No.152023年8月Aug.2023进一步地,笔者对板蓝及参考基因组进化过程中的关键进化事件进行时间节点的推断,利用之前研究中确定的ECH事件发生在大约115130个百万年前9,笔者推算出板蓝大约在111126个百万
14、年前与葡萄、漾濞槭分支发生分化,随后在约106120个百万年前经历了额外的多倍化事件,最后葡萄与漾濞槭在8596个百万年前发生分化。从上述结果中,笔者可以看到,在ECH事件后,板蓝基因组在相当短的时间内经历了多倍化及分化事件,这会增大多倍化事件的鉴定难度,是板蓝基因组分析中的巨大挑战。2.2确定板蓝额外多倍化事件为三倍化为了揭示板蓝基因组的多倍化历程,笔者对葡萄和板蓝基因组进行比较,发现板蓝的9个直系染色体区域与葡萄3个由ECH事件产生的旁系染色体区域相匹配。比如,葡萄基因组中由ECH事件产生的Vvi4、Vvi9、Vvi11与板蓝基因组中的 9个旁系染色体区域 Scu2、Scu9、Scu10、
15、Scu5、Scu15、Scu16、Scu3、Scu6、Scu8相匹配(见封三图2A)。当用漾濞槭基因组与板蓝基因组进行比较时,也可观察到类似的结果(图2B)。这些基因组间共线性分析表明,葡萄与板蓝,漾濞槭与板蓝间的直系同源共线性深度比皆为39。进一步地,对板蓝基因组内也进行全基因组比较,发现其自身存在两个旁系同源区域,比如,Scu3和Scu4、Scu6为旁系同源区域(图2C)。综合基因组间和基因组内比较结果,表明板蓝基因组应该在ECH事件后经历了一次额外的三倍化事件。参考基因组与板蓝间的进化关系如图2D所示。2.3多重基因组比对与共线性列表的构建在前面鉴定出的直系同源与旁系同源区域的基础上,笔
16、者可以区分出多倍化事件相关的共线性区域。葡萄、漾濞槭和板蓝间分化的直系同源关系如封三图 3A所示。比如,葡萄的18号染色体有一个直系同源区域位于漾濞槭的10号染色体上。有3个直系同源区域分别位于板蓝的3、14和16号染色体上(图3B)。同时,由于多倍化后会存在大量的基因丢失,所以在板蓝和两个参考基因组之间的微共线性同源区域的基因清楚地表明,存在一些基因没有显示出预期的共线性深度同源比(见图3B)。此外,基于三个比较基因组中同源基因的位置,笔者构建了一个分层次和事件相关的多基因组比对表。在这里,以葡萄为参考基因组,笔者将葡萄的所有基因ID填充到第一列,然后根据多重比对推断出的基因组合成,逐列逐种
17、添加葡萄、漾濞槭、板蓝的基因标识符。假设没有基因丢失,来自ECH事件的葡萄中的三个旁系基因中的每一个都分别在漾濞槭和板蓝中有一个和三个同源基因。因此,多基因组比对表包括15(3+3+9)列,其中包含三列葡萄基因、三列漾濞槭基因和九列板蓝基因。当一个基因在预期位置缺失时,通常是由于基因丢失、易位或可能的组装不充分,笔者在相应的位置输入一个点来表示缺失的基因,利用构建的列表进行多基因组比对(图3C)。该表总结了多重基因组和事件相关比对的结果,反映了递归多倍体化导致的三倍同源性,为爵床科生物信息学的进一步深入探究提供了重要的基因组学资源。3讨论与结论递归多倍体化在植物基因组中频繁发生,为基因组功能创
18、新提供了巨大的机会19-22。多倍体化后,植物基因组常常伴随着基因丢失和染色体重排,这使得基因组更加复杂,在识别多倍化事件时也会产生巨大的挑战23。比如,对最好匹配片段的选择存在差异24,多倍体后进化速度加快,导致与最近多倍体事件相关的同源区块的Ks值与ECH事件的Ks值无法区分9等。在之前对板蓝基因组的分析中,并没有提到板蓝在进化过程中经历了全基因组多倍化事件5。本文对板蓝与参考基因组进行了深入的全基因组比对分析,发现葡萄与漾濞槭,葡萄与板蓝的直系同源比分别为11,13,表明板蓝基因组在ECH事件后又经历了一次额外的三倍化事件。这不仅可以成为探究爵床科植物进化历程的模式,也因笔者对板蓝基因组
19、构建的多重基因组比对列表,而能为后续爵床科植物基因组学研究打下坚实的基础。此外,本研究为进一步加强板蓝育种工作,提高板蓝产量提供了理论基础。参考文献:1GU W,ZHANG Y,HAO X J,et al.Indole alkaloidglycosides from the aerial parts of StrobilanthescusiaJ.Journal of natural products,2014,77(12):2590-2594.2胡永乐,宁书菊,叶齐,等.流式细胞术测定马蓝基因组大小J.中成药,2023,45(2):634-636.3郭志英,李卿,吴循循,等.马蓝WRKY转录因
20、子家14南方农业South China Agriculture第17卷第15期Vol.17 No.152023年8月Aug.2023族生物信息学及表达特征分析J.药学学报,2022,57(9):2864-2875.4刘小英,彭建平,林志敏.建青黛产业现状、存在问题及发展对策J.福建农业科技,2016(3):59-62.5HU Y,MA D,NING S,et al.High-Quality Genomeof the Medicinal Plant Strobilanthes cusia ProvidesInsights Into the Biosynthesis of Indole Alkal
21、oidsJ.Frontiers in plant science,2021,12:742420.6SOLTIS P S,SOLTIS D E.Ancient WGD events asdrivers of key innovations in angiospermsJ.Currentopinion in plant biology,2016,30:159-165.7MING R,VANBUREN R,LIU Y,et al.Genome ofthelong-livingsacredlotus(NelumbonuciferaGaertn.)J.Genome biology,2013,14(5):
22、R41.8MOORE M J,SOLTIS P S,BELL C D,et al.Phylogenetic analysis of 83 plastid genes furtherresolves the early diversification of eudicotsJ.ProcNatl Acad Sci U S A,2010,107(10):4623-4628.9JIAO Y,WICKETT N J,AYYAMPALAYAM S,etal.AncestralpolyploidyinseedplantsandangiospermsJ.Nature,2011,473(7345):97-100
23、.10WANG J,SUN P,LI Y,et al.An OverlookedPaleotetraploidization in CucurbitaceaeJ.Molecularbiology and evolution,2018,35(1):16-26.11CAMACHO C,COULOURIS G,AVAGYAN V,etal.BLAST+:architecture and applicationsJ.BMCbioinformatics,2009,10:421.12WANG X,SHI X,LI Z,et al.Statistical inference ofchromosomal ho
24、mology based on gene colinearityand applications to Arabidopsis and riceJ.BMCbioinformatics,2006,7:447.13WANGX,WANGJ,JIND,etal.GenomeAlignmentSpanningMajorPoaceaeLineagesRevealsHeterogeneousEvolutionaryRatesandAlters Inferred Dates for Key Evolutionary EventsJ.Molecular plant,2015,8(6):885-898.14WAN
25、G X,GUO H,WANG J,et al.Comparativegenomicde-convolutionofthecottongenomerevealedadecaploidancestorandwidespreadchromosomal fractionationJ.The New phytologist,2016,209(3):1252-1263.15NEI M,GOJOBORI T.Simple methods for estimatingthe numbers of synonymous and nonsynonymousnucleotide substitutionsJ.Mol
26、ecular biology andevolution,1986,3(5):418-426.16THOMPSON J D,GIBSON T J,HIGGINS D G.Multiple sequence alignment using ClustalW andClustalXJ.Current protocols in bioinformatics,2003(1):Unit 2.3.17CICHOSZ S L,JENSEN M H,LARSEN T K,et al.AMatlabToolforOrganizingandAnalyzingNHANES DataJ.Studies in healt
27、h technology andinformatics,2020,270:1179-1180.18WANG Y,TANG H,DEBARRY J D,et al.MCScanX:a toolkit for detection and evolutionaryanalysis of gene synteny and collinearityJ.Nucleicacids research,2012,40(7):e49.19VAN DE PEER Y,MIZRACHI E,MARCHAL K.TheevolutionarysignificanceofpolyploidyJ.Nature review
28、s Genetics,2017,18(7):411-424.20JIAO Y,LEEBENS-MACK J,AYYAMPALAYAMS,et al.A genome triplication associated with earlydiversificationofthecoreeudicotsJ.Genomebiology,2012,13(1):1-14.21SOLTIS P S,MARCHANT D B,VAN DE PEER Y,et al.Polyploidy and genome evolution in plantsJ.Current opinion in genetics&de
29、velopment,2015,35:119-125.22LANDIS J B,SOLTIS D E,LI Z,et al.Impact ofwhole-genome duplication events on diversificationrates in angiospermsJ.American journal of botany,2018,105(3):348-363.23PATERSON A H,BOWERS J E,CHAPMAN B A.Ancient polyploidization predating divergence of thecereals,anditsconsequencesforcomparativegenomicsJ.Proc Natl Acad Sci U S A,2004,101(26):9903-9908.24WANG J,SUN P,LI Y,et al.HierarchicallyAligning 10 Legume Genomes Establishes a Family-Level Genomics PlatformJ.Plant physiology,2017,174(1):284-300.(责任编辑:丁志祥)15
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100