1、中国农业科技导报,2023,25(10):74-83Journal of Agricultural Science and Technology桦木科叶绿体基因组密码子偏好性及系统发育分析郭佳星,黄祥,杨梅花*,王蕾蕾,韩彦奇,李卓怡(石河子大学农学院,新疆 石河子 832003)摘要:为分析桦木科叶绿体基因组编码区密码子的使用特征,利用CodonW1.4.2、Origin、SPSS25.0、MEGA7.0软件和在线程序CUSP对50种桦木科植物叶绿体基因组密码子的偏好性及物种间的系统发育进行分析。结果表明,桦木科叶绿体基因组密码子适应指数(codon adaptation index,CAI
2、)在0.1630.166之间,平均0.165,有效密码子数(effective number of codon,ENC)范围在49.2950.46之间,平均49.78,密码子偏好性弱。密码子不同位置的GC含量表现为GC1(45.4%)GC2(37.4%)GC3(29.7%),表明桦木科叶绿体密码子偏好于使用A/U结尾。ENC与密码子GC2、GC3及平均GC含量呈极显著正相关(PGC2(37.4%)GC3(29.7%),which indicated that chloroplast codons were prefer to A/U endings in Betulaceae.The corr
3、elation analysis showed that the ENC and GC2,GC3 and average GC showed an extremely significant level(P1为条件确定最优密码子20。1.2.7系统发育分析基于叶绿体基因组密码子RSCU值,运用SPSS 25.0的离差平方和法(Ward s method)对50种桦木科植物进行聚类分析。基于叶绿体matK基因序列,运用MEGA 7.0的最大邻接法(neighbor-joining,NJ)构建 50种桦木科植物系统发育树21。2结果与分析2.1密码子组成特征分析由表 1 可知,桦木科 6 个属 5
4、0 个种之间的叶绿体基因密码子不同位置碱基的 GC 含量存在差异,表现为 GC1(45.4%)GC2(37.4%)GC3(29.7%),平均GC含量为37.6%,表明密码子偏好使用以A/U结尾;密码子适应指数(CAI)为0.1630.166,平均 0.165,即 CAI 值较低;有效密码子数(ENC)为 49.2950.46,平均 49.78,ENC值均大于45。由此表明,桦木科叶绿体基因组密码子偏好性弱。表1桦木科叶绿体基因组密码子使用偏性相关参数Table 1Parameters related to codon bias in chloroplast genome of Betulace
5、ae 编号No.1234567891011121314151617181920212223242526属Genus鹅耳枥属Carpinus虎榛子属Ostryopsis桦木属Betula种Specie桦叶鹅耳枥 C.betulus美洲鹅耳枥 C.caroliniana千金榆 C.cordata川黔千金榆 C.fangiana川陕鹅耳枥 C.fargesiana太鲁阁鹅耳枥 C.hebestroma云南鹅耳枥 C.monbeigiana宝华鹅耳枥 C.oblongifolia多脉鹅耳枥 C.polyneura紫脉鹅耳枥 C.purpurinervis普陀鹅耳枥 C.putoensis岩生鹅耳枥 C
6、.rupestris西藏鹅耳枥 C.tibetana天台鹅耳枥 C.tientaiensis昌化鹅耳枥 C.tschonoskii雷公鹅耳枥 C.viminea虎榛子 O.davidiana中间虎榛子 O.intermedia滇虎榛 O.nobilis西桦 B.alnoides山纸皮桦 B.cordifolia硕桦 B.costata盐桦 B.halophila山桦 B.lenta沼桦 B.nana水桦 B.occidentalis登录号Accession No.NC_039934.1NC_039935.1KY312849.1MG386371.1NC_039937.1NC_038131.1NC
7、_039997.1NC_038092.1NC_039998.1NC_038093.1KX695124.1NC_039999.1NC_052921.1KY174338.1NC_039938.1NC_039939.1MG386376.1NC_040000.1NC_040001.1MK888853.1NC_037473.1MN830400.1MG674393.1MG386366.1KX703002.1MG386367.1密码子适应指数CAI0.1640.1640.1640.1640.1640.1640.1640.1640.1640.1640.1630.1640.1650.1660.1640.1650
8、.1650.1640.1640.1650.1650.1650.1650.1650.1650.165有效密码子数ENC49.8449.8449.8149.7849.8649.8649.8849.8749.8849.8549.8949.8750.1150.4649.8550.1049.7949.8849.8949.5949.6449.7249.2949.6549.6849.64GC含量GC content/%GC145.345.345.345.345.345.345.345.345.345.345.445.345.747.145.345.745.245.345.345.245.146.145.54
9、5.245.145.2GC237.437.337.437.337.437.437.437.437.437.437.437.437.538.837.437.537.237.437.437.237.138.137.337.337.137.3GC329.829.829.829.829.829.929.829.929.929.829.929.830.131.029.830.129.829.829.829.529.529.828.929.529.629.5GC37.537.537.537.537.637.637.637.637.637.537.637.637.839.037.637.837.437.53
10、7.537.337.338.137.337.437.337.47610 期郭佳星等:桦木科叶绿体基因组密码子偏好性及系统发育分析2.2相关性分析相关分析结果(表2)表明,在50种桦木科植物叶绿体基因组密码子中GC1与GC2、GC2与GC3呈极显著相关;GC1与GC3相关不显著;GC1、GC2、GC3均与平均GC含量呈极显著相关;这表明桦木科植物叶绿体基因密码子各碱基的组成整体相关性不大。ENC与CAI呈显著负相关,与GC2、GC3呈极显著正相关,表明GC2和GC3越高,50种桦木科植物叶绿体基因组密码子偏好性越弱。2.3密码子使用偏好性影响因素分析在桦木科6个属中分别选取2个代表物种,包括鹅耳
11、枥属(Carpinus)中的美洲鹅耳枥(C.caroliniana)和千金榆(C.cordata)、虎榛子属(Ostryopsis)中的虎榛子(O.davidiana)和滇虎榛(O.nobilis)、桦木属中的沼桦(B.nana)和白桦(B.platyphylla)、桤木属中的桤木(A.cremastogyne)和红桤木(A.rubra)、铁木属(Ostryopsis)中的铁木(O.japonica)和毛果铁木(O.trichocarpa)、榛属(Corylus)中的美洲榛(C.americana)和华榛(C.chinensis),进一步分析桦木科叶绿体基因组密码子偏好性的影响因素。2.3.1
12、中性绘图分析由图 1可知,GC3的分布区域较小(0.205 90.366 3),GC12分布范围较大(0.306 80.550 4),对角线上方有较多基因分布,仅有少部分基因沿对角线分布,表明第3位碱基组成和第1、2位碱基组成并不呈线性相关;线性回归系数较小(0.009 490.046 37),表明突变对表1桦木科叶绿体基因组密码子使用偏性相关参数Table 1Parameters related to codon bias in chloroplast genome of Betulaceae 续表Continued编号No.272829303132333435363738394041424
13、344454647484950均值 Mean属Genus桦木属Betula桤木属Alnus铁木属Ostrya榛属Corylus种Specie白桦 B.platyphylla美国灰桦 B.populifolia欧洲桦 B.pubescens桤木 A.cremastogyne欧洲桤木 A.glutinosa辽东桤木 A.incana尼泊尔桤木 A.nepalensis红桤木 A.rubra铁木 O.japonica天目铁木 O.rehderiana毛果铁木 O.trichocarpa美洲榛 C.americana欧榛 C.avellana华榛 C.chinensis土耳其榛 C.colurna加州
14、榛 C.cornuta披针叶榛 C.fargesii刺榛 C.ferox榛 C.heterophylla喜马拉雅榛 C.jacquemontii毛榛 C.mandshurica日本榛 C.sieboldiana维西榛 C.wangii滇榛 C.yunnanensis登录号Accession No.MH205735.1NC_039995.1MG386370.1NC_040996.1NC_039930.1MG386364.1NC_039991.1MG356709.1MG386375.1KT454094.1KY088271.1NC_045287.1KX822768.2KX814336.2NC_045
15、290.1NC_045292.1MH628462.1NC_045288.1KX822769.2NC_045291.1MH628448.1NC_045289.1NC_040995.1MH628461.1密码子适应指数CAI0.1650.1650.1650.1650.1650.1650.1650.1650.1640.1640.1640.1650.1640.1640.1650.1640.1650.1640.1640.1640.1650.1650.1650.1650.165有效密码子数ENC49.6049.6249.6449.6649.8749.8349.8249.7549.7749.7649.834
16、9.7049.6649.6549.7449.7049.7149.7649.6749.7249.6949.7149.7349.7149.78GC含量GC content/%GC145.245.245.245.445.345.245.345.245.245.345.345.545.645.545.545.545.445.545.645.545.445.545.445.445.4GC237.237.337.337.437.437.337.437.337.237.337.437.537.437.437.437.537.337.437.437.537.337.437.337.337.4GC329.529
17、.529.529.529.829.829.829.729.829.729.829.629.529.529.629.629.629.629.629.629.629.629.629.629.7GC37.337.337.437.537.637.537.537.437.537.537.537.637.537.537.637.637.537.637.637.637.537.637.537.537.677中 国 农 业 科 技 导 报25 卷基因组密码子使用偏好性影响最高仅占4.637%。因此,12种桦木科植物叶绿体基因组密码子使用偏好性主要受自然选择影响,同时也受到突变作用的影响。2.3.2ENC-pl
18、ot分析由图2可知,12种桦木科植物叶绿体基因在图中标准曲线两侧呈小簇状分布,且主要分布在标准曲线下方,其ENC期望值大于实际值。由此表明,12种桦木科植物叶绿体基因组密码子使用偏好性除自然选择因素影响外,部分基因受到突变作用影响。2.3.3PR2-plot分析由图 3 可知,基因数量在图中4个区域中分布不均匀。在竖直方向,大部分基因汇集于中线下方;在水平方向,基因在中线两侧分布差异不显著,表明桦木科植物叶绿体基因组密码子第3位碱基组成中碱基A的频率小于碱基T,碱基C的频率和碱基G差异较小。该结果进一步表明,桦木科植物叶绿体基因组密码子使用偏好性在一定程度上受到碱基突变的影响。2.4最优密码子
19、分析根据ENC值对50种桦木科植物叶绿体基因组的高表达和低表达基因建库,并计算高、低2库的 RSCU 和 RSCU。结果(图 4)显示,桦木科植物叶绿体基因组的最优密码子的数量在2530之间,密码子 CUC、CUG、AUC、GUC、GUG、GGG、UGC、CCA、ACG、GCC、CGA、CGG、CAG、GAG、图1中性绘图分析Fig.1Analysis of neutrality plot表2基因密码子各参数之间相关性分析Table 2Correlation analysis between the indexes of codon use指标 Index有效密码子数ENCGC1GC2GC3G
20、C密码子适应指数CAI-0.38*-0.03-0.24-0.33-0.23有效密码子数ENC0.140.50*0.94*0.62*GC10.72*0.100.69*GC20.45*0.84*GC30.60*注:*和*分别表示在P0.05和P0.01水平相关显著。Note:*and*indicate significant correlations at P0.05 and P0.01 levels,respectively.7810 期郭佳星等:桦木科叶绿体基因组密码子偏好性及系统发育分析AGG为共有的最优密码子。其中以 G结尾的密码子占最优密码子总数的 53.3%,以 C结尾的占33.3%,
21、即最优密码子第3位碱基偏向于G和C结尾。此外,不同属内种间共有最优密码子数量存在差异,鹅耳枥属、铁木属和榛属均有28个,虎榛子属有26个,桦木属和桤木属有19个。2.5系统发育分析根据叶绿体基因组密码子的 RSCU 值对 50种桦木科植物进行聚类分析(图 5A),在欧氏平方距离18.82处,天台鹅耳枥(C.tientaiensis)单独聚成 1 支,其他 49 种桦木科植物聚成 1 个大支;在欧氏平方距离 16.37 处,9 种桦木属物种单独聚成 1支;在欧氏平方距离 14.27处,5种桤木属和13种榛属物种聚成1支,3种虎榛子属、3种铁木属和 15 种鹅耳枥属物种聚成 1 支,同一分支内的桦
22、木科物种存在相近的密码子使用偏好性。由图 5B 可知,除桦叶鹅耳枥外,基于 matK基因序列系统发育分析能够对桦木科不同物种图2ENC-plot 分析Fig.2Analysis of ENC-plot图3PR2-plot 分析Fig.3Analysis of PR2-plot79中 国 农 业 科 技 导 报25 卷的亲缘关系进行到属间的划分。整体上看,基于matK基因序列系统发育树的拓扑结构和基于叶绿体基因组密码子RSCU值的聚类结果相似。亲缘关系比较近的物种如铁木属、鹅耳枥属和虎榛子属,其密码子使用偏好性比较相似;但也存在亲缘关系相近而密码子使用偏好性存在较大差异的现象,如天台鹅耳枥和另外
23、 15 种鹅耳枥属,其物种密码子使用偏好性差别较大。以上结果进一步表明,不同物种间的叶绿体基因组密码子使用偏好性和物种进化两者间有时并不完全相关,但存在不同属间的差异性和属内物种间的相似性。3讨论生物在进化过程中会以特定的密码子模式来适应进化、自然选择和突变等15。密码子的碱基序列组成对密码子的使用偏好性存在一定程度的影响22。密码子第3碱基的同义突变虽不会改变氨基酸的类型,但却对决定氨基酸种类具有重要作用,因此 GC3 是密码子偏好性分析的重要指标23。在以往的研究中,双子叶植物中GC3通常小于50%,即密码子更偏好于以A/U结尾,而在单子叶植物中却相反24。本研究结果与多数双子叶植物的研究
24、结果较为一致。桦木科植物叶绿体基因组密码子CAI值较低,而ENC值相对较高,说明桦木科叶绿体基因组密码子偏好性较弱,这或许与其叶绿体基因的功能相对较为稳定、保守有关25。研究表明,若密码子 GC12 与 GC3 无显著相关,且 GC3值分布范围较小时,自然选择是密码子偏好性的主要影响因素2627。本研究表明,桦木科植物叶绿体基因组密码子 GC3分布范围较小(0.205 90.366 3),且 GC3与 GC1、GC2无显著相关性。因此,桦木科叶绿体基因组密码子使用偏好性的主要影响因素是自然选择。同时,ENC-plot 和 PR2-plot 研究结果进一步证实了该结论。这与木兰科28研究结果一致
25、,但与槲蕨属29和秋茄25等植物中的研究结果存在差异。研究生物体中最优密码子有助于最大限度地图4最优密码子分析Fig.4Analysis of optimal codons8010 期郭佳星等:桦木科叶绿体基因组密码子偏好性及系统发育分析提高翻译速度和提高翻译准确性15。本研究中,50种桦木科植物叶绿体基因组最优密码子的数量在2530之间,表明桦木科不同物种在适应自然选择过程中其最优密码子使用策略存在差异。本研究检测到的共有最优密码子为 15 个,且第3位碱基更偏好于使用G/C结尾,这与大部分双子叶植物密码子偏向于以 A/U 结尾特征存在差异3031,但和西南桦的研究结果相一致32,这可能是该
26、科植物叶绿体基因组最优密码子使用的一种特殊机制。基于密码子使用偏好性进行聚类分析在一定程度上能够反映物种间的亲缘关系33。本研究基于 RSCU值的聚类结果和基于 matK基因序列构建的系统发育树,两者的拓扑结构相似。其中,除天台鹅耳枥外,基于RSCU值的聚类将桦木科植物实现亚属的划分;而基于matK基因序列构建的系统发育树能够对50种桦木科植物进行到亚科的划分。由此表明,基于密码子RSCU值的聚类结果和传统桦木科的种属分类结果17存在一定程度差异,这可能与桦木科不同物种在进化过程中其叶绿体基因组密码子偏好性受自然选择、突变等因素影响程度存在种间差异有关。因此,密码子RSCU值的聚类分析在较小型
27、的分类单元中可以提供更加可信的结论,而在较大型的分类单元中只能作为传统分类的补充25。参 考 文 献1 匡可任.中国植物志:桦木科M.北京:科学出版社,1979:44-150.KUANG K Z.Flora of China:Betulaceae M.Beijing:Science Press,1979:44-150.2陈之端.桦木科植物的系统发育和地理分布J.植物分类学报,1994,32(1):1-31.CHEN Z D.Phylogeny and phytogeography of the Betulaceae J.J.System.Evol.,1994,(1):1-31.A:基于叶绿体基
28、因组密码子的RSCU值;B:基于matK基因序列A:Based on RSCU values of chloroplast genome codon;B:Based on matK gene sequence图5聚类分析Fig.5Cluster analysis81中 国 农 业 科 技 导 报25 卷3 鲁志强.中国桦木科榛亚科的物种界定研究D.兰州:兰州大学,2017.LU Z Q.Species delimitation in the subfamily Coryloideae of Betulaceae in China D.Lanzhou:Lanzhou University,201
29、7.4 马会.转录组数据在桦木科生态适应、物种形成和系统发育研究中的应用初探D.兰州:兰州大学,2014.MA H.An investigation on ecological adaptation,speciation and phylogeny in Betulaceae based on the transcriptome data D.Lanzhou:Lanzhou University,2014.5 NIELSEN A Z,MELLOR S B,VAVITSAS K,et al.Extending the biosynthetic repertoires of cyanobacter
30、ia and chloroplasts J.Plant J.,2016,87(1):87-102.6 TANG D,FAN W,KASHIF M H,et al.Analysis of chloroplast differences in leaves of rice isonuclear alloplasmic lines J.Protoplasma,2018,255(1):1-9.7 YAN M,ZHAO X,ZHOU J,et al.The complete chloroplast genomes of Punica granatum and a comparison with othe
31、r species in Lythraceae J/OL.Int.J.Mol.Sci.,2019,20(12):2886 2022-02-20.https:doi.org/10.3390/ijms20122886.8 叶友菊,倪州献,白天道,等.马尾松叶绿体基因组密码子偏好性分析J.基因组学与应用生物学,2018,37(10):4464-4471.YE Y J,NI Z X,BAI T D,et al.The Analysis of chloroplast genome codon usage bais in Pinus massoniana J.Genom.Appl.Biol.,2018,3
32、7(10):4464-4471.9 SUEOKA N.Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses J.J.Mol.Evol.,2001,53(4-5):469-476.10 KOICHIRO T,JOEL D,MASATOSHI N,et al.MEGA4:molecular evolutionary genetics analysis(MEGA)software version 4.0.J/OL.Mol.Biol.Ev
33、ol.,2007,(8):1596 2022-02-20.https:/doi.org/10.1093/molbev/msm092.11 SHENG J J,SHE X,LIU X Y,et al.Comparative analysis of codon usage patterns in chloroplast genomes of five Miscanthus species and related species J/OL.Peer J.,2021,23(9):12173 2022-02-20.https:/doi.org/10.1007/s11105-013-0691-z.12 刘
34、慧,王梦醒,岳文杰,等.糜子叶绿体基因组密码子使用偏性的分析J.植物科学学报,2017,35(3):362-371.LIU H,WANG M X,YUE W J,et al.Analysis of codon usage in the chloroplast genome of Broomcorn millet(Panicum miliaceum L.)J.Plant Sci.J.,2017,35(3):362-371.13 PEDEN J F.Analysis of codon usage D.Nottingham:University of Nottingham,1999.14 ROMER
35、O H,ZAVALA A,MUSTO H.Codon usage in Chlamydia trachomatis is the result of strand-specific mutational biases and a complex pattern of selective forces J.Nucleic Acids Res.,2000,10:2084-2090.15 XU C,CAI X,CHEN Q,et al.Factors affecting synonymous codon usage bias in chloroplast genome of Oncidium Gow
36、er Ramsey J.Evol.Bio.,2011,7:271-278.16 ZHANG Y,NIE X,JIA X,et al.Analysis of codon usage patterns of the chloroplast genomes in the Poaceae family J.Aust.J.Bot.,2012,60(5):461-470.17 杨霄月.桦木科叶绿体基因组的系统发育分析D.兰州:兰州大学,2019.YANG X Y.Phylogenetic analysis of Betulaceae plastomes D.Lanzhou:Lanzhou Universi
37、ty,2019.18 于涛,张宇阳,高健,等.极小种群濒危植物盐桦叶绿体基因组特征分析J.林业科学,2019,55(2):41-49.YU T,ZHANG Y Y,GAO J,et al.Complete chloroplast genome sequence of Betula halophila,a plant species with extremely small populations J.Sci.Silvae Sin.,2019,55(2):41-49.19 LEE S I,NKONGOLO K,PARK D,et al.Characterization of chloroplas
38、t genomes of Alnus rubra and Betula cordifolia,and their use in phylogenetic analyses in Betulaceae J.Genes Genom.,2019,41(3):305-316.20 丁锐,胡兵,宗小雁,等.杓兰叶绿体基因组密码子偏好性分析J.林业科学研究,2021,34(5):177-185.DING R,HU B,ZONG X Y,et al.Analysis of codon usage in the chloroplast genome of Cypripedium calceolus J.For
39、.Res.,2021,34(5):177-185.21 尚明照,刘方,华金平,等.陆地棉叶绿体基因组密码子使用偏性的分析J.中国农业科学,2011,44(2):245-253.SHANG M Z,LIU F,HUA J P,et al.Analysis on codon usage of chloroplast genome of Gossypium hirsutum J.Sci.Agric.Sin.,2011,44(2):245-253.22 RUTH H,DMITRI A.Selection on Codon Bias J.Annu.Rev.Genet.,2008,42:287-299.2
40、3 李凤,辛静,辛雅萱,等.楸树叶绿体基因组密码子偏性分析J.南方农业学报,2021,52(10):2735-2743.LI F,XIN J,XIN Y X,et al.Codon usage bias of chloroplast genome in Catalpa bungei C.A.Mey.J.J.Southern Agric,2021,52(10):2735-2743.24 MURRAY E E,LOTZER J,EBERLE M.Codon usage in plant genes J.Nucl.Acids Res.,1989,17(2):477-498.25 赵森,邓力华,陈芬.
41、秋茄叶绿体基因组密码子使用偏好性分析J.森林与环境学报,2020,40(5):534-541.ZHAO S,DENG L H,CHEN F.Codon usage bias of chloroplast genome in Kandelia obovata J.J.For.Environ.,2020,40(5):534-541.26 SHARP P M,STENICO M,PEDEN J F.Codon usage:mutational bias,translation selection,or both?J.Biochem.Soc.T.,1993,4:835-841.27 KAWABE A,
42、MIYASHITA N T.Patterns of codon usage bias in three dicot and four monocot plant species J.Genes Genet.Syst.,2003,5:343-352.28 季凯凯,宋希强,陈春国,等.木兰科叶绿体基因组的密码子使用特征分析J.中国农业科技导报,2020,22(11):52-62.JI K K,SONG X Q,CHEN C G,et al.Codon usage profiling of chloroplast genome in Magnoliaceae J.J.Agric.Sci.Techno
43、l.,2020,22(11):52-62.29 沈宗芳,陆添权,张志荣,等.槲蕨属叶绿体基因组密码子偏好性分析J.广西植物,2021,41(2):266-273.SHEN Z F,LU T Q,ZHANG Z R,et al.Condon preference of chloroplast genome of Drynaria J.Guihaia,2021,41(2):266-273.30 王占军,李豹,姜行舟,等.两种茶树全基因组数据的密码子偏好性比较分析J.中国细胞生物学学报,2018,40(12):62-73.8210 期郭佳星等:桦木科叶绿体基因组密码子偏好性及系统发育分析WANG Z
44、 J,LI B,JIANG X Z,et al.Comparative analysis of the codon preference patterns in two species of Camellia sinensis based on genome data J.Chin.J.Cell Biol.,2018,40(12):62-73.31 周猛,童春发,施季森.杨树同义密码子用法的初步分析J.植物生理与分子生物学学报,2007,33(4):285-293.ZHOU M,TONG C F,SHI J S.A preliminary analysis of synonymous codo
45、n usage in poplar species J.J.Plant Physiol.Mol.Biol.,2007,33(4):285-293.32 原晓龙,李云琴,王毅,等.西南桦叶绿体基因组密码子偏好性分析J.基因组学与应用生物学,2020,39(12):5758-5764.YUAN X L,Li Y Q,WANG Y,et al.Analysis of codon usage in the chloroplast genome of Betula alnoides J.Genome Appl.Biol.,2020,39(12):5758-5764.33 赖瑞联,林玉玲,钟春水,等.龙眼生长素受体基因TIR1密码子偏好性分析J.园艺学报.2016,43(4):771-780.LAI R L,LIN Y L,ZHONG C S,et al.Analysis of codon bias of auxin receptor gene TIR1 in Dimocarpus longan J.Acta Hortic.Sin.,2016,43(4):771-780.(责任编辑:张冬玲)83