1、第 46 卷 第 2 期Vol.46 No.2 2024 年 2 月Feb.2024中 国 草 地 学 报Chinese Journal of Grassland赖草属叶绿体基因组密码子偏好性分析刘文丽1,王智勇2,田春育3,杨艳婷3,刘倩3,冯玉梅3,武自念3,*,李志勇3,*(1.青岛农业大学草业学院,山东 青岛 266109;2.内蒙古自治区林业和草原种苗总站,内蒙古 呼和浩特 010010;3.中国农业科学院草原研究所,内蒙古 呼和浩特 010010)摘要:以 16 种赖草属植物叶绿体基因组的 50 条基因序列为研究对象,使用密码子碱基组成分析、中性绘图分析、PR2-plot绘图分析、
2、ENC-plot绘图分析、基因参数相关性分析和聚类分析等多种生物信息学方法分析赖草属叶绿体基因组密码子偏好性,结果表明:(1)赖草属叶绿体基因组密码子富含 A 和 U,高频密码子也多以 A/U 结尾。(2)赖草属有效密码子数值在 39.8161.00 之间。(3)16 种赖草属植物根据聚类分析可分为两组,Leymus multicaulis、Leymus karelinii、Leymus racemosus、Leymus secalinus、Leymus ramosus、Leymus paboanus、Leymus duthiei、Leymus chinensis、Leymus arenari
3、us 为一组,Leymus coreanus、Leymus komarovii、Leymus triticoides、Leymus cinereus、Leymus condensatus、Leymus mollis、Leymus angustus 为一组。综合分析表明,16 种赖草属植物密码子偏好性受多种因素影响,选择作用影响较大,密码子的偏好性较弱,种间进化差异不显著,基因间偏差小。关键词:赖草属;叶绿体基因组;密码子偏好性;聚类分析;密码子使用模式中图分类号:S543.9 文献标志码:A 文章编号:1673-5021(2024)02-0014-10赖草属(Leymus)属于禾本科(Poac
4、eae)小麦族(Triticeae),属内多数种类是优良牧草,营养价值较高,具有耐寒、耐旱、耐碱等优良特性,是农业良种繁育、畜牧业牧草改良利用的重要基因资源1。目前,学者们已对赖草属植物进行了包括系统分类、地理学分布、基因表达等多方面的研究,但对其密码子使用特征尚不了解13。遗传密码是连接核酸和蛋白质的纽带,在生物体内遗传信息的传递中起重要作用4。密码子在编码氨基酸过程中存在不按比例使用的现象,称为密码子的偏好性(Bias)5。密码子偏好性是由多种因素引起的,在不同物种中,引起密码子偏好性的主要原因可能不同,其中,突变或自然选择是引起偏好性的主要因素6。叶绿体是植物的重要细胞器,具有单亲遗传的
5、特点,其基因组含有大量遗传资源且较为稳定,探索叶绿体密码子使用模式有助于从分子水平上探索植物进化过程7。近年来,对叶绿体基因组密码子偏好性的研究分析已经被应用于多个领域。学者们对相对同义密码子使用度(Relative synonymous codon usage,RSCU)特征值进行聚类分析,可以探索物种间亲缘关系,如:通过对 138种兰科(Orchidoideae)植物叶绿体基因组密码子进行聚类分析,从分子水平明确进化关系,可将其分为四个亚科8;分析密码子偏好性可以确定高表达基因,为基因工程的密码子改良提供依据,加快分子育种进程,如:南方菟丝子(Cuscuta australis)高表达基因
6、倾向于使用 G/C 结尾的同义密码子,进行基因工程研究时,基因表达载体构建选用G/C 结尾的密码子可以提高外源基因表达水平9。目前,叶绿体基因组特征分析已在扁蓿豆(Medicago ruthenica)10、澳洲坚果(Macadamia integrifolia)11、灰毛浆果楝(Cipadessa cinerascens)12、杓兰(Cypripedium calceolus)13等多个物种中进行,但对赖草属植物叶绿体密码子偏好性分析尚未有报道。本研究以 16 种赖草属植物叶绿体基因组密码子为研究对象,通过生物信息学手段分析密码子偏好性,并采用聚类分析、密码子使用模式平均值和标准偏差计算等方
7、法探索 16 种赖草属植物叶绿体基因的多样性程度和亲缘进化关系,以期为赖草属的系统分类和遗传育种提供理论依据。1材料与方法1.1数据来源本研究采用 NCBI公布的 16种赖草属植物叶绿体基因组数据,其中 13种来源于本实验室自测,3种来源于他人报道,详见表 11415。从每一种植物叶绿DOI:10.16742/j.zgcdxb.20220533*通信作者,E-mail:;收稿日期:2022-12-26;修回日期:2023-08-30基金项目:内蒙古自然科学基金(2022MS03073);中央级公益性科研院所基本科研业务费(Y2023PT02,1610332022001);内蒙古科技计划(202
8、0GG0127);“科技兴蒙”重点专项(2020-科技兴蒙-草种业技术创新中心-1)作者简介:刘文丽(1996-),女,山东潍坊人,在读硕士生,研究方向为农艺与种业,E-mail:.14刘文丽 王智勇 田春育等 赖草属叶绿体基因组密码子偏好性分析体基因组中挑选长度大于300 bp、起始密码子为ATG的基因,剔除重复基因和含有不明确碱基的基因。选用的基因编码序列分别为 atpA、atpB、atpE、atpF、atpI、ccsA、cemA、clpP、infA、matK、ndhA、ndhB、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK、petA、petB、
9、petD、psaA、psaB、psbA、psbB、psbC、psbD、rbcL、rpl14、rpl16、rpl20、rpl22、rpoA、rpoB、rpoC1、rpoC2、rps11、rps12、rps14、rps18、rps2、rps3、rps4、rps7、rps8、ycf3和 ycf4。从 16种植物中共获得 798条序列,用于密码子偏好性分析。其中,从Leymus arenarius和Leymus chinensis 中各获得 49 个编码序列(缺少 rpl16序列),从其余14种植物各获得50个编码序列。1.2分析方法1.2.1叶绿体基因组编码序列组成分析1.2.1.1密码子碱基组成分
10、析使用分析软件 CodonW1.4.2 对 16 种赖草属植物叶绿体基因组中 798条编码序列(4950条/植物)的密码子中第一位、第二位 GC 碱基(GC12),第三位GC 碱基(GC3s)和所有 GC 碱基(GC)的含量(%)进行分析。若基因密码子使用模式只由突变决定,不受自然选择影响,则基因序列按比例使用 4 个碱基4。即 GC含量越接近 50%,密码子偏好性越小。1.2.1.2PR2-plot绘图分析以 G3/(G3+C3)为横坐标,A3/(A3+T3)为纵坐标绘制平面图,进行 PR2(Parity rule 2)绘图分析,比较赖草属 16 种植物叶绿体基因组之间的碱基含量(%)差异1
11、617。其中,G3、C3、T3和 A3代表密码子第三位碱基为 G、C、T 和 A 的含量(%),图中中心点表示 G3=C3、A3=T3,在中心点的点代表没有偏好性,基因进化只受突变影响,其余的点则代表有偏好性,由中心向该点发出的矢量代表该位置基因的偏倚程度和偏倚方向18。1.2.1.3中性绘图分析以基因组的GC3含量(%)作为横坐标,GC12含量(%)为纵坐标,进行中性绘图分析。图中散点代表基因,回归系数表示密码子第一位、第二位GC(GC12)含量平均值与密码子第三位 GC(GC3s)含量的相关性,回归系数越接近于 1,表明密码子 3个位置碱基组成越相似,密码子偏好性受自然选择的影响越小19。
12、1.2.1.4GC含量与基因长度之间关系分析以基因长度为横坐标,以基因中的 GC12和 GC3含量(%)为纵坐标,进行 GC 含量与基因长度之间关系的绘图分析。图中的点代表基因,根据基因数量绘制折线图,分析随基因长度改变 GC12和 GC3含量的变化趋势。1.2.2叶绿体基因组密码子使用模式分析1.2.2.1ENC-plot绘图分析以 GC3含 量(%)为 横 坐 标,有 效 密 码 子 数(Effective number of codons,ENC)为纵坐标,构建二维散点图,同时在散点图中以 ENC预期值作标准曲线,ENC 预期值代表密码子偏好性只受突变影响2021。通过 ENC 实际值与
13、 ENC 标准曲线(理论值)对比,对产生密码子偏好性的影响因素进行分表 116种赖草属叶绿体基因组的详细信息Table 1Detailed information of 16 chloroplast genomes of Leymus species物种名称Species nameLeymus angustusLeymus arenariusLeymus chinensisLeymus cinereusLeymus condensatusLeymus coreanusLeymus duthieiLeymus kareliniiLeymus komaroviiLeymus mollisLeymu
14、s multicaulisLeymus paboanusLeymus racemosusLeymus ramosusLeymus secalinusLeymus triticoides登录号GenebankMZ595315MK775256.1NC_044900.1MZ595314MZ595313MZ595312NC_058748MZ595316NC_058744MZ595311MZ595317MZ595318MZ595319MZ595320MZ595321MZ595310基因组大小(bp)Genome size(bp)13509813678913678313603513505713690613
15、6869136727136470135059136481136885136756136788136763136024选择的编码序列数Number of selected coding sequence50494950505050505050505050505050文献来源Literature resources1415141414141514151414141414141415中国草地学报 2024 年 第 46 卷 第 2 期析。当实际 ENC 值与预期 ENC 值差异较小时,表明突变对密码子偏好性影响较大;反之,自然选择则是影响密码子偏好性的主要因素22。ENC 预期值的计算公式如下:EN
16、C(期望值)=2+GC3+29GC23+(1-GC3)2以 ENC 为 横 坐 标,密 码 子 偏 爱 指 数(Codon bias index,CBI)为纵坐标,进行散点图分析。图中散点代表基因,回归曲线斜率代表 ENC值和 CBI值的相关性,并分别绘制随 ENC 增长 CBI 的变化曲线、随 CBI增长 ENC 的变化曲线,分析二者的相关性和变化趋势。1.2.2.2密码子参数间相关性分析使用分析软件 CodonW 1.4.2对 16种赖草属植物叶绿体的密码子相关参数进行统计与分析,包括ENC、最佳密码子频率(Frequency of optimal codons,Fop)、密码子适应性指数
17、(Codon adaptation index,CAI)、CBI等,同时,对 16种赖草属植物基因组密码子进行相关性分析和显著性检验。1.2.2.3RSCU 分析计算 16 种赖草属植物叶绿体基因的相对同义密码子使用度,RSCU 大于 1 的密码子为高频率密码子,即该密码子的使用频率高于其他的同义密码子;RSCU 值小于 1 表示该密码子的使用频率低于其他的同义密码子;RSCU=1 表示密码子没有偏好性23。1.2.3叶绿体基因组的聚类分析利用 CodonW 软件计算叶绿体基因组 59 个密码子(不编码氨基酸的终止密码子 UAA、UGA、UAG 及编码色氨酸和蛋氨酸的唯一密码子 UGG和 AU
18、G 除外)的 RSCU 值,对 16种赖草属叶绿体基因进行聚类分析,构建亲缘关系树,明确 16 种赖草属植物之间的进化关系。1.2.4特定基因的密码子使用模式分析利用 Excel 软件计算 16 个赖草属物种 50 条基因序列密码子使用模式的平均值和标准偏差,研究所有特定基因之间的多样性程度。2结果与分析2.1赖草属叶绿体基因组编码序列的组成对 16 种赖草属物种叶绿体基因组中的 GC 总量(GCall)、密码子第一位和第二位 GC(GC12)含量及第三位 GC(GC3s)含量进行数量分布分析发现,三者的含量(%)均小于叶绿体基因组基因总数的50%,表明叶绿体基因组中编码基因的第三位碱基使用
19、A 和 U 的频率更高,且基因中 GC3s的含量低于总 GC 含量和 GC12含量(图 1-a)。通过 PR2 绘图对16个叶绿体基因组 798个编码序列中 G3、C3和 A3、T3含量之间的关系分析表明,赖草属叶绿体大多数基因主要分布于 G3/(G3+C3)0.5的区域(图 1-b),表明密码子第三位碱基的使用具有偏好性,即 C3的使用率高于 G3的使用率,A3的使用率高于 T3的使用率。中性绘图分析表明,代表基因的点只有少数落在对角线上,大部分点偏离对角线,GC12与 GC3的 R2为 0.0139,回归系数为 0.141(接近于零),GC12与 GC3的相关性不显著,且 GC12更中性,
20、偏性低(图 1-c)。综合三种方法分析结果表明,16种赖草属植物的基因进化是多种因素综合作用的结果,受自然选择影响较大,尤其第三碱基进化相对自由,受其他因素影响较小,受自然选择影响更大。此外,对 16 组叶绿体基因的基因长度和 GC 含量(GC3和 GC12)之间的关系进行分析(图 1-d)发现,GC含量与基因长度之间无相关关系,表明赖草属叶绿体基因长度与密码子偏好性没有明显关系。2.2赖草属叶绿体基因组密码子使用模式赖草属叶绿体基因 ENC值离散程度较大,基因间偏好程度差别较大,大部分基因分布在曲线下方较远位置,仅有少量基因沿标准曲线分布或落在标准曲线附近(图 2-a),说明自然选择影响对赖
21、草属植物叶绿体基因组偏好性的影响较强,随机突变等因素影响较弱。ENC 和 CBI 之间存在明显负相关(图 2-b)。从图 3可看出,GC12和 GC3s与 ENC 值都存在极显著的相关性(P0.01),表明 GC12和 GC3s与赖草属叶绿体密码子偏好性密切相关,GC3s与 ENC的相关系数更大,也表明第三碱基与 ENC值的关系更密切。ENC 和 CBI 存在极显著负相关(相关系数为0.33,P0.01),与前面研究结果(图 2-b)一致。CBI 和 Fop 之间也存在极显著的正向相关(相关系数为 0.92,P1,为高频密码子,且高频密码子只有 UUG 和 AUG 以 G 结尾,其余高频密码子
22、都以 A(13)和 U(16)结尾,表明以 A 和 U 结尾的密码子被更频繁使用。另外,16种赖草属植物的相同密码子的颜色相近,表明这 16种赖草属植物叶绿体基因组中给定密码子的 RSCU 值相似(图 4)。2.3赖草属叶绿体基因组的聚类分析根据 RSCU 值,利用 R 软件对 16种赖草属植物叶绿体基因组的密码子进行聚类分析,结果表明 16图 116个赖草属物种叶绿体基因组中 GC总量、GC12和 GC3含量的数量分布(a)、PR2-plot绘图分析(b)、中性绘图分析(c)和GC含量(GC12或 GC3)与基因长度之间关系分析(d)Fig.1Distribution of overall
23、GC,GC12 and GC3s(a),analysis of PR2-plot(b),analysis of neutrality plot(c),relationship of GC12 and GC3s with gene length(d)of the 16 Leymus chloroplast genomes图 2ENC-plot绘图分析(a)以及 ENC值和 CBI值关联分析(b)Fig.2Analysis of ENC and GC3 relationship(a)and analysis of ENC and CBI relationship(b)17中国草地学报 2024 年
24、 第 46 卷 第 2 期种 赖 草 属 植 物 可 分 为 两 大 类,其 中,Leymus multicaulis、Leymus karelinii、Leymus racemosus、Leymus secalinus、Leymus ramosus、Leymus paboanus、Leymus duthiei、Leymus chinensis、Leymus arenarius 为一 组,Leymus coreanus、Leymus komarovii、Leymus triticoides、Leymus cinereus、Leymus condensatus、Leymus mollis、Ley
25、mus angustus为一组(图 5)。2.4赖草属叶绿体特定基因的密码子使用模式分析从表 2 可看出,16 种赖草属植物 A、T、G、C 的平均值分别为 30.55%、30.74%、17.88%、20.83%,说明叶绿体基因富含碱基 A 和 T;GC3s的平均值为扇形面积和颜色深度代表相关性大小,有代表无相关性或在 P=0.05水平上显著相关,无代表在 P=0.01水平上显著相关,蓝色表示正相关,红色表示负相关。Ami.No为氨基酸数量。Sector area and color depth represent the magnitude of correlation,withrepres
26、enting no correlation or significant correlation at the P=0.05 level,norepresenting significant correlation at the P=0.01 level,blue indicates positive correlation,red indicates negative correlation.Ami.No is the number of amino acids.图 3赖草属植物密码子使用模式参数相关性分析Fig.3Correlation analysis among the paramet
27、ers of codon usage pattern in Leymus species图 416种赖草属植物叶绿体基因组的 RSCU 值Fig.4The RSCU values of the chloroplast genomes in 16 Leymus plants18刘文丽 王智勇 田春育等 赖草属叶绿体基因组密码子偏好性分析30.01%,GC12的平均值为 43.12%,GC3s小于 GC12且小于 50%,说明特定基因中 GC 在密码子 3 个位置上的分布并不均匀,且密码子偏向于以 A 和 U 碱基结尾,这与 GC 含量分布(图 1-a)结果相符;ENC值在 39.8161.00
28、之间,平均值为 46.99,CBI值在0.100.12 之间,平均值为 0.01,远小于 1.0,说明 16 种赖草属植物叶绿体基因组密码子的使用偏好性较弱。就遗传多样性的分散性而言,16种赖草属植物的 ENC值标准差整体较小,密码子的使用偏差程度较低,基因多样性较低。3讨论基因的 GC 含量在确定碱基组成形成偏好性原因过程中起着重要作用24。赖草属叶绿体基因组密码子GC含量分析、PR2-plot绘图分析、中性绘图分析和ENC绘图分析都表明其密码子使用模式受自然选择 影 响 较 大,与 酸 枣Ziziphus jujuba Mill.var.spinosa25、云南樟(Cinnamomum g
29、landuliferum)26等物种偏好趋势基本一致。赖草属叶绿体基因组中的大多数编码序列都富含 A 和 U,和扁蓿豆、澳洲坚果等物种叶绿体密码子使用模式相似1011。基因序列长度与密码子偏好性没有明显的相关性,但随着基因序列长度变大,GC含量的分布范围减小(图 1-d),这和Li等27的研究结果相似。基因组的 RSCU 值是评估密码子偏好程度的重要参数,当基因中某密码子的 RSCU 值大于 1,表示基因中该密码子的使用频率较高,具有偏好性。本研究结果表明,赖草属基因组使用频率高的密码子主要以 A 和 U 结尾,本研究结果与赖草属的近缘属冰草属(Agropyron)叶绿体基因组密码子的使用偏好
30、性一致28。根据 Bu 等29、Liu 等30、Chakraborty 等31的研究理论,物种种间越亲近,其密码子使用模式越相似,基因组之间类似的密码子偏好性可能意味着更密切的遗传关系,因此,可以利用密码子使用模式来判断基因组之间的进化距离。本研究对 16 种赖草属植物叶绿体基因组的 RSCU 值进行分析发现,不同种植物的相同密码子颜色极其相似(图 4),说明这 16种植物亲缘关系相近。同时,根据 16个赖草属物种叶绿体基因组的 RSCU 值聚类分析发现,16种赖草属植物可被分为两大组,其中 Leymus angustus、Leymus mollis、Leymus condensatus、Le
31、ymus triticoides、Leymus cinereus、Leymus komarovii和 Leymus coreanus为一组,Leymus multicaulis、Leymus paboanus、Leymus racemosus、Leymus ramosus、Leymus secalinus、Leymus arenariu、Leymus chinensis、Leymus duthiei、Leymus karelinii和 Leymus mollis为一组。此前本实验室也曾根据叶绿体基因组和蛋白质编码基因的数据将这 16种赖草属植物分为两组,每组包含的种也与本研究结论相同14。但以
32、前的研究根据性状划分,赖草属被分为 3 组,即多穗组、少穗组和单穗组,其中Leymus secalinus、Leymus multicaulis、Leymus angustus为一组,属于少穗组,Leymus racemosus 单独为一组(多穗组),其余的种为单穗组3233,表明 Leymus 图 5基于 RSCU 的聚类分析Fig.5Clustering analysis based on RSCU19中国草地学报 2024 年 第 46 卷 第 2 期secalinus、Leymus multicaulis、Leymus angustus 三者的亲缘关系较近,Leymus racemos
33、us与Leymus secalinus、Leymus multicaulis、Leymus angustus三者的亲缘关系相 对 较 远3233。而 本 研 究 的 聚 类 分 析 结 果 显 示Leymus secalinus、Leymus multicaulis、Leymus racemosus同属于一个组,Leymus angustus 属于另外一个组(图4)。这一结果与前人的判断不同 34,两种结果的可靠性还有待进一步研究。5种中亚赖草(Leymus racemosus、Leymus karelinii、Leymus multicaulis、Leymus ramosus和 Leymus
34、 paboanus)亲缘关系紧密,2 种北美赖草表 2赖草属植物叶绿体基因组典型基因的密码子使用模式Table 2Codon usage pattern of typical genes in chloroplast genomes of Leymus species基因 GeneatpA(n=16)atpB(n=16)atpE(n=16)atpF(n=16)atpI(n=16)ccsA(n=16)cemA(n=16)clpP(n=16)infA(n=16)matK(n=16)ndhA(n=16)ndhB(n=16)ndhC(n=16)ndhD(n=16)ndhE(n=16)ndhF(n=16
35、)ndhG(n=16)ndhH(n=16)ndhI(n=16)ndhJ(n=16)ndhK(n=16)petA(n=16)petB(n=16)petD(n=16)psaA(n=16)psaB(n=16)psbA(n=16)psbB(n=16)psbC(n=16)psbD(n=16)rbcL(n=16)rpl14(n=16)rpl16(n=14)rpl20(n=16)rpl22(n=16)rpoA(n=16)rpoB(n=16)rpoC1(n=16)rpoC2(n=16)rps11(n=16)rps12(n=16)rps14(n=16)rps18(n=16)rps2(n=16)rps3(n=16
36、)rps4(n=16)rps7(n=16)rps8(n=16)ycf3(n=16)ycf4(n=16)平均GC3s(%)29.910.1530.570.2238.050.2030.700.5631.680.2025.780.2828.730.2235.580.2238.810.3528.930.3725.770.3633.310.1033.780.7628.830.1925.300.0023.930.3726.000.3127.310.4026.140.4632.430.3029.420.2830.890.4231.890.4729.940.3133.140.2433.480.1033.420
37、.3629.550.2332.880.1233.780.5530.540.3323.830.3629.700.1832.340.2334.021.1028.040.1530.340.0930.640.4129.940.2023.530.2827.170.1333.190.8426.520.5830.570.3525.200.3626.610.1024.310.3627.900.0033.640.3132.800.8030.010.33GC12(%)47.910.1248.200.0045.130.1841.020.0742.260.1337.280.1534.940.1145.290.1239
38、.870.1936.070.2137.970.1640.510.0042.560.0038.380.0636.770.0038.210.0639.340.1342.800.0738.680.0943.730.0842.450.1044.740.0744.910.0045.030.0047.990.0245.860.0245.910.0050.100.0049.160.0048.420.0650.580.1045.970.0052.900.1139.590.0038.290.1140.960.1643.850.0343.890.0442.130.0553.500.0949.920.1642.79
39、0.0035.670.1140.400.1937.150.1542.190.1347.450.0041.610.0042.690.0043.530.0743.130.07ENC46.780.2745.860.1451.240.7149.940.2549.290.1341.120.2141.760.2850.320.7261.000.0046.730.3539.810.7246.310.0758.300.5744.240.5750.130.0043.510.4346.820.2246.300.6042.920.1249.550.1349.600.2648.050.1844.680.5144.98
40、0.4048.900.1246.550.2337.700.2845.460.1544.630.5246.770.7446.090.3147.000.3640.220.3553.110.0046.960.2847.990.3148.550.3249.840.2949.870.2141.950.2245.070.2346.080.2345.300.8449.161.1746.450.6150.810.5046.620.4543.880.0050.060.1545.460.6346.990.35A(%)30.430.0829.530.0531.270.1233.550.1926.800.0829.7
41、90.1829.870.0029.190.0038.120.4330.260.1029.540.1027.330.0021.810.1127.210.0728.100.0027.460.0626.870.1532.110.1133.870.1229.270.1131.430.1930.690.0824.020.0827.210.1124.820.0224.760.0422.650.0624.100.0323.500.0221.890.0627.820.2032.730.1632.940.2136.130.0735.830.1334.020.0832.170.0331.650.0934.010.
42、0731.060.1334.740.1135.060.2039.130.1333.300.1942.580.1335.000.1737.150.0036.250.0033.030.1025.240.1030.550.10T(%)27.590.0528.360.0426.100.0628.920.1134.480.0736.800.1137.130.1328.220.1222.170.2136.030.1836.680.1434.670.0338.640.2437.490.0338.560.0039.010.0538.340.1030.250.1131.530.1531.040.0030.270
43、.1129.210.1035.310.0832.710.0032.140.0633.520.0235.600.0832.660.0632.740.0434.570.1328.440.2328.880.1422.500.1226.940.0026.830.3329.550.0928.520.0328.920.0827.880.0325.590.1223.050.0425.680.1128.570.1029.830.0424.220.1027.960.0823.470.1127.250.0027.490.0034.800.2030.740.09C(%)19.510.0518.600.0518.58
44、0.0615.660.0919.560.0716.780.0815.540.1318.370.0815.450.1917.510.0816.490.2020.410.0315.910.2417.320.1317.320.0016.010.0417.230.1015.960.0816.710.1417.710.0019.540.0718.700.0518.170.0919.660.0520.920.0819.790.0319.950.0816.680.0419.380.0420.600.1619.130.1216.130.0020.170.1517.780.0018.400.2216.480.1
45、817.390.0217.780.0717.480.0618.230.1019.800.0517.090.1519.520.2716.140.0616.020.1717.540.2517.620.0015.570.0018.320.0017.630.1117.880.09G(%)22.470.0723.510.0424.050.1221.880.1819.160.0716.630.0817.460.0024.230.0924.260.0316.220.1017.300.0817.600.0323.640.1117.990.0316.010.0017.520.0917.560.1621.690.
46、0517.890.0821.980.1118.770.1321.400.1222.500.1520.420.1022.120.0221.930.0521.800.0626.560.0524.380.0322.930.0824.640.1222.260.1124.440.3019.150.0718.930.1219.960.0521.910.0321.650.1020.640.0325.120.1222.420.1722.180.3612.780.1220.740.2317.190.0619.490.1721.750.1120.920.0021.160.1022.330.1620.830.10C
47、BI0.040.000.060.000.080.000.050.010.010.00-0.100.000.000.01-0.060.02-0.060.00-0.060.00-0.020.010.040.000.020.010.020.01-0.080.00-0.020.01-0.030.00-0.080.010.090.01-0.050.010.010.01-0.020.00-0.040.01-0.090.000.020.000.000.000.300.00-0.010.000.080.000.120.000.120.000.070.010.000.01-0.050.00-0.030.010.
48、020.000.020.00-0.020.01-0.020.000.050.02-0.030.010.030.000.080.010.010.010.000.01-0.060.000.010.010.170.000.000.010.090.020.010.0120刘文丽 王智勇 田春育等 赖草属叶绿体基因组密码子偏好性分析(Leymus triticoides和 Leymus cinereus)关系接近且和2种中亚赖草(Leymus coreanus和 Leymus komarovii)进化距离近14,可能暗示地理分布与亲缘进化关系有一定相关性,需要进一步分析。另外,也有学者从核型、ITS 序
49、列、ISSR 标记等方面对赖草属的演化问题进行过研究,但目前对赖草属内种的划分比较混乱,对赖草属演化关系了解仍不够清晰3335。本研究从叶绿体密码子偏好性角度对 16 种赖草属植物系统进化关系进行了研究,可为研究赖草属的系统发育提供一些参考。ENC 值一般介于 20.0061.00之间,ENC 值等于 61.00 时代表密码子被均匀使用,ENC 值越低意味着密码子使用模式的偏好性越大36。本研究在 16种赖草属植物基因组中发现,infA 基因的 ENC 值均为 61.00,表明该基因的密码子被均匀使用,未受自然选择作用的影响。本研究中,叶绿体基因组 ENC值在 39.8161.00 之间近似均
50、匀分布,总体上密码子使用偏好性较弱。本研究结果与在灰毛浆果楝、杓兰等多种植物中的研究结果相似,即密码子偏性较弱,偏好性受多种因素影响,自然选择影响较大1213。CBI值可用于分析密码子使用模式形成原因,CBI=1时表明所有密码子均为偏向使用;CBI=0 时表明所有密码子随机使用,不具有偏向性37。本研究测得的 CBI平均值为 0.01,说明密码子偏性较弱。在 16 个赖草属植物叶绿体基因组的所有基因中,排除长度不符合要求的序列,本研究还对 50 种基因共计 798(5014+492)条编码序列进行分析,发现基因长度与密码子偏好性没有明显关系。此外,在 Leymus arenarius 和 Le