收藏 分销(赏)

珙桐叶绿体基因组同义密码子使用偏好性分析.pdf

上传人:自信****多点 文档编号:3655997 上传时间:2024-07-12 格式:PDF 页数:9 大小:1.58MB
下载 相关 举报
珙桐叶绿体基因组同义密码子使用偏好性分析.pdf_第1页
第1页 / 共9页
珙桐叶绿体基因组同义密码子使用偏好性分析.pdf_第2页
第2页 / 共9页
珙桐叶绿体基因组同义密码子使用偏好性分析.pdf_第3页
第3页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、DOI:10.12171/j.10001522.20220199珙桐叶绿体基因组同义密码子使用偏好性分析罗永坚1,2,3王茹1,2,3赵仁菲1,2,3卢新雄4尹广鹍4邓志军1,2,3,4(1.湖北民族大学生物资源保护与利用湖北省重点实验室,湖北恩施445000;2.湖北民族大学恩施州特色植物资源种质工程技术研究中心,湖北恩施445000;3.湖北民族大学林学园艺学院植物种质资源实验室,湖北恩施445000;4.中国农业科学院作物科学研究所作物种质资源中心,北京100081)摘要:【目的】珙桐是蓝果树科珙桐属唯一现存的第三纪孑遗植物,是我国一级保护的特有濒危树种。分析其叶绿体基因组同义密码子使用

2、偏好性及其主要影响因素,旨在为珙桐分子水平上的深入研究、物种保护和种质创新提供参考。【方法】从 NCBI 在线数据库下载完整的珙桐叶绿体基因组序列,并进行蛋白编码序列筛选,再利用 CodonW 软件计算各基因的有效密码子数(ENC)、密码子适应指数(CAI)、同义密码子相对使用度(RSCU)和密码子中 A、T、C、G 这4 种碱基的含量,最后利用 R 软件计算各参数间的相关性并绘图。【结果】(1)从珙桐叶绿体基因组中共筛选出 59 条蛋白编码序列,总的鸟嘌呤和胞嘧啶碱基(GC)平均含量和密码子第 3 位碱基的 GC 平均含量分别为 38.05%和 30.63%,CAI 平均值为 0.18,EN

3、C 平均值为 48.52,表明珙桐叶绿体基因组基因表达水平较低,且密码子使用偏好性较弱。(2)ENC-plot、PR2-plot、中性绘图和对应性分析表明,影响珙桐叶绿体基因组同义密码子使用偏好性的最主要因素为选择压力。(3)共筛选出 12 个最优密码子。【结论】珙桐叶绿体基因组同义密码子使用偏好性较弱,除了主要受选择压力影响外,还受到突变压力、碱基组成和基因表达水平等因素的影响;同时筛选出 12 个最优密码子,可用于未来珙桐的遗传改良和种质创新研究之中。关键词:珙桐;同义密码子偏好性;最优密码子;叶绿体基因组;氨基酸中图分类号:S792.99;Q755文献标志码:A文章编号:10001522

4、(2024)03000809引文格式:罗永坚,王茹,赵仁菲,等.珙桐叶绿体基因组同义密码子使用偏好性分析 J.北京林业大学学报,2024,46(3):816.LuoYongjian,WangRu,ZhaoRenfei,etal.AnalysisofsynonymouscodonusagebiasinthechloroplastgenomeofDavidia involucrataJ.JournalofBeijingForestryUniversity,2024,46(3):816.Analysis of synonymous codon usage bias in the chloroplas

5、tgenome of Davidia involucrataLuoYongjian1,2,3WangRu1,2,3ZhaoRenfei1,2,3LuXinxiong4YinGuangkun4DengZhijun1,2,3,4(1.HubeiKeyLaboratoryofBiologicResourcesProtectionandUtilization,HubeiMinzuUniversity,Enshi445000,Hubei,China;2.ResearchCenterforGermplasmEngineeringofCharacteristicPlantResourcesinEnshiPr

6、efecture,HubeiMinzuUniversity,Enshi445000,Hubei,China;3.ThePlantGermplasmResourcesLaboratory,SchoolofForestryandHorticulture,HubeiMinzuUniversity,Enshi445000,Hubei,China;4.CenterforCropGermplasmResources,InstituteofCropSciences,ChineseAcademyofAgriculturalSciences,Beijing100081,China)Abstract:Object

7、iveDavidia involucrataistheonlyexistingtertiaryrelictplantofgenusDavidiainthefamily Nyssaceae.It is a unique endangered tree species under first-class protection in China.The收稿日期:20220523修回日期:20220810基金项目:国家自然科学基金项目(31860073),生物资源保护与利用湖北省重点实验室 2022 年度开放基金(PT012212)。第一作者:罗永坚。主要研究方向:野生动植物保护与利用。Email:地

8、址:445000湖北省恩施市湖北民族大学林学园艺学院。责任作者:邓志军,博士,副教授。主要研究方向:种子生物学。Email:地址:同上。本刊网址:http:/;http:/第46卷第3期北京林业大学学报Vol.46,No.32024年3月JOURNALOFBEIJINGFORESTRYUNIVERSITYMar.,2024synonymous codon usage bias(SCUB)of chloroplast genome and its main influencing factors wereanalyzed to provide a reference for further re

9、search at the molecular level,species conservation andgermplasminnovationoftheD.involucrata.MethodThecompletechloroplastgenomeofD.involucratawas downloaded from the NCBI online database and the protein-coding sequences were screened.Theeffectivenumberofcodon(ENC),codonadaptationindex(CAI),therelativ

10、esynonymouscodonusage(RSCU),andthecontentsoffourbases,A,T,C,andGinthecodonwerecalculatedbyCodonWsoftware.Finally,thecorrelationbetweentheparameterswerecalculatedandtheplotsweremakenusingRsoftware.Result(1)Atotalof59protein-codingsequenceswerescreenedfromthechloroplastgenomeofD.involucrata.Theaverage

11、guanineandcytosinebases(GC)contentandtheaverageGCcontentofthethirdbaseofthecodonswere38.33%and30.68%,respectively.TheaverageCAIwas0.16andtheaverageENCwas46.55,indicatingthatthechloroplastgenomegeneexpressionlevelofD.involucratawaslowandthecodonusebiaswasweak.(2)Enc-plot,PR2-plot,neutralplotandcorres

12、pondenceanalysisrevealedthatselectionpressurewasthemostimportantfactoraffectingSCUBofD.involucratachloroplastgenome.(3)Atotalof12optimalcodonswereselected.ConclusionTheSCUBofchloroplastgenomeinD.involucrataisweak,anditsSCUBisnotonlymainlyaffectedbyselectionpressure,butalsoaffectedbyfactorssuchasmuta

13、tionpressure,basecompositionandgeneexpressionlevel.Meanwhile,atotalof12optimalcodonsareselected,whichcanbeusedinfuturegeneticimprovementandgermplasminnovationresearchofD.involucrate.Key words:Davidia involucrata;synonymouscodonusagebias;optimalcodon;chloroplastgenome;aminoacid密码子是 mRNA 翻译的基本信息单位,除甲硫

14、氨酸和色氨酸仅由 1 个密码子编码外,其余氨基酸均由多个同义密码子编码1。同义密码子在翻译过程中并非随机使用,而是具有偏好性,即同义密码子偏好性(synonymouscodonusagebias,SCUB)2。SCUB 以非随机方式广泛存在于多种生物中,反映了生物适应环境过程中的一些进化事件3。SCUB主要由自然选择和突变压力所引起,此外还受到基因表达水平、tRNA 丰度、蛋白质长度、基因翻译起始信号、蛋白质结构、鸟嘌呤和胞嘧啶碱基(guanineandcytosinebases,GC)含量、突变频率与模式、以及随机遗传漂移等因素的影响2,47。因此,同义密码子使用偏好性分析有助于新基因发现、

15、基因功能预测、转基因设计以及对生物分子进化和环境适应的理解8。叶绿体在植物光合作用和代谢物生物合成过程中起着重要作用9。与核基因相比,叶绿体基因转化具有外源基因表达效率高、定点整合无位置效应、遗传稳定、不随花粉漂移等优点,现已被广泛用于分子进化、系统发育和遗传表达等研究领域10。随着高通量测序技术的不断发展,目前关于叶绿体基因组密码子偏好性的研究越来越多,如巨桉(Eucalyptusgrandis)11、金 莲 花(Trollius chinensis)12、紫 菜(Porphyra umbilicalis)13、桔梗(Delphiniumgrandiflorum)14、大戟科(Euphorb

16、iaceae)植物15和水稻(Oryza sativa)16等,极大地促进了这些物种的种质创新和开发应用。珙桐(Davidia involucrata)是蓝果树科(Nyssaceae)珙桐属唯一现存的第三纪孑遗植物,也是我国特有的濒危树种,被称为“活化石”1718。珙桐具有较高的研究价值、观赏价值和药用价值。自 1869 年被发现以来,科学家们在其分类学、形态学、生理学、生态学、繁殖育种等方面都进行了大量研究1922。然而,在分子水平上的研究却进展缓慢23,限制了该物种的深入研究。本研究通过生物信息学方法分析珙桐叶绿体基因组的同义密码子偏好性,旨在为珙桐的遗传进化、系统发育、分子育种和物种保护

17、等方面的进一步研究提供参考。1材料与方法1.1 基因序列获取从 NCBIGenBank 下载珙桐叶绿体基因组(登录号:KR061358.1)。序列全长为 169085bp,包含82 个蛋白编码基因。参照 Duan 等14的方法剔除长度小于 300bp 的编码序列,并选择以 ATG 为起始密码子、以 TAA、TAG 和 TGA 为终止密码子的编码序列,最终筛选出 59 条序列进行后续分析研究。1.2 密码子使用指数使用在线工具(http:/112.86.217.82:9919/#/tool/alltool/detail/214)计算珙桐叶绿体基因组的 SCUB相关指标,包括基因 GC 含量(GC

18、all)、密码子第 1、第3期罗永坚等:珙桐叶绿体基因组同义密码子使用偏好性分析92、3 位 GC 含量(GC1、GC2、GC3)、同义密码子相对使用度(relativesynonymouscodonusage,RSCU)、密码子适应指数(codonadaptationindex,CAI)和有效密码子数(effectivenumberofcodon,ENC)1415。RSCU 值表示编码氨基酸的所有密码子的平均使用次数,RSCU=1 时,表示同义密码子无偏好;RSCU1时,表示同义密码子偏好性强;而 RSCU1 的密码子为高频密码子,高表达组与低表达组 RSCU 差(RSCU)0.08 的为高

19、表达密码子,RSCU0.08 且 RSCU1 的密码子判定为最优密码子。2结果与分析2.1 珙桐叶绿体密码子组成特征利用 perl 脚本除去长度小于 300bp 的叶绿体基因,共获得 59 个独特基因,包括 28 个光合作用基因(psa、psb、pet、atp、ndh、rbcL)、18 个核糖体基因(rps、rpl)、4 个遗传系统基因(rpo)、4 个保守基因(ycf)及 5 个其他基因(matK、accD、cemA、clpP),这些基因全长 85229bp,占基因组全长的 54.1%,长度范围在 3031070bp 之间,平均长度为 386bp。对其进行密码子偏好性指标分析(表 1)发现:

20、叶绿体基因平均 GC 含量为 38.05%,其中 GC1(44.51%)GC2(38.83%)GC3(30.63%),ENC 值范围在37.0458.78 之间,平均值为 48.52;CAI 值范围在 0.080.32 之间,平均值为 0.18。以上结果表明,珙桐叶绿体基因组的第 3 个位置上的 GC 含量明显低于前2 个位置,偏好使用碱基 A 或 U,基因表达水平较低,且密码子使用偏好性较弱。RSCU 分析(图 1)显示:高频密码子(RSCU1)共有 27 个,其中 13 个以 U 结尾,12 个以 A 结尾,2 个以 G 结尾,以 U 和A 结尾的密码子占 92.59%。说明珙桐叶绿体基因

21、组密码子的使用更倾向于使用以 U 或 A 结尾的同义密码子。2.2 中性绘图分析图 2 显示:GC12(GC1和 GC2的平均值)的取值范围在 34.09%56.12%之间,GC3的取值范围在17.3%42.7%之间,GC12和 GC3的相关系数和斜率分别为 0.1092 和0.3251,斜率接近 0。说明珙桐10北京林业大学学报第46卷表1珙桐叶绿体基因组密码子 GC 含量及 CAI 和 ENC 值Tab.1GCproportion,CAIandENCinchloroplastgenomicsofDavidia involucrata基因GeneCAIENCGC含量GCcontent基因Ge

22、neCAIENCGC含量GCcontentGCall/%GC1/%GC2/%GC3/%GCall/%GC1/%GC2/%GC3/%rps80.0837.0436.1339.8643.3625.17ycf20.1548.5337.7837.0835.0041.25rps180.1137.5735.2935.2944.1226.47ndhK0.1648.5538.0544.2544.6925.22rps140.1138.0941.9144.5549.5031.68ycf40.1648.8238.1042.3339.6832.28ndhE0.1640.4132.6838.2435.2924.51rp

23、oB0.1548.8538.9450.8937.7228.20psbA0.3240.8242.6650.2843.5034.18psbB0.2048.8644.4754.8145.9732.61ndhF0.1543.7232.7137.7235.9724.43rpoA0.1649.6434.6244.3832.8426.63ndhF0.1543.7232.7137.6336.1624.60rps40.1449.8439.2751.9839.1126.73rps30.1643.8735.6247.4933.3326.03rps20.1849.9539.6644.7344.3029.96psbD0

24、.2544.4242.2852.2643.2231.36rpoC20.1550.0437.9745.8238.5029.58rps70.1945.0340.6053.2145.5123.08matK0.1550.1334.1941.3932.0829.11rps70.1945.0340.6053.2145.5123.08atpE0.1651.0239.8051.4939.5528.36rpl230.1345.7537.3940.0041.7430.43ndhH0.1651.1339.2651.5237.0629.19ndhG0.1345.9634.0944.0733.9024.29ycf20.

25、2151.2237.7836.7032.1139.45atpB0.2146.1242.4856.3142.0829.06ndhA0.1451.2633.1736.4232.1130.98ndhD0.1446.2435.2941.3736.8627.65clpP0.1651.3136.2137.2838.0633.29psbC0.1846.2544.0253.3846.2032.49ndhJ0.1551.3740.2551.5737.7431.45ndhC0.2046.4134.4445.4533.0624.79ndhB0.1751.7837.8436.6039.3337.58rpl220.20

26、46.7034.6043.6736.0824.05ndhB0.1652.5137.8435.8241.3336.40rps110.1546.7544.8454.6857.5522.30petA0.1853.1439.9852.3437.0730.53cemA0.2046.7833.6240.8729.1330.87ycf30.1553.1935.9234.7839.4933.48rpl140.1846.8041.4656.1037.4030.89petD0.1653.2036.7238.4130.4441.31atpF0.1346.8536.2533.8834.3040.58rpl160.13

27、54.3734.6638.1635.0130.82accD0.1946.9033.0436.0135.1227.98rpoC10.1556.0537.9938.8233.1242.03atpI0.1847.1737.9048.3937.9027.42rps160.1656.3334.9240.6331.9332.19rpl200.0947.5536.1638.9844.0725.42rps120.1556.5839.7444.2140.1434.86atpA0.2047.6040.9455.1240.5527.17petB0.1557.4036.2338.5231.1539.01psaB0.1

28、847.7140.9148.7142.9931.02rpl20.1558.1242.0839.3245.6441.29rbcL0.2847.8643.7757.7743.7029.83rpl20.1458.7842.0845.2738.6341.53psaA0.2048.4042.7952.7343.4132.22rpl230.2348.6837.3941.0333.3333.33ndhI0.1948.5234.7242.2636.3125.60平均值Mean0.1848.5238.0544.5138.8330.63注:CAI.密码子适应指数;ENC.有效密码子数;GCall.基因中所有密码子

29、的的GC含量;GC1.基因中所有密码子的第1位的GC含量;GC2.基因中所有密码子的第2位的GC含量;GC3.基因中所有密码子的第3位的GC含量。Notes:CAI,codonadaptationindex;ENC,effectivenumberofcodon;GCall,GCcontentofallcodonsinthegene;GC1,theGCcontentinposition1ofallcodonsinthegene;GC2,theGCcontentinposition2ofallcodonsinthegene;GC3,theGCcontentinposition3ofallcodon

30、sinthegene.7654RSCU321*Ter Ala Cys Asp Glu Phe Gly HisIle Lys Leu Met Asn氨基酸 Amino acidPro Gln Arg Ser Thr Val Trp TyrRSCU.同义密码子相对使用度。*Ter 为终止密码子。RSCU,relativesynonymouscodonusage.*Terisstopcodon.图1珙桐叶绿体基因组同义密码子偏好性分析Fig.1SynonymouscodonusagebiasanalysisofchloroplastgenomeofD.involucrate第3期罗永坚等:珙桐叶绿体

31、基因组同义密码子使用偏好性分析11叶绿体基因组基因密码子的 3 个碱基在组成上存在较大差异,自然选择对珙桐叶绿体基因组密码子使用偏好的影响较大。70605040GC12/%GC3/%3020100102030405060y=0.325 1x+51.627R2=0.109 27080GC12.GC1和 GC2的平均值;GC3.密码子第 3 位 GC 含量。GC12,averageofGC1andGC2;GC3,thethirdGCcontentofcodon.图2珙桐叶绿体基因组中性绘图分析Fig.2NeutralityplotanalysisofchloroplastgenomeofD.inv

32、olucrata2.3 ENC-plot 分析通过构建 ENC-plot 图分析造成密码子使用偏好的主要影响因素,发现大部分基因都聚集在ENC 标准曲线附近,说明大多数基因的 ENC 检测值(ENCobs)与 ENC 标准值(ENCexp)很接近(图 3)。通过计算 ENC 比值,来进一步量化 ENCobs与 ENCexp之间的差异。结果(表 2)显示:35 个基因(59.32%)的 ENC 比值位于0.050.05 区间,表明 ENCobs值与 ENCexp值略有差异,意味着选择压力并不是影响珙桐密码子使用偏好性的唯一因素,突变压力也是偏好性的重要影响因素之一。2.4 PR2-plot 偏倚

33、分析PR2-plot 分析结果(图 4)显示:氨基酸密码子第 3 位碱基分布并不均匀,38 个基因的 A3/(A3+T3)小于 0.5,35 个基因的 G3/(C3+G3)大于 0.5,说明在总体上,基因组密码子中 A 与 T 的比例接近,G 与C 的比例接近。然而,从图 4 也可以看出,很多基因并非聚集在平面图中心,而是分布在距离中心点较远的位置,大部分位于平面图的下半部和右半部,表明密码子第 3 位碱基嘧啶碱(T 和 C)的使用频率高于嘌呤碱(A 和 G),意味着突变压力不是珙桐叶绿体基因组的同义密码子使用偏好的唯一影响因素,其他因素对珙桐叶绿体基因组的同义密码子使用偏好也产生一定影响11

34、。1.00.500.5G3/(C3+G3)A3/(A3+T3)1.0A3.密码子第 3 位 A 碱基的含量;T3.密码子第 3 位 T 碱基的含量;G3.密码子第 3 位 G 碱基的含量;C3.密码子第 3 位 C 碱基的含量。A3,adenine(A)contentatthethirdpositionofcodon;T3,thymine(T)contentatthethirdpositionofcodon;G3,guanine(G)contentatthe third position of codon;C3,cytosine(C)content at the thirdpositionof

35、codon.图4珙桐叶绿体基因组 PR2-plot 绘图分析Fig.4AnalysisofPR2-plotofchloroplastgenomesofD.involucrata2.5 对应性分析对珙桐所有基因的 SCUB 的参数进行对应性分析。结果表明:前 4 个轴占总贡献率的 50.20%,第 1、2、3 和 4 轴(Axis1、2、3 和 4)贡献率分别为 18.64%、11.58%、10.34%和 10.64%,说明 Axis1 是密码子使用偏好性的主要变异来源。以 Axis1 为横坐标,Axis2 为纵坐标,将 5 类基因分布于平面,发现光合基因、遗传基因和其他基因分布相对集中,而核糖

36、体和保守基因较为分散(图 5),说明核糖体蛋白和保守基因的密码子使用偏好性相差较大,而其他基因的密码子使用偏好性相差较小。为确定密码子使用偏好性的影响因素,分别计算 CAI、ENC、GC3、GC12与 Axis1 之间的相关系数,结果(表 3)显示:Axis1706050403020100204060GC3/%80100ENC曲线为 ENC 标准曲线。ThecurveisENCstandardcurve.图3珙桐叶绿体基因组的 ENC-plot 绘图分析Fig.3ENC-plotanalysisofchloroplastgenomesofD.involucrata表2ENC 比值的频率分布Ta

37、b.2FrequencydistributionofENCratio组限Groupvaluerange组中值Groupmid-value组数Groupnumber频率Frequency/%0.250.150.2610.170.150.050.11220.340.050.0503559.320.050.150.168.4712北京林业大学学报第46卷与 ENC(r=0.6850,P0.01)、GC3(r=0.9270,P0.01)和 CAI(r=0.1390,P0.05)均显著或极显著负相关,与 GC12极显著正相关(r=0.4060,P0.01),表明珙桐叶绿体基因组基因密码子使用模式除了受突

38、变压力的影响外,还受选择压力的影响。光合基因 Photosynthetic gene保守基因 Conserved gene核糖体基因 Ribosomal gene遗传基因 Inherited gene其他基因 Other gene1.0第 1 轴 Axis 1第 2 轴 Axis 21.00.80.60.40.20.80.60.40.20.20.20.40.60.81.00.40.60.81.00图5珙桐叶绿体基因组同义密码子使用与编码基因的对应分析Fig.5CorrespondenceanalysisofsynonymouscodonusagetowardsthecodinggenesinD

39、.involucratachloroplastgenome表3珙桐叶绿体基因组密码子偏好指标相关性分析Tab.3CorrelationanalysisofcodonusageindexofchloroplastgenomesofD.involucrata参数ParameterAxis1ENCCAIGC12GC3ENC0.6850*CAI0.1390*0.0655*GC120.4060*0.24000.3610*GC30.9270*0.6250*0.04040.3300GCall0.13300.13700.3560*0.8170*0.2630*注:*.显著相关(P0.05);*.极显著相关(P0

40、.01)。Notes:*,asignificantcorrelationatP0.05level;*,ahighlysignificantcorrelationatP0.01level.密码子使用指数之间的相关性分析(表 3)表明:CAI 分别与 GCall(r=0.3560,P0.01)、GC12(r=0.3610,P0.01)极显著正相关,与ENC(r=0.0655,P0.01)极显著负相关,其中 CAI 值是基因表达水平的重要指标,说明基因表达水平除了主要受碱基的影响外,也受到密码子偏好性的显著影响。ENC仅与 GC3极显著正相关(r=0.6250,P0.01),表明密码子第 3 位碱基

41、组成对密码子偏好性影响较大;而碱基之间的相关分析(表 3)表明,GCall分别与GC12、GC3呈极显著(r=0.8170,P0.01)和显著正相关(r=0.2630,P1 为标准共筛选出 37 个高频密码子,以 RSCU0.08 为标准共筛选出 27 个高表达密码子(表 4)。其中,高表达密码子以 A 或 T 结尾的共有 21 个,以 C 或 G 结尾的共有 6 个。以 RSCU1 且 RSCU0.08 为标准共筛选出 12 个最优密码子,分别为 UUA、AUU、GUU、GUA、GCU、UAU、UAA、CAU、AAU、AAA、GAU 和 UGU,所有最优密码子均以 A 或 U 结尾(表 4)

42、,表明密码子更倾向于使用 A 或 U 结尾,这与前面 RSCU 分析的结果(图 1)相一致。3讨论植物叶绿体和线粒体基因组的同义密码子使用偏好性与核基因的同义密码子使用偏好性在进化速率和模式上有所不同,植物叶绿体和线粒体基因组的同义密码子使用偏好性除了主要受 DNA 序列的定向突变压力和选择压力影响外29,还受 tRNA 丰度、链特异突变偏倚、基因表达水平和基因长度等因素的影响2,47,这些影响因素被广泛地用于解释种间密码子使用变异和基因组内密码子使用变异情况8。其中,叶绿体基因组的 GC 含量是与突变压力平衡适应的结果,这是密码子使用偏好性形成过程中最普遍的影响因素之一14。而密码子第 3

43、位碱基的同义突变虽然不能改变氨基酸的类型,但它仍然被认为是决定氨基酸类型的重要特征,因此 GC3经常被用作密码子使用偏好性的重要指标30。当密码子的使用主要受选择压力的影响时,GC3值往往分布在一个较小的范围内,且 GC12和 GC3之间没有显著的相关性31。在本研究中,GC3含量平均值为30.63%,低于于水稻(Oryza sativa)16、玉米(Zeamays)29、小麦(Triticum aestivum)32等单子叶农作物33。这或许是因为:单子叶植物与双子叶植物进化分离后,单子叶植物叶绿体基因组中编码序列的GC 含量有普遍增加的趋势29。探究突变压力和选择压力对植物进化及育种的影响

44、具有重要意义,中性绘图分析发现 GC12和 GC3之间并不存在显著相关性,说明珙桐叶绿体基因组的同义密码子使用偏好性主要受选择压力的影响,这与大部分被子植物的研究结果15,28,3436相一致,说明在长期进化过程中植物叶绿体基因组同义密码子使用偏好性相对保守且高度相似。通过 ENC-plot 分析叶绿体基因组中同义密码子使用偏好性是否受到突变压力的影响,显示大多数基因位于标准曲线附近,只有少数基因偏离预期曲线较远(图 3),表明除了选择压力外,突变压力也参与了某些基因的同义密码子使用偏好性。然而,仅凭 ENC-plot 无法单独区分同义密码子使用偏好性主要受到突变压力还是选择压力的影响。在本研

45、第3期罗永坚等:珙桐叶绿体基因组同义密码子使用偏好性分析13究中,通过结合中性绘图和 PR2-plot 分析,发现 G、C 和 A、T 碱基对在密码子第 3 个位置上的使用并不均等(图 4)。根据 Frank37的观点,如果突变压力是同义密码子使用偏好性的主要原因,那么 G、C 和 A、T 碱基对会在密码子中被均匀使用;相反,如果选择压力是主要原因,则 G、C 和 A、T 碱基对不会被均匀使用。综合中性绘图和 PR2-plot 的分析结果发现,珙桐叶绿体基因组的同义密码子使用偏好性主要受到自然选择压力的影响。此外,RSCU 通常表示密码子偏好性的强弱24,为探究基因表达水平和碱基等因素对珙桐同

46、义密码子使用偏好性的影响,基于 RSCU 的对应分析结果表明,Axis1 与CAI、GC3、GC12、ENC 均显著或极显著相关(表 3)。结合中性绘图、ENC-plot、PR2-plot 和对应性分析结果发现:珙桐叶绿体基因组同义密码子使用偏好性除了主要受选择压力影响外,还受到突变压力、碱基组成、基因表达水平等因素的影响,这一结果与麻风树(Jatropha curcas)38和马尾松(Pinus massoniana)39等木本植物的研究结果相类似。近年来,农作物叶绿体转化在抗盐、抗旱、抗除表4珙桐叶绿体基因组的最优密码子Tab.4Optimalcodonsinchloroplastgeno

47、meofD.involucrata氨基酸Aminoacid密码子Codon高表达基因Highexpressedgene低表达基因LowexpressedgeneRSCU氨基酸AminoAcid密码子Codon高表达基因Highexpressedgene低表达基因LowexpressedgeneRSCU数目NumberRSCU数目NumberRSCU数目NumberRSCU数目NumberRSCU亮氨酸LeuUUA*541.59261.280.31酪氨酸TyrUAU*501.39251.040.35UUG451.32301.480.16UAC220.61230.960.35CUU*411.211

48、20.590.62*TerUAA*51.88321.160.72CUC170.5190.930.43UGA20.75311.120.37CUA320.94241.180.24UAG10.38200.720.34CUG150.44110.540.1组氨酸HisCAU*341.36141.270.09异亮氨酸IleAUU*741.52401.190.33CAC160.6480.730.09AUC*491.01230.680.33谷氨酰胺GlnCAA461.44261.440AUA230.47381.130.66CAG180.56100.560甲硫氨酸metAUG5812110天冬酰胺AsnAAU*

49、661.28251.020.26缬氨酸ValGUU*491.39191.210.18AAC370.72240.980.26GUC130.37130.830.46赖氨酸LysAAA*601.46461.230.23GUA*661.87181.140.73AAG220.54290.770.23GUG130.37130.830.46天冬氨酸AspGAU*591.37201.050.32丝氨酸SerUCU*482.0380.981.05GAC270.63180.950.32UCC*230.9770.860.11谷氨酸GluGAA*991.56370.940.62UCA*251.0680.980.08G

50、AG280.44421.060.62UCG70.360.730.43半胱氨酸CysUGU*121.2101.110.09AGU261.1111.350.25UGC80.880.890.09AGC130.5591.10.55色氨酸TrpUGG4112510脯氨酸ProCCU*522.1290.971.15精氨酸ArgCGU*452.2140.361.85CCC140.5750.540.03CGC*120.5910.090.5CCA190.78161.730.95CGA*231.1380.720.41CCG130.5370.760.23CGG50.2520.180.07苏氨酸ThrACU*6325

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服