收藏 分销(赏)

四倍体油茶全基因组SSR位点开发与特征分析.pdf

上传人:自信****多点 文档编号:2499736 上传时间:2024-05-30 格式:PDF 页数:10 大小:3.03MB
下载 相关 举报
四倍体油茶全基因组SSR位点开发与特征分析.pdf_第1页
第1页 / 共10页
四倍体油茶全基因组SSR位点开发与特征分析.pdf_第2页
第2页 / 共10页
四倍体油茶全基因组SSR位点开发与特征分析.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Vol.44 No.3Mar.2024第 44 卷 第 3 期2024 年 3 月中 南 林 业 科 技 大 学 学 报 Journal of Central South University of Forestry&Technologyhttp:/收稿日期:2022-11-01基金项目:湖南省林业科技创新项目(XLK202101-2);湖南省研究生科技创新项目(CX20220713);中南林业科技大学研究生科技创新基金项目(2022CX02011)。第一作者:童海浪(),硕士研究生。通信作者:韩志强(),副教授,博士,硕士生导师。引文格式:童海浪,张华健,李健,等.四倍体油茶全基因组 SSR

2、 位点开发与特征分析 J.中南林业科技大学学报,2024,44(3):126-135.TONG H L,ZHANG H J,LI J,et al.Development and characterization of whole genome SSR in tetraploid Camellia oleiferaJ.Journal of Central South University of Forestry&Technology,2024,44(3):126-135.四倍体油茶全基因组 SSR 位点开发与特征分析童海浪,张华健,李 健,邓红达,韩志强(中南林业科技大学 林木遗传育种实验室,湖

3、南 长沙 410004)摘 要:【目的】传统的油茶育种工作效率低、周期长,分子标记辅助育种已成为推动油茶遗传改良的必要方法,对油茶基因组 SSR 位点进行整体统计分析,为提高油茶的选育效果、缩短选育周期提供了一条有效途径。通过对四倍体油茶基因组 SSR 位点进行搜索,统计分析其基因组 SSR 序列的分布模式及特征,获得优质、有价值的 SSR 分子标记位点,为进一步开展油茶品种的遗传分析、分子标记辅助育种、指纹鉴定等研究工作提供便利条件。【方法】本研究基于已获得的四倍体油茶全基因组数据,使用 MISA 软件全面搜索基因组中 1 6核苷酸各重复类型的 SSR 位点,统计分析其分布模式及特征,通过

4、Primer3.0 软件进行批量 SSR 引物设计。【结果】在全长为 11 069 152 038 bp 的四倍体油茶全基因组中共搜索到不同类型 SSR 位点 6 254 681 个,一共鉴定出 463 个不同重复基元,平均 1.77 kb 出现一个 SSR 位点;出现频率最高的是单核苷酸重复类型 SSR 位点,占比 62.08%,六核苷酸重复类型 SSR 位点数量最少,仅占比 0.46%;在四倍体油茶基因组 SSR 序列中 A、T 碱基占据绝对优势,而 G、C 含量较少,具有碱基偏好性。四倍体油茶基因组各类型 SSR 序列的整体长度区间为10 187 bp,平均长度 15.57 bp;除单核

5、苷酸重复类型,长度 20 bp 的 SSR 序列占全部 SSR 序列的 15.75%,其中二、三、四核苷酸三种重复类型 SSR 长度变异程度显著高于五、六核苷酸重复类型,因此,二、三、四核苷酸重复类型为设计SSR引物的主要标记来源;基于四倍体油茶基因组SSR位点数据,共开发引物1 358 248对。【结论】本研究首次对四倍体油茶全基因组中 SSR 位点的分布模式与特征进行整体统计分析,并批量开发 SSR引物,为油茶分子标记辅助育种提供参考。关键词:四倍体油茶;基因组;SSR;核苷酸中图分类号:S794.4 文献标志码:A 文章编号:1673-923X(2024)03-0126-10Develo

6、pment and characterization of whole genome SSR in tetraploid Camellia oleiferaTONG Hailang,ZHANG Huajian,LI Jian,DENG Hongda,HAN Zhiqiang(Laboratory of Forestry Genetics,Central South University of Forestry&Technology,Changsha 410004,Hunan,China)Abstract:【Objective】Traditional breeding of Camellia o

7、leifera has low efficiency and long cycle,and molecular marker-assisted breeding has become a necessary method to promote the genetic improvement.The overall statistical analysis of the SSR loci of genome provides an effective vehicle,which help to improve the breeding effect and shorten the breedin

8、g cycle of C.oleifera.Obtaining high-quality and valuable SSR molecular marker loci by searching and analyzing the distribution pattern and characteristics of SSR loci of tetraploid C.oleifera genome can provide convenient conditions for further research on genetic analysis,molecular marker assisted

9、 breeding and fingerprint identification.【Method】Based on the whole genome data of tetraploid C.oleifera,the SSR loci of 1-6 nucleotide repeat types were searched comprehensively and the distribution pattern and characteristics of types of SSR were counted by MISA.SSR primers were designed by Primer

10、 3.0 software.【Result】A total of 6 254 681 SSR loci of different types were found in the whole genome of tetraploid C.oleifera with a total length of 11 069 152 038 bp,and 463 different repeats were identified,a SSR locus appeared at 1.77 kb on average.SSR sites of single nucleotide repeat type were

11、 the most,accounting for 62.08%,while SSR sites of hexanucleotide repeat type were the least,accounting for only 0.46%.A and T bases were dominant in SSR sequences of tetraploid C.oleifera genome,while G and C were less in content and have base preference.The SSR sequence length of tetraploid C.olei

12、fera Doi:10.14067/ki.1673-923x.2024.03.013127中 南 林 业 科 技 大 学 学 报第 44 卷油茶 Camellia oleifera,山茶科山茶属,是我国重要的食用木本油料树种和经济林树种之一1。由于油茶种类繁多、倍性复杂、亲缘关系模糊、难以通过表型性状有效鉴定品种,一定程度上限制了油茶产业发展。因此,加强油茶品种遗传分析、种质鉴定等技术的研究,以促进油茶种质资源合理利用2,对支撑油茶育种研究工作的顺利进行和产业持续稳定发展具有重要意义。随着分子生物学研究工作的不断开展,分子标记作为一种分析遗传种质的新方法,可以直接反映植物遗传物质在 DNA 分

13、子水平上的差异,已大量应用于林木品种指纹鉴定、遗传分析、分子标记辅助育种及重要经济形状关联分析等领域3,具有高效、准确、经济、便捷等优点4-5。在众多分子标记中,SSR(Simple sequence repeat)是一种由 1 6 个核苷酸组成的短串联重复基序,在真核生物基因组中大量分布6,因具多态性高、重复性好、数量丰富、成本低廉等优点而备受科研工作者青睐7-9。基因组 SSR 和 EST-SSR(Expressed sequenced tags)是 SSR 的两大类型10。由于基因组测序与组装的复杂性,使得 EST 序列成为开发 SSR 标记的主要途径11。2013 年温强12搜索比较了

14、 3 个不同油茶品种 SSR 重复序列的分布模式及规律,但未开发出能有效应用于研究的 SSR 分子标记;Jia 等132014 年利用转录组测序数据成功开发出15 个特异性油茶微卫星标记;2016 年,Chen 等14通过 SSR 分子标记技术,利用 10 对多态 SSR 引物成功构建 128 个油茶品种的 DNA 指纹图谱,在分子层面对其进行有效区分。2022年,宋佳明等15 基于海南油茶转录组测序数据对 SSR 位点进行分析与筛选,获得扩增效果好、多态性高的 16 对SSR 引物。基于 EST 测序数据开发的 SSR 分子标记相较于基因组 SSR 更加保守,一般情况只分布于基因表达丰富区1

15、6,而通过全基因组数据开发的 SSR 多态性更高,遍布整个基因组17。至今,高质量的油茶 SSR 分子标记数量较少,远不能达到油茶品种遗传分析、指纹图谱构建、分子标记辅助育种及其他方面的研究需求,多态、稳定、高效的 SSR 分子标记仍需大量开发。随着课题组对四倍体油茶基因组测序工作的完成,为首次基于四倍体油茶基因组整体开发SSR 分子标记提供了数据条件。本研究以四倍体油茶全基因组测序数据为基础,对基因组中所含SSR 位点进行大规模搜索,统计分析其整体的分布模式及特征规律,进而开发 SSR 引物,旨在为油茶品种指纹鉴定技术、遗传分析、分子标记辅助育种等后续研究工作提供高质量SSR标记资源。1 材

16、料与方法1.1 试验材料中南林业科技大学通过国家重点研发计划项目木本油料重要性状形成与调控的实施,获得了高质量油茶全基因组组装数据。在此测序数据基础上,对分布于基因组的 SSR 位点进行挖掘并统计分析其整体分布模式。1.2 四倍体油茶基因组序列中 SSR 位点查找根据四倍体油茶基因组序列数据,采用 Perl语言的 MISA 程序(https:/webblast.ipk-gatersleben.de/misa/)对油茶基因组数据进行扫描18。搜索标准为:单核苷酸重复次数 10,二核苷酸重复次数 6,三核苷酸重复次数 5,四核苷酸重复次数 5,五核苷酸重复次数 5,六核苷酸重复次数 5,两个相邻

17、SSR 简单重复序列间距 100 bp,即两个序列间距相差超过 100 bp 则被认为是两个 SSR 位点,如果相邻 SSR 位点之间的距离少于 100 bp,则视为一个复合位点,并对 SSR位点的类型、数量、基元组成等分布模式进行整体分析。1.3 统计与分析用 Notepad 软件打开 fa.statistic 文件,将界genome ranged from 10 to 187 bp,with an average length of 15.57 bp.Except for single nucleotide repeat types,the SSR sequences with seque

18、nce length 20 bp accounted for 15.75%of all SSR sequences,the SSR length variation of dinucleotide,trinucleotide and tetranucleotide repeats was significantly higher than that of pentanucleotide and hexanucleotide,dinucleotide,trinucleotide and tetranucleotide repeats were the main marker sources fo

19、r designing SSR primers.Based on the SSR loci mining of tetraploid C.oleifera genome,1 358 248 pairs of primers were developed.【Conclusion】This study is the first attempt to conduct overall statistical analysis on the distribution pattern and characteristics of SSR loci and develop SSR primers in th

20、e whole genome of tetraploid C.oleifera,which will provide reference for molecular marker-assisted breeding of C.oleifera.Keywords:tetraploid Camellia oleifera;genome;SSR;nucleotide童海浪,等:四倍体油茶全基因组 SSR 位点开发与特征分析128第 3 期面数据全部拷贝到 Excel 空白文档中,采用 Excel表格对 1 6 核苷酸重复类型 SSR 位点的出现频率、分布密度等进行整体的统计分析,搜寻各类型 SSR

21、序列中占据主导地位的优势重复基元,分析其碱基构成情况及分布频率,并对 1 6 核苷酸所有重复类型 SSR 序列的长度范围和变异情况进行研究。1.4 四倍体油茶全基因组 SSR 引物设计根据鉴定的四倍体油茶全基因组 SSR 位点侧翼的保守序列,利用 Premier3.0 程序(http:/www.premier- oligo7 软件整体评估经系统筛选获得的 SSR 引物,过滤发夹结构、二聚体及不匹配等现象。引物设计的主要参数设置为:引物长度区间为 18 28 bp,上游引物和下游引物退火温度之差小于等于 5,引物对退火温度范围为 50 65,G、C 碱基含量占比40%70%;扩增产物的片段长度预

22、期在 100 350 bp 之间。2 结果与分析2.1 全基因组 SSR 位点数量和分布利用 MISA 软件,在全长为 11 069 152 038 bp 的四倍体油茶全基因组内共搜索到 SSR 位点 6 254 681 个,平均 1.77 kb 出现一个 SSR 位点。四倍体油茶基因组中的重复单元数量随碱基单元数量的增多而减少,且分布不均,单、二、三核苷酸重复类型 SSR 在基因组分布较为均匀,而四、五、六核苷酸重复类型数量分布则具有显著差别。在全部的六种基序(单、二、三、四、五、六核苷酸重复)类型中,单核苷酸重复类型为 3 883 217个,数量最多,二、三、四核苷酸重复次之。四倍体油茶基

23、因组 SSR 以一、二、三核苷酸重复类型为主,分别占总 SSR 位点数目 62.08%,28.30%和 6.79%,共占 97.17%。四、五、六核苷酸重复类型 SSR 数量远远少于前 3 种,六核苷酸重复类型数量最少(图 1)。图 1 四倍体油茶不同重复类型 SSR 的分布比例Fig.1 Proportion of SSRs with different repeat types in tetraploid C.oleifera genome通过对四倍体油茶每一条染色体上的 SSR 位点数目及丰度进行统计,在共 15 号染色体中,SSR 位点分布数目最多的是 6 号染色体,共有 502 34

24、1 个,15 号染色体 SSR 位点出现频率最低,仅有 326 594 个。相对丰度最高的同为 6 号染色体,为 603.56 loci/Mb,10 号染色体丰度最低,为531.83 loci/Mb(图 2)。图 2 四倍体油茶各染色体 SSR 位点相对丰度及数目Fig.2 Relative abundance and number of SSR loci in each chromosome genome of tetraploid C.oleifera129中 南 林 业 科 技 大 学 学 报第 44 卷2.2 全基因组 SSR 基序类型和结构经统计,SSR 位点之间的距离与碱基单元数量

25、成正比,即四倍体油茶基因组 SSR 之间的平均间隔距离随碱基单元数量的增多而增大。四倍体油茶基因组中单、二、三重复类型数量丰富,平均分布密度较高,平均间距分别为 2.85、6.25和 26.07 kb;而其余 3 种重复类型在基因组中分布密度较低,平均间距分别为 94.06、363.20 和 385.98 kb。可见,单、二、三核苷酸重复类型SSR 在油茶基因组上的分布密度显著高于其余 3种类型。四倍体油茶基因组重复基序种类繁多,共发现 463 个不同种类。1 6 核苷酸重复 6 种不同类型 SSR 位点基序分别有 2、4、10、33、98 和316 种,证明,不同基序类型的 SSR 数量分布

26、具有不均质性(表 1)。表 1 四倍体油茶基因组 SSR 位点重复类型数量及分布距离Table 1 Number and average distance of SSR in tetraploid C.oleifera genome重复类型Repeat types理论重复类型数量Theoretical number of repeat types重复类型数量Number of repeat typesSSR 数量Number of SSRs平均分布距离Average distance/kb单核苷酸 Mono-nucleotide223 883 2172.85二核苷酸 Di-nucleotide

27、441 770 0586.25三核苷酸 Tri-nucleotide1010424 56526.07四核苷酸 Tetra-nucleotide3333117 68694.06五核苷酸 Penta-nucleotide102 9830 477363.20六核苷酸 Hexa-nucleotide35031628 678358.98总计 Total5014636 254 6811.77A/T 是单核苷酸重复类型 SSR 位点中的优势重复基元,其数量在本类型中占比 98.01%,而 G/C 重复基元仅占本类型1.99%。二核苷酸重复类型中,AG/CT 和 AT/TA 两类重复基元占主导地位,AG/CT

28、 类的数量占本类型 47.52%,共 841 138 个;AT/TA 类重复基元共 753 448 个,占本类型 42.57%;AC/GT 基序数量占本类型总数 9.68%;CG/CG 数量最少,仅占本类型 0.23%。在三核苷酸重复类型 中,以 AAT/AAT、AAG/CTT 和 ACC/GGT 三种基序为主,分别占本类型总数 36.08%、20.24%和 19.40%;在四核苷酸重复类型中,有 5 种重复基元数量相对较多,分别为 AAAT/ATTT、AAAC/CTTT、AAAG/CTTT、AGAT/ATCT 和 AAAT/AATT,共占本类型 SSR 位点总数的 65.23%,占全部基因组

29、 SSR 位点的 1.60%。五核苷酸重复类型中,(AAAAN)n、(AAANN)n这两类以 A/T 为重复基元,分别占本类型的 15.96%、4.89%,共占20.85%(N 代表 A 碱基以外的任何碱基);六核苷酸重复类型中 AAAAAT/ATTTTT 基元共有 3 351个,数量最多,占本类型 11.68%(表 2)。表 2 四倍体油茶基因组中优势基元的分布Table 2 Distribution of predominant motifs types of SSRs identified from tetraploid C.oleifera genome基元类型Motifs types

30、优势基元Predominant motifs数量Numbers占本重复基元比例Proportion of predominant motifs/%重复总长度Total length/bp平均长度Average length/bp检出频率Frequency/Mb单核苷酸 Mono-nucleotideA/T3 805 88298.0149 499 68613.014 471.86二核苷酸Di-nucleotideAG/CT841 13847.5217 471 85620.771 578.43AT/TA753 44842.5712 920 04017.151 167.21三核苷酸Tri-nucle

31、otideAAT/ATT153 16436.083 722 67624.31336.31AAG/CTT85 94320.241 861 95621.67168.21ACC/GGT82 35819.401 523 76318.50137.66四核苷酸Tetra-nucleotideAAAT/ATTT76 76865.231 650 16021.50149.08AAAC/GTTT8 4947.22190 77222.4617.23AAAG/CTTT6 8405.81155 23622.7014.02AGAT/ATCT5 4904.67145 58826.5213.15AATT/AATT2 6212

32、.2255 70021.255.03五核苷酸 Penta-nucleotideAAAAT/ATTTT8 26627.12216 95026.2519.60六核苷酸 Hexa-nucleotideAAAAAT/ATTTTT3 35111.68114 48034.1610.34童海浪,等:四倍体油茶全基因组 SSR 位点开发与特征分析130第 3 期以上分析表明,在四倍体油茶基因组中,SSR位点的碱基偏好性很强,在各类型 SSR 中 A、T碱基出现频率明显高于 G、C 碱基。此外,在全部SSR 优势基元中,以单核苷酸重复类型数量最多,五、六核苷酸重复类型数量较少,优势基元出现频率随碱基单元数的增多

33、而呈不规律降低的趋势。2.3 全基因组不同重复基元 SSR 位点数目分析通过对不同类型的重复序列进行单元数量的统计,表明四倍体油茶基因组中 SSR 的分布存在规律性。重复次数超过 20 的 SSR 数量相对较少,仅有 268 525 个,占总体的 4.29%;在单核苷酸重复类型中有 214 890 个,占 80.0%;在二核苷酸重复类型中,有 44 533 个,占 2.5%;在三核苷酸重复类型中存在 9 092 个;占 2.1%,四、五、六核苷酸分别仅有 9、0、1 个。SSR 位点的数量随着 SSR 重复次数的增加而减少,SSR 序列越长,其数量越少(表 3)。在相同重复次数下,各重复类型

34、SSR 出现的数量也不一致。在全基因组中,10 次重复的 SSR 位点数量最多、分布最广,占23.97%;10 次至 20 次重复类型数量呈现明显下降趋势,20 次重复以上仅占 4.29%,总而言之,SSR 序列出现频率随着长度的变化存在显著变异(图 3)。表 3 四倍体油茶基因组不同类型 SSR 的组成和分布Table 3 Composition and distribution of different type SSRs identified from tetraploid C.oleifera genomeSSR 位点重复类型SSR types重复次数 Number of repeat

35、s5678910111213单核苷酸 Mono-nucleotide000001 319 833664 796417 094294 846二核苷酸 Di-nucleotide0458 174269 296203 676176 244166 961141 57484 71349 446三核苷酸 Tri-nucleotide189 07690 07646 27125 63715 86811 2988 4026 1604 912四核苷酸 Tetra-nucleotide82 44122 1417 3612 9371 314666335172129五核苷酸 Penta-nucleotide2 2448

36、5 8471 617399111291833六核苷酸 Hexa-nucleotide18 2116 4872 341889402161834631总计 Total312 176582 725326 886233 538193 9391 498 948815 208508 188349 367SSR 位点重复类型SSR types重复次数 Number of repeats总数Total14151617181920 20单核苷酸 Mono-nucleotide234 187200 317169 227133 367100 52675 43358 701214 8903 883 217二核苷酸 D

37、i-nucleotide37 12831 97128 32524 80221 01217 85614 34744 5331 770 058三核苷酸 Tri-nucleotide3 9313 2872 7602 4241 9811 7991 5919 092424 565四核苷酸 Tetra-nucleotide624828219769117 686五核苷酸 Penta-nucleotide1010000030 477六核苷酸 Hexa-nucleotide13433210128 678总计 Total275 322235 627200 344160 617123 53095 09674 645

38、268 5256 254 681图 3 四倍体油茶不同重复次数 SSR 的频率分布Fig.3 Frequency of various repeat times SSRs in tetraploid C.oleifera genomic DNA131中 南 林 业 科 技 大 学 学 报第 44 卷2.4 全基因组 SSR 位点长度分布及变异对四倍体油茶基因组不同长度重复单元 SSR的出现频率进行分析,结果表明,长度变异类型最丰富的为单核苷酸重复,存在 68 种不同长度变异类型;二核苷酸重复类型次之;五核苷酸重复仅有 11 种,变异类型最少。在四倍体油茶全基因组中,据计算 SSR 序列长度均值

39、为 15.57 bp,全部 SSR 序列长度变化区间为 10 187 bp。单核苷酸重复型 SSR 序列长度变化差异最大,为10 187 bp,二、三核苷酸重复类型次之,分别为 12 148 bp 和 15 144 bp,长度变化差异最小的为五核苷酸重复类型(图 4)。理论上,单核苷酸重复类型 SSR 位点和五核苷酸重复类型 SSR位点变异程度分别为最高和最低。图 4 不同类型 SSR 各长度重复单元出现频率及最大重复次数Fig.4 Occurrence frequency and maximum repetition times of repeating units of different

40、 lengths in different types of SSRs在四倍体油茶基因组中,除单核苷酸重复类型外,其余 5 类 SSR 位点(共 2 371 464 个)中,长度变化范围为 12 148 bp,各类型 SSR 长度变化范围差异显著,随着 SSR 序列的延长,不同长度 SSR 位点出现的数量呈下降趋势。据统计,数量最多的是长度范围 12 L 20 的 SSR 序列(1 386 544 个),占基因组所有 SSR 位点数量的 22.17%,长度 L 20bp 的 SSR 位点共 984 920 个,占比 15.75%。序列长度为 12 bp 的 SSR位点分布最多,占本类型数量的

41、19.32%,占所有SSR 位点数量的 7.33%;其次是长度为 14 bp 的SSR 位点,分别占本类型和所有 SSR 位点数量的11.36%和 4.31%;最少的为长度 35 bp 的 SSR 位点;大于等于 40 bp 的 SSR 位点数量占所有 SSR数量的 1.57%(表 4)。在六种不同类型 SSR 位点中,长度 L 20 bp 的 SSR 位点数量由单核苷酸重复类型向六核苷酸重复类型呈规律递减。据统计,二核苷酸重复类型有 662 668 个,数量最多,占 67.28%,三、四核苷酸重复类型次之,分别为 154 409 个和 117 686 个,占比 14.76%和11.95%,而

42、五、六核苷酸两种重复类型出现频率相对较低,分别仅有 30 477 个和 28 678 个,共占6.01%,远远低于二、三、四核苷酸重复类型 SSR的数量(表 5)。表 4 不同长度 SSR 数量统计Table 4 Frequency of SSRs with different length长度Length/bp数量Numbers占本类型 SSR 比例Proportion in SSR group/%占所有 SSR 比例Proportion in all SSRs/%12458 17419.327.3314269 29611.364.3115189 0767.973.0216203 6768.

43、593.2618266 32211.234.2620249 40210.523.992146 2711.950.7422141 5745.972.2624132 4915.592.122522 4480.950.362649 4462.090.792715 8680.670.252844 4891.880.713067 3272.841.083231 2621.320.50338 4020.350.133424 8021.050.40351 6170.070.033628 4861.200.463817 8560.750.29394 9120.210.08 4098 2674.141.57童海

44、浪,等:四倍体油茶全基因组 SSR 位点开发与特征分析132第 3 期2.5 全基因组 SSR 引物开发利用油茶基因组 SSR 位点(除单核苷酸重复类型外)的侧翼保守序列,运用 Primer3.0 软件进行批量引物设计,参数设为默认值,共获得 2 371 464 对 SSR 标记位点引物(SSR 位点总数为 6 254 681 个,其中单碱基重复位点数 3 883 217个),占 SSR 位点总数的 37.9%。根据设计获得的引物信息,应用 Oligo7 软件修改设计参数,再一次评估和筛选所有引物,得到 1 358 245 对引物,占总引物对数的 57.27%,表 6 列出了开发的部分引物信息

45、。表 5 20 bp 的 SSR 分布Table 5 Distribution of SSR which 20 bp重复类型Repeat typeSSRs 数量Number of SSR占 20 bp SSRs 的比例Proportion in all 20 bp SSRs/%二核苷酸 Di-nucleotide662 66867.28三核苷酸 Tri-nucleotide145 40914.76四核苷酸 Tetra-nucleotide117 68611.95五核苷酸 Penta-nucleotide30 4773.10六核苷酸 Hexa-nucleotide28 6782.91总计 Tot

46、al984 918100表 6 基于四倍体油茶基因组开发的部分引物信息Table 5 Partial primer information developed based on tetraploid C.oleifera genome序号No.引物名称Primer ID重复单元Motif重复次数Repeat引物序列Primer sequence(53)长度Length/bp退火温度Tm/GC 含量GC content/%产物大小Product size/bp1Chr01g253TTGTT6F:TGATTTCTGTGACTTTTCTCCGR:AGTGGCATTCCCAACGTAAG222059.

47、3659.9940.950.02142Chr02g221CT7F:AGACAGCAGCGGATTCAACTR:AACGTGCTCCAAATTCCAAC202060.0259.9850.045.02063Chr02g452TGTAT6F:TCAGGTGAGACCGGTAAAGCR:CCTTAAGCACAAGGGCAAAA202060.2660.2455.045.01904Chr03g161ACCCCT6F:CCCACCACCAGTATTCAAGGR:AGATGGGACTGGTTTTGGTG202060.2259.8255.050.01845Chr08g331AAT5F:TGCTCCATTTAGA

48、CCTAGTTTGGR:GGAAAATACACCCCGCCTAT232059.6860.0443.550.01966Chr10g325AT9F:AAAACAGGACTCATGGTGGGR:CCAAACGGAGCCAATGTACT202059.8259.9950.055.01377Chr10g352AATAA5F:TCCATGTGAATCCATCTTGCR:ATTGTTCCGGTTGAAAATGC202059.4659.8145.040.02528Chr12g169AAAGAG6F:ACACCGATGATGAATGGGATR:CCCAGATGGAGATGTTTGCT202060.0260.074

49、5.050.02459Chr14g431TCT18F:CCATCTTCTTCCTCAAGAGATCAR:TGGTGAGTTTTGGTAGAGTGGA232259.8459.6343.545.513310Chr15g353AAATA5F:CCAGCTGAACCCTTTAACCAR:GGGGGAATTTGGATTGTCTT202060.1060.0050.045.01903 结论与讨论3.1 讨 论在现阶段测序技术不断向前发展,基于全基因组测序数据进行分子标记的挖掘已经得到了广泛使用20,利用测序技术能够快速、有效地获取遍布全基因组的序列信息,是实现 SSR 分子标记得到全面开发的关键。四倍体油茶

50、基因组 SSR 位点数以百万计且类型繁多,但各类型 SSR 位点在出现频率及分布密度上差异很大。基于四倍体油茶全基因组测序数据,利用 MISA 软件对各类型SSR 位点进行大规模挖掘,共获得 6 254 681 个SSR 位点。在整个基因组中,单、二、三核苷酸重复类型出现频率及分布密度显著高于四、五、六核苷酸重复类型,整体由短重复基序至长重复基序呈递减趋势,单核苷酸重复类型在基因组SSR 位点总数的中占据绝对优势,占比 62.08%,六核苷酸重复的 SSR 位点出现频率最低,仅占0.46%,这 与 杜 仲 Eucommia ulmoides21、苹 果Malus pumila22、拟 南 芥

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服