1、-142-遗传育种Genetics and Breeding 2023 年 第 59 卷 第 08 期基于全基因组重测序对屯昌猪 SNP 和 InDel突变位点挖掘及分析王非凡,查宗林,李 捷,何颖志,谭 振*(海南大学动物科技学院,海南海口 570228)摘 要:屯昌猪作为中国最南端的本土海南猪品系之一,有着诸多优良特性。本研究利用全基因组重测序技术研究屯昌猪的遗传信息,挖掘和分析屯昌猪的 SNP 和 InDel。SNP 和 InDel 突变位点位于内含子和基因间区的数量最多,而在外显子区域的突变数量较少。本研究鉴定出 47 887 个非同义突变 SNP 和 6 171 个蛋白质编码区(CD
2、S)InDel 位点;对非同义突变 SNP 进行注释富集分析获得 290 个 GO 术语和 128 条 KEGG 通路,通路主要富集在代谢途径、甘油磷脂代谢、甘油代谢、ECM 受体相互作用、钙信号通路等与机体发育密切相关的通路上;CDS 区的 InDel 进行注释富集分析获得 190 个 GO 术语和 46 条 KEGG 通路,通路主要富集在ECM 受体相互作用、小细胞肺癌癌症、癌症的途径、弓形虫病和钙信号通路等与机体免疫与疾病密切相关的通路上。本实验结果丰富了屯昌猪的遗传资源,为保护和开发屯昌猪提供了数据支持。关键词:屯昌猪;重测序;单核苷酸多态性;插入与缺失;信号通路中图分类号:S828.
3、2 文献标识码:A DOI 编号:10.19556/j.0258-7033.20230530-07屯昌猪作为中国最南端的本土海南猪品系之一,有着肉质鲜美、繁殖能力强、抗逆性高和耐粗饲等特点1。2014 年作为海南地方猪主群体之一的屯昌猪被收录进国家级畜禽遗传资源保护名录。屯昌猪作为 1 个独特的群体,拥有丰富的遗传多样性资源,潜在价值极高。但目前对屯昌猪基因水平层面的研究相对较少,为了保护并开发屯昌猪的种质资源,应充分挖掘屯昌猪生物遗传信息,丰富屯昌猪的遗传资源信息库。全基因组上出现单个核苷酸突变造成 DNA 序列的改变被称为 SNP(Single Nucleotide Polymorphis
4、m),一般表现为转换(Transition)和颠换(Transversion)2。SNP 可以出现在基因组的任何位置,广泛分布于物种的基因当中3。插入/缺失突变(Insertion/Deletion,InDel)表现为基因组中 DNA 片段的插入或缺失引起的基因序列长度多态性4。按照表现形式 InDel 可分为 5 类:单碱基的插入/缺失;单碱基对扩增;多碱基对(215 bp)扩增;转座子插入;包含随机 DNA 片段的 InDel 插入/缺失5。目前基于全基因收稿日期:2023-05-30;修回日期:2023-06-27资助项目:海南省重点研发计划项目(ZDYF2020094)作者简介:王非凡
5、(1996-),男,安徽亳州人,硕士,主要从事生物信息学分析研究,E-mail:*通讯作者:谭振(1985-),男,黑龙江佳木斯人,博士,讲师,主要从事动物遗传育种及畜禽肠道微生物研究,E-mail:of boar claw lesion and lamenessJ.Anim Sci J,2018,89:802-809.13 Kanis J A,Melton L J,Christiansen C,et al.The diagnosis of osteoporosisJ.J Bone Miner Res,1994,9(8):1137-1141.14 Wu Y H,Lai W,Liu Z H,et
6、 al.Serum and seminal plasma element concentrations in relation to semen quality in furoc boarsJ.Biol Trace Elem Res,2019,189(1):85-94.15 Reiland S.Pathology of so-called leg weakness in the pigJ.Acta Radiol Suppl,1978,358:23-44.16 Boros K,Freemont T.Physiology of ageing of the muscul-oskeletal syst
7、emJ.Best Pract Res Clin Rheumatol,2017,31(2):203-217.17 Pignolo R J,Law S F,Chandra A.Bone aging,cellular sen-escence,and osteoporosisJ.JBMR Plus,2021,5(4):e10488.18 陈银岳,占今舜.猪肢蹄病形成的环境因素及改善措施 J.猪业科学,2013,30(11):54-56.19 刘颖.猪肢蹄病发病原因及防治措施探讨J.中国动物保健.2018,20(2):23-24.20 昌捷,邢孔萍,卢秋咏.母猪肢蹄病的综合防控措施 J.猪业科学,202
8、1,38(11):62-64.(责任编辑:赵 楠)-143-2023 年 第 59 卷 第 08 期 Science and Technology科学技术 组重测序技术对畜牧品种的 SNP 和 InDel 突变位点研究十分普遍,已在猪Sus scrofa6、鸡Gallus gallus7、牛Bos taurus8以及羊Ovis aries9等畜牧物种中广泛应用。宋娜娜等10基于三江黄牛的全基因组数据确定了 20 477 130 个 SNPs 和 1 355 308 个 InDels 位点,深入研究后发现 567 个与肉质、产奶、生殖等重要经济性状相关基因。王慧芳等11利用狮头鹅和吉林白鹅的全基
9、因组数据分析与产蛋性能相关基因与信号通路,发现TRPM2、STAT3.2、RPS6KA6和CDC25-1-B等基因参与调控狮头鹅的产蛋性状。王振12研究太湖流域地方品种猪的遗传信息,在遗传变异的功能预测部分通过对SNP、InDel 和 CNV 数据的分析发现繁殖性状相关基因RGS12与CXCL10和免疫相关基因IRF7和IFIT1受到InDel 的影响,由此推断太湖流域地方品种猪的 InDel在繁殖和免疫性状中有着重要意义。海南屯昌猪的全基因组数据目前报道极少,对其 SNP 和 InDel 的研究有限。因此,本研究旨在利用从国家屯昌养猪场采集的10 只屯昌猪的全基因组测序数据,对屯昌猪 SNP
10、 和InDel 突变位点进行鉴定和分析。本研究结果可作为目前屯昌猪的遗传资源统计,并成为指导保种育种工作以有效利用该品系的宝贵工具。1 材料与方法1.1 实验材料 本研究严格按照科技部(中国北京)发布的实验动物指南进行,所有动物实验均经海南大学机构动物保护与使用委员会批准。所有方法均严格按照生猪屠宰操作规程(GB/T 17236-2008)执行。所有实验个体均为国家屯昌养猪场(中国海南屯昌)的后代,随机采集 10 份同龄且 3 代之内没有亲缘关系的雄性屯昌猪个体(TC)全血样本。1.2 血液 DNA 提取 使用商业试剂盒(中国北京天根生物科技有限公司)从血液组织中提取每个样本的基因组 DNA。
11、经电泳检测 DNA 完整性后送至百迈客生物科技有限公司进行测序。1.3 全 基 因 组 重 测 序 使 用 Illumina NovaSeq 平 台(Illumina,San Diego,CA,USA)对合格的文库进行测序,并生成符合制造商方案的 150 bp 成对末端读数。对这 10 个个体进行了全基因组高覆盖率测序,平均覆盖深度为 10X。1.4 数据质量控制与过滤 利用 fastp 软件(https:/ 10%NS 的reads,以确保高质量的数据。所有个体的过滤 reads与猪参考基因组Sus scrofa 11.1 通过 Burrow-Wheeler aligner 软件(BWA,版
12、本 0.7.17)13进行比对。利用Sambamba 软 件(https:/ reads。其余的 reads 被定义为良好 reads 并用于进一步分析。所有参数都使用默认设置。使用 GATK(版本 4.0.3.0)进行 SNP 和 Samll InDel calling,并利用其中的 Variant Filtration 模块进行过滤,筛选参数设置为“QD2.0,QUAL 60.0,MQ40.0-cluster-window-size 5-cluster-size 2”,意味着变异质量(Quality)/覆盖深度(Depth)比值小于 2.0、质量值低于 30、Fisher 检验的 P-va
13、lue 转换而来的值大于60、read 的比对质量值的均方根低于 40 和 5 bp 窗口内的变异数量超过 2 个的位点将被过滤掉14。1.5 SNP 和 InDel 的注释与基因富集分析 使用 SnpEff软件15,根据从 NCBI 数据库中下载的猪基因注释文件(GCF_000003025.6_Sscrofa11.1_genomic.gff.gz)进行功能注释并对 SNP 和 InDel 进行分类。再利用在线基因富集网站 DAVID(2021 版本,https:/david.ncifcrf.gov/)16对 上 述 获 取 的 基 因 进 行 GO 术 语 和KEGG 通路富集分析。本研究中
14、,仅使用经 Benjamini和 Hochberg(1995)方法计算校正后PC 与 AG 在参考序列比对时表现为相同类型,因此将 12 种归为 6 类:T:AC:G、T:AG:C、T:AA:T、C:G T:A、C:G G:C 和 C:GA:T。统计所有个体的 SNP突变类型,绘制出图 1 可明显发现 C:GT:A 和 T:AC:G的类型最为丰富。表 2 比对结果统计样品Reads 合计Reads 比对数 Reads 比对率,%完全比对率,%TC117485879017429924299.6897.36TC217893798217829380599.6497.04TC3173982406173
15、23428299.5797.12TC417523459817455118399.6197.47TC517495539617430806199.6397.50TC617451230017381425199.6097.36TC717413832417344177199.6097.41TC817475266417401870399.5897.19TC917377390417313094199.6397.46TC1017520015417451687399.6197.33表 3 样品覆盖深度及覆盖度统计注:Cov_ratio_1X:基因组上的位点至少被覆盖 1 次的占比;Cov_ratio_5X:基因
16、组上的位点至少被覆盖 5 次的占比。样品平均测序深度,XCov_ratio_1X,%Cov_ratio_5X,%TC11096.9278.86TC21097.3980.61TC31097.7981.23TC41097.3981.13TC51097.5080.45TC61097.9482.23TC71097.7781.51TC81098.0182.64TC91097.6781.10TC101097.7381.17表 4 CDS 区内 SNP 分类样品同义突变非同义突变 终止密码子获得终止密码子缺失TC1398062147124678TC2434412362527379TC345680247892
17、7774TC4428092347224780TC5434092334327989TC6441962380825578TC7444932409826992TC8476912571628491TC9426742311226587TC10422412284527280合计10204847887表 1 测序数据质量注:Q20:总碱基中高于 20 质量值的碱基占比;Q30:总碱基中高于 30 质量值的碱基占比;GC:即样品总碱基中 G 和 C 类型的碱基占比;TC 为屯昌猪样本的缩写代号,编号从 110。样品过滤后 reads过滤后碱基数Q20,%Q30,%GC,%TC18742939526184739
18、03097.8494.0540.58TC2894689912680038391897.6893.6640.81TC3869912032605689895697.8194.0441.15TC4876172992625590297697.7593.8240.92TC5874776982621011600297.6993.6440.88TC6872561502614129579097.8794.1541.40TC7870691622609065798097.7793.8841.30TC8873763322617771544497.6593.6542.31TC986886952260357819849
19、7.6993.6741.29TC10876000772625252882297.7093.6840.48-145-2023 年 第 59 卷 第 08 期 Science and Technology科学技术 X 轴表示 SNP 的突变类型;Y 轴表示 SNP 的数目。图 1 全基因组 SNP 突变类型统计图SNP Mutation type distributionSNP number4e+063e+062e+061e+060e+00TC1TC10TC2TC3TC4TC5TC6TC7TC8TC9C:GA:TC:GG:CC:GT:AT:AA:TMutation typeT:AC:GT:AG:C
20、aGO Term CC-log10(PValue)Count14121040080012001600GO:0005814centrioleGO:0031012extracellular matrix GO:0016324apical plasma membraneGO:0009986cell surface GO:0005794Golgi apparatusGO:0005739mitochondrion GO:0005887integral component of plasma membraneGO:0005654nucleoplasm GO:0005829cytosol GO:000573
21、7cytoplasm5 10 15Gene Ratio2.4 SNP 位点基因功能注释与富集分析 将鉴定得到的 47 887 个非同义突变 SNPs 位点进行注释共检测出10 258 个基因,再利用在线基因富集网站 DAVID 对检测出的基因进行 GO 术语和 KEGG 通路富集分析,共富集到 290 个 GO 术语和 128 条 KEGG 通路。GO 聚类分析显示其中 93 个为细胞组分(Cellular Component)、88 个为生物过程(Biological Process)和 109 个分子功能(Molecular Function)。KEGG 注释在代谢途径通路、甘油磷脂代谢通
22、路、碳代谢通路、甘油代谢通路、钙信号通路、ECM 受体相互作用通路、造血细胞谱系通路、补体和凝血级联通路和范科尼贫血途径等通路上显著富集(图 2、表 5)。2.5 InDel 位点的鉴定与分析 对检测出的 InDel 变异进行统计得到表 6,从表中可得知每个个体所检测出的InDel 数量和类型大体相当。样本平均检测出 1 876 629个 InDels 突变位点,其中位于基因间区的 InDel 数量最多占总体的 50.89%,其次为内含子占总体的 42.85%,而位于 CDS 区内的 InDel 仅占总体的 0.17%。统计全部个体的全基因组和 CDS 区的 InDel 位点长度分布见图 3,
23、可发现其分布趋势类似。全基因组和 CDS 区中长度为 1 bp 的插入或缺失 InDel 位点数量最多,但全基因组其他长度的 InDel 位点根据碱基增加依此减少,-146-遗传育种Genetics and Breeding 2023 年 第 59 卷 第 08 期选择前 10 个显著丰富的 GO 术语分为细胞成分(CC,a)、生物过程(BP,b)和分子功能(MF,c);前 10 个高富集的 KEGG 途径如(d)所示;每个圆圈的大小表示每个 GO 术语/途径中的基因数量,颜色表示每个 GO 词汇/途径的P值。图 2 非同义突变 SNPs 注释基因的富集分析图ssc03460:Fanconi
24、anemia pathway ssc00561:Glycerolipid metabolism ssc04640:Hematopoietic cell lineage ssc00564:Glycerophospholipid metabolismssc04512:ECM-receptor interaction ssc04610:Complement and coagulation cascadesssc01200:Carbon metabolism ssc04060:Cytokine-cytokine receptor interaction ssc04080:Neuroactive lig
25、and-receptor interactionssc01100:Metabolic pathwaysbcdGO Term MFKEGG Pathway TermsGO:0003953NAD+nucleosidase activity GO:0004888transmembrane signaling receptor activityGO:0005096GTPase activator activity GO:0004672protein kinase activityGO:0008017microtubule binding GO:0005085guanyl-nucleotide exch
26、ange factor activityGO:0016887ATPase activity GO:0005509calcium ion bindingGO:0005524ATP binding GO:0046872metal ion binding-log10(PValue)-log10(PValue)CountCount1512930252015102004006008002004006008000 2 4 6 8Gene Ratio0.0 2.5 5.0 7.5Gene RatioGO Term BP-log10(PValue)Count654340801200.4 0.8 1.2Gene
27、 RatioGO:0034162toll-like receptor 9 signaling pathwayGO:0002237response to molecule of bacterial origin GO:0002755MyD88-dependent toll-like receptor signaling pathwayGO:0030199collagen fibril organizationGO:0007596blood coagulation GO:0006635fatty acid beta-oxidationGO:0007160cell-matrix adhesion,G
28、O:0030198extracellular matrix organizationGO:0006954inflammatory responseGO:0007155cell adhesion-147-2023 年 第 59 卷 第 08 期 Science and Technology科学技术 表 5 非同义突变 SNPs 注释基因富集 KEGG 通路 top10术语富集基因数P值Coreected P2基因代谢途径8935.31E-331.32E-30PGAP1、EHMT2、ATP5C1、PLD3、etc补体和凝血级联716.52E-168.08E-14ITGAM、PLAT、PROS1、I
29、TGB2、etcECM 受体相互作用701.19E-109.86E-9ITGB1、ITGB5、ITGB4、LAMC3、etc细胞因子-细胞因子受体相互作用1683.49E-92.16E-7CNTFR、CSF3、CSF2、TNFRSF6B、etc造血细胞谱系662.82E-81.40E-6CSF3、SLA-DRB1、ITGAM、CSF2、etc范科尼贫血途径417.77E-83.12E-6MUS81、BLM、WDR48、BRCA1、etc神经活性配体-受体相互作用2138.80E-73.12E-6NPFFR2、OXTR、VIPR1、VIPR2、etc甘油磷脂代谢685.68E-61.76E-5D
30、GKG、ACHE、DGKE、DGKD、etc碳代谢752.18E-65.99E-5GPI、ADPGK、OGDHL、ENO1、etc甘油代谢462.48E-66.14E-5DGKG、AGPAT5、TKFC、LIPC、etc表 6 全基因组 InDel 位点的统计与分类注:CDS 区:编码蛋白产物的外显子区域;5UTR:基因的 5 非翻译区域内;3UTR:基因的 3 非翻译区域内;Intragenic:无转录本信息的基因内突变。样品内含子基因间区CDS 区5UTR3UTR下游区上游区剪切区Intragenic合计TC17603739191452906302314128437094454516411
31、221789592TC2808033962544316433041506246909474231 8631511888453TC38197439758113300343215370479714876318771381916405TC47844979407863134325914704456334642117691241840327TC5802035948740314233101491546108466111829951866785TC68266239768813342342915292473964846618891321923450TC77985199451903284343415071468
32、384742518461471861754TC88441219845823507354515863494965023819831461953481TC97891949255073178326914645453504604818461621829199TC108090039704343132332414916466984739217941521896845而 CDS 区的 3 bp 大于 2 bp 的插入或缺失 InDel 位点。对全部个体 CDS 区和全基因组中检测到的 InDel 位点进行分类统计发现,分布类型高度相似,其中插入类型高于缺失类型 2 倍以上,纯合位点高于杂合位点 2 倍以上,
33、总共在 CDS 区获得 6 171 个 InDel 位点。2.6 InDel 位点基因功能注释与富集分析 将从 CDS区鉴定得到的 6 171 个 InDel 位点进行注释共检测出3 218 个基因,再利用在线基因富集网站 DAVID 进行GO 术语和 KEGG 通路富集分析,共富集到 190 个 GO术语和 46 条 KEGG 通路。GO 聚类分析显示其中 46 个为 细 胞 组 分(Cellular Component)、85 个 为 生 物 过程(Biological Process)和 59 个分子功能(Molecular Function)。KEGG 注释在 ECM 受体相互作用通路
34、、小细胞肺癌癌症通路、癌症的途径通路、弓形虫病路、钙信号通路、人乳头瘤病毒感染通路、局灶性粘连通路、肌动蛋白细胞骨架的调节和醛固酮的合成与分泌等通路上显著富集(图 4、表 7)。3 讨 论3.1 鉴定 SNP 和 InDel 本研究采集 10 头同龄且 3 代之内没有亲缘关系的雄性屯昌猪个体的全血样本进行全基因组重测序,获得了高质量测序数据 114.85 GB,其Q20 与 Q30 评分均值分别为 97.75%和 93.84%,而 GC含量在40.48%42.31%,表明测序结果具有较高可靠性。对数据进行检测共发现 19 705 017 个 SNPs 和 3 603 169个 InDels,其
35、中 70%以上的突变位于基因间区和内含子内,而 CDS 区中分布相对较少。兰蓉等17对云南黑山羊进行全基因组重测序,鉴定出 SNPs 和 InDels 分别 为 7 615 774 个 和 877 232 个,其 中 只 有 17 160 个SNPs 为异义突变,外显子区域的小 InDel 仅 1 330 个,-148-遗传育种Genetics and Breeding 2023 年 第 59 卷 第 08 期aGO Term CC-log10(PValue)Count8641002003004005000 5 10 15Gene RatioGO:0043296apical junction
36、complexGO:0005581collagen trimerGO:0005814centriole GO:0005604basement membrane GO:0031012extracellular matrixGO:0005730nucleolus GO:0005654nucleoplasm GO:0005829cytosol GO:0005737cytoplasm GO:0005634nucleusX 轴为统计的 InDel 数量;Y 轴为 10 bp 以下的 InDel 长度(10 bp 以内),插入 0,缺失 T:A 和 T:AC:G 突变类型最为丰富18,全基因组中 InDe
37、l 位点长度分布表现为随着碱基对增加而数量减少的趋势,其中 1 bp 的 InDel 插入或缺失最多,但在 CDS 区内 3bp 的插入或缺失比 2 bp 的插入或缺失数量多11。3 bp 或 3 的整数倍的 DNA 片段插入或缺失被称整码突变(Codon Mutation),整码突变只会影响局部对应的密码子,对后续氨基酸序列无影响,因此当一个基因出现整码突变且基因功能随之改变,那么整码突变位点将成为重点研究对象。例如AHR基因有报道表明其在猪的繁殖中发挥重要作用19,因此可将其作为其他动物繁殖性状相关的候选基因,而在对澳大利白羊、兰州肥尾羊和鲁西黑头羊的AHR基因研究中都发现了一段 24 b
38、p 的 indel 突变,通过费歇尔精确检验发现其与澳羊产羔数和活产羔数相关20。3.2 SNP 和 InDel 富集分析 将筛选出的 47 887 个非同义突变 SNPs 位点和 6 171 个 CDS 区的 InDels 位点进行基因注释和富集分析,发现非同义突变 SNP 注释的基因富集到 290 个 GO 术语和 128 条 KEGG 通路,在KEGG 通路中可发现多条与脂肪代谢相关通路。而甘油三酯和磷脂作为脂质氧化前体,可以生成强烈香味化合物,是影响畜禽肉风味的关键因素21-22,在多个 GO 和KEGG 中出现的PLD3被确定为调控溶血磷脂代谢的关键基因之一23,可将PLD3基因作为
39、屯昌猪肉风味形成的重要研究对象。CDS 区的 InDel 注释基因富集到190 个 GO 术语和 46 条 KEGG 通路,在 InDel 富集的KEGG 通路中有许多与免疫疾病相关。细胞外基质-受体(ECM-受体)相互作用途径是最丰富的途径与许多疾病和代谢相关,通过研究乳腺癌转录组测序数据发现ECM-受体途径中的基因都是差异表达基因,影响了细胞增殖、运动和黏附等,参与了乳腺癌的发展24。而钙信号通路可以调控生物钟影响肠道内微生物活性以及神经的兴奋程度,调节哺乳动物采食、能量代谢和脂细胞的分化,以此影响机体脂肪沉积25。总之,本研究根据非同义突变 SNP 位点和 CDS 区的 InDel 位点
40、鉴定出许多与屯昌猪种质特征相关通路和候选基因,为研究屯昌猪的性状提供基础数据支持。4 结 论通过全基因组测序并注释分析屯昌猪的 SNP 和InDel 变异位点,发现非编码区突变占主要,而编码区突变相对较少。SNP 突变类型 C:G T:A 和 T:AC:G最为丰富,InDel 长度分布与插入或缺失片段长度成负相关,符合保守的生物学特性。通过注释富集分析发现与免疫、生长、代谢和繁殖等相关的通路和基因,丰富了屯昌猪种质资源数据,为其保护和改良提供数据支持。参考文献:1 Diao S Q,Huang S W,Chen Z T,et al.Genome-Wide signatures of selec
41、tion detection in three south China indigenous pigsJ.Genes,2019,10(5):346.2 唐立群,肖层林,王伟平.SNP 分子标记的研究及其应用进展 J.中国农学通报,2012,(12):154-158.3 Vignal A,Milan D,SanCristobal M,et al.A review on SNP and other types of molecular markers and their use in animal 表 7 CDS 区 InDels 注释基因富集 KEGG 通路 top10术语富集基因数P值Core
42、ected P2基因ECM 受体相互作用354.53E-91.42E-6TNXB、LAMA2、LAMA1、ITGB4、etc局灶性粘连546.29E-79.87E-5FLT1、ITGB4,LAMC3、FLT4、etc人乳头瘤病毒感染761.94E-62.03E-4RB1、CDKN1A、MAML2、SLA-5、etc钙信号通路603.90E-63.06E-4RET、RYR2、CHRM1、FLT1、etcPI3K-Akt 信号通路753.09E-51.94E-3CSF3、CDKN1A、CHRM1、FLT1、etc弓形虫病315.46E-52.86E-3CD40、LAMA2、LAMA1、LAMC3、
43、etc小细胞肺癌癌症288.08E-53.62E-3RB1、CDKN1A,LAMA2,LAMA1、etc癌症的途径1003.01E-41.18E-2RB1、CALML6、ITGA2B、FGF5、etc肌动蛋白细胞骨架的调节505.48E-41.91E-2CYFIP1、CHRM1、ITGB4、CHRM4、etc醛固酮的合成和分泌259.29E-42.92E-2ATF1、CAMK2D、DAGLA、CALML6、etc-151-2023 年 第 59 卷 第 08 期 Science and Technology科学技术 geneticsJ.Genet Sel Evol,2002,34(3):275
44、-305.4 盛翔,包云,张家硕,等.InDel 遗传标记在法医学领域的研究进展 J.法医学杂志,2018,(4):420-427.5 Mills R E,Luttig C T,Larkins C E,et al.An initial map of inse-rtion and deletion(INDEL)variation in the human genomeJ.Genome Res,2006,16(9):1182-1190.6 Zhang W,Yang M,Wang Y,et al.Genomic analysis reveals selection signatures of the
45、 Wannan Black pig during domes-tication and breedingJ.J Anim Sci,2020,33(5):712-721.7 王统苗,郑圣晗,张莘,等.不同鸡品种 BTN2 基因 SNP 和INDEL 分析 J.四川农业大学学报,2018,(3):380-385.8 罗林.奶牛乳脂性状候选基因 SNP 及 Indel 位点筛选及其与产奶性状关联分析 D.黑龙江:黑龙江八一农垦大学,2021.9 刘正喜,武斌,胡明月,等.双乾肉羊全基因组 SNP/InDel分析及毛色相关候选基因鉴定 J.中国兽医学报,2021(10):2032-2037.10 宋娜
46、娜,钟金城,柴志欣,等.三江黄牛全基因组数据分析J.中国农业科学,2017,(1):183-194.11 王慧芳,周光现,孙永峰,等.基于全基因组重测序技术的狮头鹅 Indel 标记分析 J.畜牧兽医学报,2021(3):662-675.12 王振.太湖流域地方品种猪基因组结构及其功能研究 D.上海:上海交通大学,2015.13 Li H,Durbin R.Fast and accurate long-read alignment with Burrows-Wheeler transformJ.Bioinformatics,2010,26(5):589-595.14 Xu J,Fu Y,Hu
47、Y,et al.Whole genome variants across 57 pig breeds enable comprehensive identification of genetic signa-tures that underlie breed featuresJ.J Anim Sci Biotechnol,2020,11(1):115.15 Cingolani P,Platts A,Wang L L,et al.A program for annotating and predicting the effects of single nucleotide polymorphis
48、ms,SnpEff:SNPs in the genome of Drosophila melanogaster strain w1118;iso-2;iso-3J.Fly,2012,6(2):80-92.16 Huang D W,Sherman B T,Lempicki R A,et al.Systematic and integrative analysis of large gene lists using DAVID bioinfo-rmatics resourcesJ.Nat Protoc,2009,4(1):44-57.17 兰蓉,朱兰,邵庆勇,等.云南黑山羊全基因组重测序 J.草食
49、家畜,2016(5):11-17.18 郭意龙,张文德,陈梦君,等.意大利蜜蜂工蜂中肠 SNP和 InDel 突变位点的挖掘及分析 J.环境昆虫学报,2023,45(1):163-171.19 Zhang Q,Huang R,Ma X,et al.Association of Rs339939442 in the AHR gene with litter size are inconsistent among Chinese indigenous pigs and western commercial pigs J.Animals,2019,10(1):11.20 Ren H,Tang Q,X
50、ue T,et al.AHRA 24-bp indel within the sheep gene is associated with litter sizeJ.Anim Biotechnol,2022,33(7):1533-1538.21 Arshad M S,Sohaib M,Ahmad R S,et al.Ruminant meat flavor influenced by different factors with special reference to fatty acidsJ.Lipids Health Dis,2018,17(1):223.22 Li J,Tang C H,