1、Hereditas(Beijing)2024 年 2 月,46(2):149167 收稿日期:20231211;修回日期:20240124;网络发布日期:20240126 基金项目:国家重点研发计划项目(编号:2022YFC3341004),国家自然科学基金项目(编号:82171870),公安部鉴定中心基本科研业务费专项资金项目(编号:2022JB020)和现场物证溯源技术国家工程实验室开放课题(编号:2021FGKFKT01)资助 Supported by the National Key R&D Program of China(No.2022YFC3341004),the Nationa
2、l Natural Science Foundation of China(No.82171870),the Fundamental Research Funds for Institute of Forensic Science(No.2022JB020),and the Open Project of the National Engineering Laboratory for Forensic Science(No.2021FGKFKT01)作者简介:朱信,硕士研究生,专业方向:法医物证学。E-mail: 通讯作者:黄江,博士,教授,研究方向:法医物证学。E-mail:mmm_ 江丽,
3、博士,副主任法医师,研究方向:法医遗传学。E-mail: DOI:10.16288/j.yczz.23-260 研究报告基于 Y-SNP 和 Y-STR 揭示汉族人群父系遗传关系 朱信1,2,金鑫3,刘俊2,4,杨澜2,4,邹丽馨2,5,李彩霞1,2,黄江1,江丽2 1.贵州医科大学法医学院,贵阳 550004 2.公安部鉴定中心,北京市现场物证检验工程技术研究中心,现场物证溯源技术国家工程实验室,北京 100038 3.海南省公安厅,海口 570203 4.山西医科大学,太原 030001 5.江苏师范大学,徐州 221116 摘要:汉族是中国人口最多的民族,现有研究多集中于汉族人群的起源、
4、迁徙、融合等遗传历史,以及局部地区汉族人群的父系遗传关系,鲜有全局视角下的汉族人群父系遗传结构研究。本研究检测了 362 份青海、四川和辽宁的汉族无关男性样本,整合已发表文献相关数据,最终获得了国内 15 个省份 16 个汉族人群 1830 人份样本,覆盖 89 个 Y-SNP、16 个 Y-STR 的数据。通过统计 Y-SNP 单倍群频率、Y-STR 单倍型多样性,使用主成分分析(principal component analysis,PCA)、系统发育树、单倍型网络等分析,综合 Y-SNP 和 Y-STR 两个反映不同时间尺度的遗传标记,研究不同地区汉族人群之间的遗传分化、汉族人群与其周
5、边少数民族的遗传关系。单倍群频率统计结果显示单倍群 O-M175 是汉族人群主体单倍群(青海汉族 60.53%广东汉族 92.7%),其下游亚单倍群呈现地域差异化分布。单倍群 O2-M122 高频分布于各地汉族,总体分布趋势北高南低;单倍群O1b-M268 分布频率由南向北递减,尤其在岭南地区汉族人群中分布显著;单倍群 O1a-M119 在中部汉族人群中分布频率较高。汉族人群遗传结构研究表明,其主要分为北部、中部及南部三个聚类簇,其中青海汉族与其他地区汉族存在一定的遗传分化。在合并少数民族的遗传关系研究中,汉族人群彼此之间遗传关系更紧密,但北部汉族与回族遗传关系更近,而南部汉族则与仡佬族、黎族
6、遗传关系更近。总之,本文基于 89 个 Y-SNP 和16 个 Y-STR,系统地研究了中国不同地域的汉族人群的单倍群分布、遗传亚结构及其与周边少数民族的遗传关系,为群体遗传学、法医遗传学补充理论依据,为 Y 染色体的法医学应用提供数据支撑。Y-SNP 单倍群结合 Y-STR 单倍型对于分析汉族人群遗传亚结构以及法医学应用具有重要作用。关键词:群体遗传学;法医遗传学;Y-SNP;Y-STR 150 Hereditas(Beijing)2024 第 46 卷 Paternal genetic structure analysis of the modern Han populations bas
7、ed on Y-SNP and Y-STR Xin Zhu1,2,Xin Jin3,Jun Liu2,4,Lan Yang2,4,Lixin Zou2,5,Caixia Li1,2,Jiang Huang1,Li Jiang2 1.Institute of Forensic Medicine,Guizhou Medical University,Guiyang 550004,China 2.Key Laboratory of Forensic Genetics,Beijing Engineering Research Center of Crime Scene Evidence Examina
8、tion,National Engineering Laboratory for Forensic Science,Institute of Forensic Science,Beijing 100038,China 3.Public Security Department of Hainan Province,Haikou 570203,China 4.Shanxi Medical University,Taiyuan 030001,China 5.Jiangsu Normal University,Xuzhou 221116,China Abstract:The Han populatio
9、ns represent the largest ethnic group in China.Previous studies have primarily focused on investigating their genetic origins,migration and integration,as well as paternal genetic relationships within specific regional Han populations.However,a comprehensive analysis of the global paternal genetic s
10、tructure of Han populations is lacking.In this study,we performed Y-chromosome sequencing on 362 unrelated male samples from Chinese Han individuals collected from Qinghai,Sichuan and Liaoning provinces.We then integrated relevant data from reported studies.Our final dataset comprised 1830 samples f
11、rom 16 Han populations across 15 provinces in China,encompassing information on 89 Y-SNPs and 16 Y-STRs.Statistical analyses were conducted to assess Y-STR haplotype diversity(HD)and Y-SNP haplogroup frequencies.Additionally,we employed principal component analysis(PCA),phylogenetic tree and haploty
12、pe network to explore genetic differentiation within Han populations and the genetic relationships between Han populations and ethnic minorities surrounding them.Our results demonstrated that the O-M175 haplogroup represents the predominant paternal lineage in Han populations,with frequencies rangin
13、g from 60.53%(Qinghai Han)to 92.7%(Guangdong Han).Moreover,the subclades downstream of O-M175 showed distinct regional variations in their distribution patterns.The O2-M122 haplogroup was prevalent in all Han populations and demonstrated a gradual decline in frequency from north to south.Conversely,
14、the distribution frequency of the O1b-M268 haplogroup decreased from south to north,particularly showed significant presence among Han populations in the Lingnan region.Haplogroup O1a-M119 distributed more frequently in the central Han populations.Our findings revealed that Chinese Han populations c
15、an be categorized into three subgroups:northern,central,and southern.Notably,there were significant differences among Han in Qinghai and other regions.Regarding the genetic relationships between Han populations and surrounding ethnic minorities,we observed a closer genetic affinity between different
16、 Han populations,but northern Han demonstrated a stronger relationship with the Hui ethnic group,while southern Han exhibited a closer connection with the Gelao and Li ethnic groups.In summary,this study presented a systematic analysis of haplogroup distribution,genetic substructure of Han populatio
17、ns and genetic relationships between Han populations and surrounding ethnic minorities based on 89 Y-SNPs and 16 Y-STRs systematically.Our research supplemented valuable insights into population genetics and forensic genetics,and provided data support for the forensic application of Y chromosome.The
18、 integration of Y-SNP haplogroups with Y-STR haplotypes offers enhanced understanding of the genetic substructure within Han populations,which holds significance for both population genetics research and forensic science applications.Keywords:population genetics;forensic genetics;Y-SNP;Y-STR 第2期 朱信等
19、:基于 Y-SNP 和 Y-STR 揭示汉族人群父系遗传关系 151 男 性 特 异 的Y 染 色 体 非 重 组 区 域(non-recombining Y,NRY)遵循严格的父系遗传1,被广泛应用于进化人类学2、遗传系谱学1,3、医学遗传学1,4和法医遗传学5,6等研究领域。Y 染色体上常用的遗传标记是短串联重复序列(Y-chromosome short tandem repeat,Y-STR)和 单 核 苷 酸 多 态 性(Y-chromosome single nucleotide polymorphism,Y-SNP)。具有高突变率的 Y-STR(3.781047.44 102次突变
20、/代)随父系世代传递过程中累积突变产生了独特的单倍型69。然而,在实际应用中由于标记集的大小有限,来自不同父系的个体可能巧合地表现出相同的单倍型1013,Y-STR 单倍型匹配有时并无法代表个体父系祖源的一致性。而突变速度相对缓慢的 Y-SNP(1.0109突变/代)能够通过突变发生时期建立系统发育树并定义 Y-SNP 单倍群类型14,15,Y-SNP 单倍群的分布具有一定地理及族群相关性。因此,Y-STR 结合 Y-SNP 对分析人群父系遗传关系具有重要的意义16,17,目前,在法医学实践中利用 Y-STR 推测男性犯罪嫌疑人的家系和来源群体,尚缺应用于法医学领域的 Y-SNP 单倍群人群分
21、布作为参考数据,为弥补缺少适用于物证鉴定的Y-SNP 复合扩增体系等问题,国内外不少研究尝试基于 Y-STR 推断 Y-SNP 单倍群1820,但其推断准确性有待进一步验证,因此开展 Y-SNP 单倍群人群验证研究十分必要。以往研究已开发了覆盖数十至数百个 Y-SNP 位点的检测体系2129,但随着测序技术的发展许多新发现及不断被更正的 Y-SNP 位点仍有待进一步人群数据验证。汉族是世界上人数最多的民族,其母语汉语,属于汉藏语系两大语族之一。据全国第七次人口普查数据,汉族人口约占中国总人口的 91.11%30,占全球人口的近 18%。我国人口历史悠久、起源复杂,汉族主要集中在东部和中部地区,
22、少数民族多分布在西南、西北及东北等地区,各民族间呈现“大杂居、小聚居”的分布格局。汉族在历史迁徙过程中与周边其他民族相互交流融合31,受地理、经济和文化因素影响,不同地区的汉族人群产生了一定程度的遗传分化3234。我国总体地势呈现西高东低,居住在东部平原、丘陵上以种植业为主的民族多形成大而集中或长条形的聚落,彼此交流更频繁;生活在西部高原山区的民族多呈小而分散的聚落,聚落间彼此交流相对较少35。基于全基因组的汉族人群遗传关系研究已有不少,如 PGGHan、WBBC(Westlake BioBank for Chinese)、ChinaMap 等3638,基于线粒体研究中汉族人群的覆盖也十分广泛
23、32,其都表现出汉族人群明显的地理分化。而汉族父系遗传结构的研究还存在采样的局限性,主要集中在中国东部,其表现出明显的南北分化33,3941,但对与少数民族混居的西部地区汉族研究仍较少,总体地域覆盖度不够。因此,本研究检测了 362 份汉族样本,并与收集的已发表文献中不同地域汉族 Y 染色体数据进行整合,得到 15 个省份 16 个汉族人群1830 份样本的 89Y-SNP、16Y-STR 数据集33,42,并与文献中收集的少数民族 Y-SNP、Y-STR 数据合并。拟通过不同地域的汉族人群 Y-SNP 单倍群分布、遗传分化,汉族人群与周边少数民族遗传关系等研究,对中国不同地区汉族父系遗传关系
24、及汉族人群与周边少数民族的遗传交流进行综合解析。1 材料与方法 1.1 样本采集与 DNA 提取 本研究采集了 362 份汉族无关男性个体静脉血样本,其中辽宁铁岭汉族 80 份,青海汉族 114 份,四川阿坝汉族 76 份,四川甘孜汉族 91 份。本研究已通过公安部鉴定中心伦理委员会审查(伦理批号:2023-021),所有参与志愿者均签署知情同意书。根据试剂盒说明书,采用 QIAamp DNA Blood Midi Kit(德国 QIAGEN 公司)进行 DNA 提取。使用 Nano Drop 2000c(美国 Thermo Fisher Scientific 公司)进行DNA 定量并稀释至
25、5 ng/L 待检。1.2 Y-SNP 位点筛选及分型检测 使用AIYSNP89试剂盒(北京刑技技术有限责任公司)对上述样本在 89 个 Y-SNP 位点上的分型进行检测,操作步骤、体系配比及参数设置等均按照试剂盒说明书进行。应用 GeneAmp PCR Systerm 9700热循环仪(德国 Eppendorf 公司)进行复合扩增,使用ABI 3500 xL 遗 传 分 析 仪(美 国 Thermo Fisher Scientific 公司)对扩增产物进行毛细管电泳检测,利用 GeneMapper ID v3.2 软件分析 Y-SNP 分型。152 Hereditas(Beijing)202
26、4 第 46 卷 1.3 Y-STR 分型检测 使用PowerPlex Y23试剂盒(美国Promega公司)检测 76 份四川阿坝汉族、91 份四川甘孜汉族、80份辽宁铁岭汉族及 90 份青海汉族样本;使用DNATyper Y26 试剂盒(北京刑技技术有限责任公司)检测另外 25 份青海汉族样本。应用 GeneAmp PCR Systerm 9700 热循环仪(德国 Eppendorf 公司)进行扩增,扩增产物用 ABI 3500 xL 遗传分析仪(美国Thermo Fisher Scientific 公司)进行毛细管电泳检测,使用 GeneMapper ID-X 软件分析 Y-STR 分型
27、。1.4 数据整合 本研究使用的人群信息列表如表 1 所示。表 1 中国人群信息列表 Table 1 List of chinese population information 序号 语系 语族 群体 样本量数据集 来源 1 汉藏语系汉藏语系 汉语族汉语族 辽宁铁岭汉族辽宁铁岭汉族 80 研究人群研究人群 自检自检 2 黑龙江汉族黑龙江汉族 94 研究人群研究人群 文献文献33 3 北京汉族北京汉族 114 研究人群研究人群 文献文献33 4 山西汉族山西汉族 99 研究人群研究人群 文献文献33 5 山东汉族山东汉族 96 研究人群研究人群 文献文献33 6 河南汉族河南汉族 199 研究
28、人群研究人群 文献文献33 7 江西汉族江西汉族 110 研究人群研究人群 文献文献33 8 湖南汉族湖南汉族 106 研究人群研究人群 文献文献33 9 福建汉族福建汉族 124 研究人群研究人群 文献文献33 10 浙江汉族浙江汉族 97 研究人群研究人群 文献文献33 11 青海汉族青海汉族 114 研究人群研究人群 自检自检 12 四川阿坝汉族四川阿坝汉族 76 研究人群研究人群 自检自检 13 四川甘孜汉族四川甘孜汉族 91 研究人群研究人群 自检自检 14 广东汉族广东汉族 117 研究人群研究人群 文献文献33 15 广西汉族广西汉族 113 研究人群研究人群 文献文献33 16
29、 海南汉族海南汉族 200 研究人群研究人群 文献文献42 17 新疆回族 49 60Y-SNP数据集,16Y-STR数据集 文献22 18 青海回族 69 60Y-SNP数据集,16Y-STR数据集 文献22 19 甘肃回族 167 60Y-SNP数据集,16Y-STR数据集 文献22 20 宁夏回族 85 60Y-SNP数据集,16Y-STR数据集 文献22 21 陕西回族 84 60Y-SNP数据集,16Y-STR数据集 文献22 22 河南回族 67 60Y-SNP数据集,16Y-STR数据集 文献22 23 山东回族 48 60Y-SNP数据集,16Y-STR数据集 文献22 24
30、四川回族 38 60Y-SNP数据集,16Y-STR数据集 文献22 25 云南回族 43 60Y-SNP数据集,16Y-STR数据集 文献22 26 藏缅语族 四川甘孜藏族 88 60Y-SNP数据集,16Y-STR数据集 文献48 27 青海藏族1 82 60Y-SNP数据集,16Y-STR数据集 文献48 28 西藏藏族 251 60Y-SNP数据集,16Y-STR数据集 文献48 29 四川阿坝藏族 68 60Y-SNP数据集,16Y-STR数据集 文献48 30 四川美姑彝族 222 60Y-SNP数据集,16Y-STR数据集 文献46 31 四川昭觉彝族 205 60Y-SNP数据
31、集,16Y-STR数据集 文献46 32 四川北川羌族 422 60Y-SNP数据集,16Y-STR数据集 文献45 第2期 朱信等:基于 Y-SNP 和 Y-STR 揭示汉族人群父系遗传关系 153 续表 序号 语系 语族 群体 样本量数据集 来源 33 阿尔泰语系 蒙古语族 内蒙古呼和浩特蒙古族 228 60Y-SNP数据集,16Y-STR数据集 文献44 34 内蒙古呼伦贝尔蒙古族 217 60Y-SNP数据集,16Y-STR数据集 文献44 35 内蒙古鄂尔多斯蒙古族 199 60Y-SNP数据集,16Y-STR数据集 文献44 36 突厥语族 新疆柯尔克孜族 297 60Y-SNP数
32、据集,16Y-STR数据集 文献43 37 侗台语系 侗水语族 海南黎族 102 60Y-SNP数据集,16Y-STR数据集 文献42 38 仡央语族 贵州遵义仡佬族 68 60Y-SNP数据集 文献49 39 汉藏语系 汉语族 四川成都汉族 2228 16Y-STR数据集 文献51 40 福建汉族2 50 16Y-STR数据集 文献50 41 台湾汉族 93 16Y-STR数据集 文献50 42 上海崇明岛汉族 527 16Y-STR数据集 文献40 43 上海浦东汉族 689 16Y-STR数据集 文献40 44 山东汉族2 303 16Y-STR数据集 文献39 45 云南汉族 540
33、16Y-STR数据集 文献39 46 藏缅语族 青海藏族2 163 16Y-STR数据集 文献52 47 侗台语系 壮傣语族 广西壮族 201 16Y-STR数据集 文献47 主体研究人群用加粗字体表示,其他人群用斜体表示。人群尾缀 1、2 表示引自不同文献的人群。从文献中收集了 1468 份汉族 Y-SNP、Y-STR数据33,42,与上述检测数据进行整合,得到覆盖 16个汉族人群 89 个 Y-SNP、16 个 Y-STR 的研究人群数据集。同时,为了了解不同地区汉族群体与周边少数民族之间的遗传关系,本研究还收集了文献中Y-SNP 位点数相近的国内人群数据22,33,39,40,4249与
34、本研究人群进行合并后得到包含 60 个 Y-SNP位 点 的 38 个 中 国 人 群 数 据 集,下 文 简 称 为60Y-SNP 数 据 集;收 集 了 文 献 中 的 中 国 人 群Y-STR 数据33,39,40,4248,50,51与本研究人群进行合并后得到包含 16 个 Y-STR 的 46 个中国人群数据集,下文简称为 16Y-STR 数据集。1.5 数据分析 1.5.1 Y-SNP 单倍群划分及在不同地区汉族中分布 基于研究人群数据集,根据国际 Y 染色体协会(Y chromosome consortium,YCC)的单倍群命名原则,依据 Y 染色体谱系树(ISOGG 网站版本
35、号 14.177,更新日期 2019 年 10 月 8 日)进行 Y 染色体单倍群划分53。使用 Excel 直接计数统计 16 个汉族人群基于89 个 Y-SNP 单倍群频率数据。1.5.2 Y-STR 的基因多样性与单倍型多样性 基于 16 个 Y-STR 基因座(DYS19、DYS389I、DYS389II、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS448、DYS456、DYS458、DYS533、DYS635 和 GATA-H4),使用Excel 直接计数计算 16 个研究人群的等位基因频率和单倍型频率、单倍型多样性(hap
36、lotype diversity,HD)、单倍型多样性与基因多样性(genetic diversity,GD)、匹配概率(haplotype match probability,HMP)和鉴别能力(discrimination capacity,DC)5455等法医学参数。1.5.3 中国不同地区汉族人群父系遗传关系分析 基于研究人群数据集的 Y-SNP 单倍群频率,使用 R v4.1.2 软件 prcomp 函数进行 PCA 分析及ggplot256包进行可视化。基于研究人群数据集的 16个 Y-STR 数据,删除单倍型中单拷贝基因座二等位变异和空等位变异的样本。使用 Arlequin v3
37、.5.2.257软件中的 AMOVA 参数,通过分子方差分析(analysis of molecular variance,AMOVA)58计算群体之间成对 154 Hereditas(Beijing)2024 第 46 卷 遗传距离 RST值分析遗传分化情况,用 MEGA v11软件构建邻接树59。基于 7 个 Y-STR 基因座(DYS19、DYS392、DYS393、DYS437、DYS438、DYS448、YGATAH4)使用 NETWORK v10.2 软件60构建不同地域汉族人群的单倍型中位连接(median joining,MJ)网络图11,为了更明显观察人群间个体的聚类关系,网
38、络图使用最大简约树进行展示。1.5.4 中国不同人群父系遗传关系分析 基于 60Y-SNP 数据集,用 R v4.1.2 软件 prcomp函数进行 PCA 分析及 ggplot256 包进行可视化。基于全部 16Y-STR 数据集,删除单倍型中单拷贝基因座二等位变异和空等位变异的样本。使用 Arlequin v3.5.2.257软件计算中国各人群间的 RST值,并基于人群RST矩阵用R v4.1.2软件绘制热图展示人群聚类关系,分析汉族与周边少数民族遗传关系。基于同时覆盖 60Y-SNP、16Y-STR 的人群,对其 7 个 Y-STR基因座(DYS19、DYS392、DYS393、DYS4
39、37、DYS438、DYS448、YGATA-H4)用 NETWORK v10.2软件60进行周边少数民族特征单倍群的中位连接网络分析,观察特定单倍群下不同语系人群的单倍型共享情况11,网络图使用最大简约树进行展示。2 结果与分析 本研究将实验室检测的 362 份汉族与文献收集的 1468 份汉族样本 Y-SNP、Y-STR 数据进行整合得到 16 个汉族人群 1830 份样本的研究人群数据集,位点覆盖 89 个 Y-SNP、16 个 Y-STR33,42。通过Y-SNP 单倍群频率统计、Y-STR 单倍型多样性计算、PCA、RST值系统发育树、单倍型网络分析等方法研究不同地区汉族之间的遗传关
40、系。此外,我们还将汉族研究人群数据集分别与文献报道的国内人群数据进行合并,分别得到了 60Y-SNP 数据集22,33,39,40,4249和 16Y-STR 数据集33,39,40,4248,50,51(表 1),从不同角度观察汉族人群与其周边人群的遗传交流。2.1 Y-SNP 单倍群在不同地区汉族人群中的分布差异 基于 89 个 Y-SNP,16 个汉族人群共观察到 63个不同的末端单倍群。主干单倍群在不同地区汉族的分布频率如图 1 所示,东亚地区高频分布的单倍群 O-M175、C2-M217、N-M231、D1-M174 占汉族人群父系单倍群的 88%以上。O-M175 单倍群为汉族人群
41、的主体单倍群(青海汉族 60.53%广东汉族92.7%),其中,青海汉族 O-M175 单倍群分布(60.53%)较其他汉族(67%92.7%)低。O-M175 下游的亚单倍群分布呈现出一定的地域差异性,O2-M122 单倍群在各个地区汉族人群中分布最高(青海汉族 46.49%-山西汉族 65.5%),但广西汉族例外(35.7%),总体分布趋势呈现北高南低,但西北的青海汉族 O2-M122分布较除广西汉族以外的其他汉族都低。O2-M122单倍群下游的三个大分支分别为 O2a2b1*-M134+,M117-及其下游分支(广西汉族 4.5%黑龙江汉族17%)、O2a2b1a1-M117 及其下游分
42、支(青海汉族10.53%山西汉族 24.2%)和 O2a1b-IMS-JST002611及其下游分支(广西汉族 8%黑龙江汉族 22.2%)。单倍群 O1b-M268 在岭南地区汉族人群中分布明显高于其他地区(广西汉族 38%、海南汉族 21.5%),呈现由南向北递减趋势;单倍群 O1a-M119 在中部地区的汉族人群中分布频率明显较高(江西汉族 30.6%、浙江汉族 26.7%、湖南汉族 23.6%、福建汉族 16.9%)。单倍群 C2-M217 是汉族人群的第二大单倍群(福建汉族 3.2%河南汉族 15.5%),在北部及西北部汉族人群中分布频率较高(河南汉族 15.5%、青海汉族12.15
43、%、黑龙江汉族 12.8%、山西汉族 12.1%、辽宁铁岭汉族 11.25%),在南部汉族人群中分布频率均低于 6%。单倍群 N-M231 的分布也呈现出一定由北向南递减的趋势(黑龙江汉族 10.7%、青海汉族 10.53%、山东汉族 12.5%,南部汉族人群中均低于 10%)。单倍群D1-M174在青藏高原周边地区及北部地区低频分布(甘孜汉族 5.49%、广西汉族 4.4%、辽宁铁岭汉族 3.75%、北京汉族 2.7%),在南部平原地区几乎不分 布。其 他 零 散 分 布 的 单 倍 群 还 有 Q-M242(0%7.1%)、R-M207(0%4.39%)、J-M304(0%1.75%),分
44、布趋势呈现北高南低。2.2 Y-STR 单倍型多样性和基因多样性 在 16 个单拷贝 Y-STR 基因座组成的单倍型中,1830 份汉族样本共检测到 1737 个单倍型,其中 1 个 第2期 朱信等:基于 Y-SNP 和 Y-STR 揭示汉族人群父系遗传关系 155 图 1 中国 16 个汉族人群单倍群频率分布 Fig.1 Haplogroup frequency distribution of 16 Chinese Han populations 红色字体代表其下游单倍群频率的加和。156 Hereditas(Beijing)2024 第 46 卷 单倍型重复了 7 次、1 个单倍型重复了
45、6 次、1 个单倍型重复了 4 次、8 个单倍型重复了 3 次、63 个单倍型重复了 2 次。16 个单拷贝 Y-STR 基因座中汉族群体的单倍型多样性(HD)均高于 0.99,HD 及 DC 为1 的汉族人群均分布于中国北部(分别为黑龙江汉族、辽宁铁岭汉族、山西汉族),且北部汉族 HD 值普遍高于其他地区(表 2)。在 1830 份汉族样本中共检测到 60 个中间等位基因、2 个空等位基因和 9 个拷贝数变异,16 个 Y-STR 基因座在汉族人群中的 GD 值介于 0.292(DYS391)到 0.84(DYS458)之间(图 2),其中 DYS458、DYS635、DYS389II、DY
46、S392、DYS19、DYS448、DYS390 等基因座在各地汉族人群中基因多样性普遍较高,GD 值均高于 0.6。在部分基因座上不同地区汉族 GD 值表现出较大的差异。北部地区(辽宁铁岭、山东、山西、河南)汉族人群在 DYS19、DYS389II、DYS437、DYS392 等基因座上 GD 值较高,其中北京和黑龙江汉族在 DYS389I、DYS390、DYS437、DYS438 等基因座上变异较大,GD 值较其他北部汉族低。中部(浙江、江西、福建、湖南)汉族人群在 DYS389、DYS533、YGATA-H4 等基因 座上 GD 值较低。而南部地区(广东、广西、海南)汉族在不同基因座的
47、GD值差异较大,在 DYS389I、DYS393、DYS533、YGATA-H4 基因座上广西汉族明显高于广东、海南汉族。2.3 不同地区汉族人群遗传关系及遗传分化 2.3.1 不同地区汉族人群 Y-SNP 遗传关系及遗传分化 基于不同地区汉族人群的 Y-SNP单倍群频率的主成分分析(PCA)结果见图 3A。在第一个主成分上显示了北部汉族(黑龙江、辽宁铁岭、山东、山西、北京和河南)、中部汉族(浙江、湖南、福建、江西)和南部汉族(广东、广西和海南)三个明显的遗传聚类簇,这与地理分布关系一致。北部汉族聚类紧密,而南部汉族聚类相对松散,表明南部汉族彼此之间的遗传分化程度比北部汉族大。西部汉族呈现明显
48、的遗传差异,西南地区(四川阿坝、四川甘孜)的汉族人群与中部地区(湖南、福建、江西、浙江)汉族聚集在一起,西北地区的青海汉族与其他汉族人群显示出明显的遗传分化。表 2 基于 16 个 Y-STR 基因座的汉族人群法医学参数 Table 2 Forensic parameters of Han populations based on 16 Y-STR loci 地区 样本量 人群 观察到的单倍型数量 单倍型数 MP HD DC 中国北部 114 北京汉族 113 0.00908 0.99968 0.99123 94 黑龙江汉族 94 0.01064 1 1 80 辽宁铁岭汉族 80 0.0125
49、0 1 1 199 河南汉族 195 0.00544 0.99958 0.97990 96 山东汉族 95 0.01086 0.99955 0.98958 99 山西汉族 99 0.01010 1 1 中国西部 114 青海汉族 113 0.00932 0.99937 0.98261 76 四川阿坝汉族 75 0.01387 0.99928 0.98684 91 四川甘孜汉族 88 0.01214 0.99896 0.97778 中国中部 106 湖南汉族 104 0.01017 0.99926 0.98113 110 江西汉族 108 0.00977 0.99931 0.98182 97 浙
50、江汉族 95 0.01119 0.99911 0.97938 124 福建汉族 116 0.01040 0.99764 0.93548 中国南部 117 广东汉族 115 0.00915 0.99939 0.98291 113 广西汉族 110 0.00983 0.99901 0.97345 200 海南汉族 195 0.00552 0.99947 0.97500 第2期 朱信等:基于 Y-SNP 和 Y-STR 揭示汉族人群父系遗传关系 157 图 2 16 个 Y-STR 基因座在 16 个汉族人群中的基因多样性 Fig.2 Genetic diversity of 16 Y-STR lo
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100