1、Journal of Forensic Medicine,June 2023,Vol.39,No.3生物学半同胞关系鉴定策略谭政,马冠车,付丽红,张晓静,王茜,付光平,杜情情,李淑瑾河北医科大学法医学院 河北省法医学重点实验室,河北 石家庄 050017摘要:目的 比较似然比(likelihood ratio,LR)法和状态一致性(identity by state,IBS)法在半同胞关系鉴定中的应用价值,为制定半同胞鉴定相关规范提供参考。方法(1)基于相同的遗传标记组合,比较实际案例与计算机模拟案例的累计状态一致性评分(cumulated identity by state score,CI
2、BS)与累积全同胞关系指数分布,验证计算机模拟方法的可信度;(2)模拟获得全同胞、半同胞、无关个体对各100万对在不同数量的三种类型遗传标记上的分型,分别计算CIBS和相应类型的累积LR参数;(3)比较基于不同数据、不同种类的遗传标记、应用不同准确度标准区分上述三种关系个体对时,LR法和 IBS法所能提供的最佳系统效能,以比较两种方法在上述鉴定中的应用价值;(4)根据已有模拟数据,以曲线拟合的方式估计应用不同类型遗传标记鉴别半同胞与另两种关系个体对所需的最低遗传标记数目。结果(1)经秩和检验,在真实关系和检验的遗传标记组合相同的前提下,模拟方法与实际案例所得结果差异无统计学意义;(2)多数情况
3、下,在其他条件设置相同时,LR法的系统效能大于 IBS法;(3)基于现有数据,可以通过曲线拟合的方式得到全-半同胞鉴定和半同胞鉴定在系统效能达到0.95或0.99时所需遗传标记的数目。结论 在进行甄别全同胞对和半同胞对或甄别半同胞对和无关个体对的鉴定时,推荐优先使用 LR法,并根据拟进行的鉴定类型和基于的人群数据估计所需遗传标记数目,以保证鉴定效果。关键词:法医遗传学;同胞关系;半同胞;似然比;状态一致性;短串联重复序列;单核苷酸多态性;微单倍型文章编号:1004-5619(2023)03-0262-09 中图分类号:R89;DF795.2;D919.2doi:10.12116/j.issn.
4、1004-5619.2023.530107 文献标志码:A Identification Strategy of Biological Half Sibling RelationshipTAN Zheng,MA Guan-ju,FU Li-hong,ZHANG Xiao-jing,WANG Qian,FU Guang-ping,DU Qing-qing,LI Shu-jinHebei Key Laboratory of Forensic Medicine,College of Forensic Medicine,Hebei Medical University,Shijiazhuang 050
5、017,ChinaAbstract:Objective To compare the application value of the likelihood ratio(LR)method and identity by state(IBS)method in the identification involving half sibling relationships,and to provide a reference for the setting of relevant standards for identification of half sibling relationship.
6、Methods(1)Based on the same genetic marker combinations,the reliability of computer simulation method was verified by comparing the distributions of cumulated identity by state score(CIBS)and combined full sibling index in actual cases with the distributions in simulated cases.(2)In different number
7、s of three genetic marker combinations,the simulation of full sibling,half sibling and unrelated individual pairs,each 1 million pairs,was obtained;the CIBS,as well as the corresponding types of cumulative LR parameters,were calculated.(3)The application value of LR method was compared with that of
8、IBS method,by comparing the best system efficiency provided by LR method and IBS method when 论著 基金项目:国家自然科学基金资助项目(82072118);河北省自然科学基金资助项目(H2021206451);河北省省级科技计划资助项目(225A5602D)作者简介:谭政(1995),男,土家族,硕士,主要从事法医遗传学研究;E-mail:通信作者:李淑瑾,女,博士,教授,博士研究生导师,主要从事法医遗传学研究;E-mail:引用格式:谭政,马冠车,付丽红,等.生物学半同胞关系鉴定策略J.法医学杂志,2
9、023,39(3):262-270.To cite:TAN Z,MA G J,FU L H,et al.Identification strategy of biological half sibling relationshipJ.Fayixue Zazhi,2023,39(3):262-270.法医学亲子和亲缘关系鉴定专题 genetic markers in different amounts and of different types and accuracy were applied to distinguish the above three relational individ
10、ual pairs.(4)According to the existing simulation data,the minimum number of genetic markers required to distinguish half siblings from the other two relationships using different types of genetic markers was estimated by curve fitting.Results(1)After the rank sum test,under the premise that the rea
11、l relationship and the genetic marker combination tested were the same,there was no significant difference between the simulation method and the results obtained in the actual case.(2)In most cases,under the same conditions,the system effectiveness obtained by LR method was greater than that by IBS
12、method.(3)According to the existing data,the number of genetic markers required for full-half siblings and half sibling identification could be obtained by curve fitting when the system effectiveness reached 0.95 or 0.99.Conclusion When distinguishing half sibling from full sibling pairs or unrelate
13、d pairs,it is recommended to give preference to the LR method,and estimate the required number of markers according to the identification types and the population data,to ensure the identification effect.Keywords:forensic genetics;sibling relationship;half sibling;likelihood ratio;identity by state;
14、short tandem repeats;single nucleotide polymorphism;microhaplotype近年来,在法医物证实际检案中,同胞关系(包括全同胞和半同胞)鉴定诉求逐渐增多1-2。为满足生物学全同胞鉴定需求,司法部于 2014年颁布了 生物学全同胞鉴定实施规范3(SF/Z JD01050022014,以下简称“2014版规范”),对状态一致性(identity by state,IBS)法在该类鉴定中的应用进行了规范。此后,司法部于 2021年颁布了修改后的 生物学全同胞鉴定技术规范4(SF/T 01172021,以下简称“2021版规范”),该规范在 IB
15、S 法的基础上,在全同胞鉴定中引入似然比(likelihood ratio,LR)法,也即新增了全同胞关系指数(full sibling index,FSI)这一参数,分别给出了基于不同数量的STR基因座时,应用累计状态一致性评分(cumulated identity by state score,CIBS)或累积全同胞关系指数(combined full sibling index,CFSI)进行全同胞关系鉴定的判定阈值及相应的系统效能。在实际检案中,特别是刑事案件,有时需甄别半同胞与全同胞、半同胞与无关个体;同时,诸如SNP、微单倍型(microhaplotype,MH)、InDel等其他
16、种类的遗传标记在实际检案中的应用也越来越广泛。因此,需要针对上述遗传标记在这些鉴定目的中的应用进行更加深入的研究:(1)基于90对实际全同胞兄弟样本和 100万对 MATLAB R2021a软件(美国 MathWorks公司)编程模拟样本在不同数量STR基因座上的遗传信息,计算CIBS和CFSI参数,比较两种类型样本的结果分布,以验证计算机模拟方法的可行性;(2)应用计算机模拟的方式,大批量产生全同胞、半同胞及无关个体样本对在不同种类遗传标记上的遗传信息,比较IBS法和 LR法两种鉴定方法在与半同胞关系相关的鉴定中的应用价值;(3)应用曲线拟合方法,估计与半同胞关系相关的鉴定中,所需各种遗传标
17、记的最低数量,以期为半同胞鉴定相关规范的制定提供科学依据。1材料与方法1.1 计算机模拟方法可行性验证以 实 际 案 例 数 据 为 基 础,对 基 于 MATLAB R2021a软件自主开发的人群模拟工具结果的可信度进行评估,也即对计算机模拟方法的可行性进行评估。1.1.1 实际样本采集、STR分型及参数计算共采集 160 例样本血样各 2 mL,包括本课题组2019 年采集的 1 个河北汉族家系中的 28 例样本(可组成24对全同胞),以及河北医科大学法医鉴定中心日常检案中收集的132例河北汉族样本(可组成66对全同胞)。上述全同胞关系均通过父-母-子鉴定确认,且均排除同卵双生子可能。所有
18、成年样本以及未成年样本的监护人均已签署知情同意书,本研究获得河北医科大学伦理委员会审批(审批号2020098)。应用 E.Z.N.A.Blood DNA Midi 试剂盒(美国OMEGA公司)提取上述样本全血DNA;使用Goldeneye DNA 身份鉴识系统 20A(北京基点认知技术有限公司)、Goldeneye DNA身份鉴识系统 22NC(北京基点认知技术有限公司)以及 MicroreaderTM 23sp ID 系统(北京阅微基因技术股份有限公司)进行STR扩增;应用 3500XL 基因分析仪(美国 Applied Biosystems 公司)进行CE分型。上述 3个试剂盒共包含 42
19、个常染色体 STR 基因座,其中有 39 个在“2014 版规范”5.4.1 部分和“2021版规范”5.4.1部分推荐的基因座名单中。收集该39个STR 基因座在中国北方汉族人群的等位基因频率数据5-7,除 19个必检 STR基因座外,其余 STR基因座按DP从大到小排序,组成19、29和 39个 STR三种组合。将确定的 90 对全同胞个体对(full sibling pairs,FS)262法 医 学 杂 志 2023年 6月 第39卷 第3期genetic markers in different amounts and of different types and accuracy
20、were applied to distinguish the above three relational individual pairs.(4)According to the existing simulation data,the minimum number of genetic markers required to distinguish half siblings from the other two relationships using different types of genetic markers was estimated by curve fitting.Re
21、sults(1)After the rank sum test,under the premise that the real relationship and the genetic marker combination tested were the same,there was no significant difference between the simulation method and the results obtained in the actual case.(2)In most cases,under the same conditions,the system eff
22、ectiveness obtained by LR method was greater than that by IBS method.(3)According to the existing data,the number of genetic markers required for full-half siblings and half sibling identification could be obtained by curve fitting when the system effectiveness reached 0.95 or 0.99.Conclusion When d
23、istinguishing half sibling from full sibling pairs or unrelated pairs,it is recommended to give preference to the LR method,and estimate the required number of markers according to the identification types and the population data,to ensure the identification effect.Keywords:forensic genetics;sibling
24、 relationship;half sibling;likelihood ratio;identity by state;short tandem repeats;single nucleotide polymorphism;microhaplotype近年来,在法医物证实际检案中,同胞关系(包括全同胞和半同胞)鉴定诉求逐渐增多1-2。为满足生物学全同胞鉴定需求,司法部于2014年颁布了 生物学全同胞鉴定实施规范3(SF/Z JD01050022014,以下简称“2014版规范”),对状态一致性(identity by state,IBS)法在该类鉴定中的应用进行了规范。此后,司法部于 20
25、21年颁布了修改后的 生物学全同胞鉴定技术规范4(SF/T 01172021,以下简称“2021版规范”),该规范在 IBS 法的基础上,在全同胞鉴定中引入似然比(likelihood ratio,LR)法,也即新增了全同胞关系指数(full sibling index,FSI)这一参数,分别给出了基于不同数量的STR基因座时,应用累计状态一致性评分(cumulated identity by state score,CIBS)或累积全同胞关系指数(combined full sibling index,CFSI)进行全同胞关系鉴定的判定阈值及相应的系统效能。在实际检案中,特别是刑事案件,有时
26、需甄别半同胞与全同胞、半同胞与无关个体;同时,诸如SNP、微单倍型(microhaplotype,MH)、InDel等其他种类的遗传标记在实际检案中的应用也越来越广泛。因此,需要针对上述遗传标记在这些鉴定目的中的应用进行更加深入的研究:(1)基于90对实际全同胞兄弟样本和 100万对 MATLAB R2021a软件(美国 MathWorks公司)编程模拟样本在不同数量STR基因座上的遗传信息,计算CIBS和CFSI参数,比较两种类型样本的结果分布,以验证计算机模拟方法的可行性;(2)应用计算机模拟的方式,大批量产生全同胞、半同胞及无关个体样本对在不同种类遗传标记上的遗传信息,比较IBS法和 L
27、R法两种鉴定方法在与半同胞关系相关的鉴定中的应用价值;(3)应用曲线拟合方法,估计与半同胞关系相关的鉴定中,所需各种遗传标记的最低数量,以期为半同胞鉴定相关规范的制定提供科学依据。1材料与方法1.1 计算机模拟方法可行性验证以 实 际 案 例 数 据 为 基 础,对 基 于 MATLAB R2021a软件自主开发的人群模拟工具结果的可信度进行评估,也即对计算机模拟方法的可行性进行评估。1.1.1 实际样本采集、STR分型及参数计算共采集 160 例样本血样各 2 mL,包括本课题组2019 年采集的 1 个河北汉族家系中的 28 例样本(可组成24对全同胞),以及河北医科大学法医鉴定中心日常检
28、案中收集的132例河北汉族样本(可组成66对全同胞)。上述全同胞关系均通过父-母-子鉴定确认,且均排除同卵双生子可能。所有成年样本以及未成年样本的监护人均已签署知情同意书,本研究获得河北医科大学伦理委员会审批(审批号2020098)。应用 E.Z.N.A.Blood DNA Midi 试剂盒(美国OMEGA公司)提取上述样本全血DNA;使用Goldeneye DNA 身份鉴识系统 20A(北京基点认知技术有限公司)、Goldeneye DNA身份鉴识系统 22NC(北京基点认知技术有限公司)以及 MicroreaderTM 23sp ID 系统(北京阅微基因技术股份有限公司)进行STR扩增;应
29、用 3500XL 基因分析仪(美国 Applied Biosystems 公司)进行CE分型。上述 3个试剂盒共包含 42个常染色体 STR 基因座,其中有 39 个在“2014 版规范”5.4.1 部分和“2021版规范”5.4.1部分推荐的基因座名单中。收集该39个STR 基因座在中国北方汉族人群的等位基因频率数据5-7,除 19个必检 STR基因座外,其余 STR基因座按DP从大到小排序,组成19、29和 39个 STR三种组合。将确定的 90 对全同胞个体对(full sibling pairs,FS)263Journal of Forensic Medicine,June 2023,
30、Vol.39,No.3作为全同胞组,并在这些样本可以构成的无关个体对(unrelated pairs,UR)中,随机抽取 90 对作为无关个体组。基于上述两组中每对样本在三种遗传标记组合下的遗传信息,分别计算CIBS和CFSI。1.1.2 模拟样本数据生成、参数计算及与实际样本数据的比较根据以上三种遗传标记组合上的等位基因频率数据,应用 MATLAB R2021a软件编码模拟获得 FS和UR 各 100 万对,并分别计算 CIBS 和 CFSI。应用 R v4.2.2软件(http:/cran.r-project.org)绘制结果分布图,并基于两种关系个体对(FS或 UR)上 3种数量的 ST
31、R遗传标记(19、29、39 个)计算所得 2 种参数(CIBS、CFSI),共计 223=12组计算结果,分别在实际案例和模拟案例之间进行秩和检验,以验证计算机模拟工具的可信度。1.2 应用计算机模拟方法探索同胞鉴定策略的制定应用计算机模拟的方法产生大量不同关系的个体对,以研究三种类型遗传标记、两种鉴定方法在三种鉴定中的应用策略。1.2.1 计算机模拟及个案评价指标计算应用 MATLAB R2021a软件,模拟 FS、UR和半同胞个体对(half sibling pairs,HS)各100万对在不同遗传标记组合上的基因型数据:(1)“2021版规范”推荐的 55个 STR,按北方汉族人群 D
32、P值5-8从小到大排序(不区分是否属于 19个必检 STR),依次模拟 155个STR遗传标记;(2)基于 BGISEQ-500RS平台(深圳华大智造科技股份有限公司)构建的包含 257个 SNP的下一代测序(next generation sequencing,NGS)试剂盒9,按北方汉族人群 DP值从小到大排序,依次模拟1257个 SNP遗传标记;(3)基于 MiSeq FGx平台(美国 Illumina 公司)构建的包含 191 个 MH 的 NGS 试剂盒10,按北方汉族人群 DP值从小到大排序,依次模拟1191 个 MH 遗传标记。上述 SNP 与 MH 遗传标记,经连锁不平衡检验后
33、分别处于连锁平衡状态9-10。上述模拟的三种关系对,可以组成三类两两比较的鉴定,对特定鉴定中的两组个体对,分别计算两种方法所需个案评价参数,即LR法所需累积似然比(combined likelihood ratio,CLR)与IBS法所需CIBS。为表述方便,本研究分别将三类鉴定命名为:(1)全同胞鉴定,即区分FS和UR个体对的鉴定,其中LR法应用的参数为CFSI;(2)半同胞鉴定,即区分HS和UR个体对的鉴定,其中LR法应用的参数为累积半同胞关系指数(combined half sibling index,CHSI);(3)全-半同胞鉴定,即区分 FS和HS个体对的鉴定,其中LR法应用的参数
34、为累积全-半同胞似然比(combined likelihood ratio of FS-HS,CLRFH),计 算 公 式 为 CLRFH=CFSI/CHSI。应用 R v4.2.2软件绘制模拟所得结果分布图。1.2.2 系统效能评价参数计算本部分中涉及如下几类参数:(1)系统效能,应用特定判定阈值进行鉴定时,可以得出明确鉴定意见的概率,即表 1中(a+c+d+f)/N;(2)准确度,应用特定判定阈值进行鉴定时,在得出明确意见的案件中,判断准确的概率,即表 1 中(a+f)/(N3+N5);(3)假阳性率,应用特定判定阈值进行鉴定时,实际为较远关系但被错判为较近关系的个体对,占所有实际为较远关
35、系个体对的比例,即表 1 中 d/N2;(4)假阴性率,应用特定判定阈值进行鉴定时,实际为较近关系但被错判为较远关系的个体对,占所有实际为较近关系个体对的比例,即表 1中 c/N1。上述假阳性率和假阴性率仅用于LR 法 判 定 阈 值 的 设 置,并 不 直 接 用 于 系 统 效 能评价。为评价不同鉴定方法、不同遗传标记组合在特定鉴定中的应用价值,在1.2.1节所述各种鉴定中,基于两组个体对计算所得个案效能评价指标的分布,设置一定的准确度标准,按照上述标准设置判定阈值,计算相应阈值下的系统效能。此时不同方法或不同遗传标记组合之间准确度相当,故系统效能越高的方法或遗传标记组合的应用价值越高。根
36、据准确度标准设置判定阈值的方法如下。(1)准确度标准为“准确度不小于一个特定值”时,IBS法判定阈值的设置:每组鉴定中,在完成数据模拟和 CIBS计算后,可绘制两种关系个体对 CIBS的分布图,如果将CIBSt2者判定为另一种关系,CIBS在两者之间时不给出明确意见,则上述t1和t2分别称为排除阈值和认定阈值11。此处,参考“2021版规范”,将t1和t2均设置为整数。可知,若检测n个遗传标记,CIBS可能的取值有(2n+1)种,而t1和t2分别可以在0,2n+1和-1,2n两个区间内取值,且t2t1-1。而当 t1=0或 t2=2n时,所有样本对均不可能被鉴定为某种关系,不考虑此类情况。表1
37、 系统效能评价参数计算说明Tab.1Notes on the calculation method of parameters实际关系实际为较近关系实际为较远关系合计认定为较近关系adN3无明确意见beN4认定为较远关系cfN5合计N1N2N注:表中字母表示符合特定条件的案件数量。264法 医 学 杂 志 2023年 6月 第39卷 第3期因此,t1和 t2的组合可能有(2n2+n)种,穷举所有判定阈值组合后,分别计算准确度和系统效能,取所有准确度 组合中,系统效能最大的组合作为最终判定阈值。此时,若有多种组合满足上述条件,则取假阳性率最小的组合。(2)相同条件下 LR 法判定阈值的设置:为更
38、加“公平”地比较两种方法,需要分别计算上述各组中,在准确度相近情况下,应用LR法计算所得系统效能。可知,相同遗传标记组合下,可能得到的 CLR结果远比 CIBS多,故难以通过穷举法得到相同准确度下 LR法的判定阈值和系统效能。分别计算上述 IBS 法阈值在相应模拟中的假阳性率和假阴性率,以较远关系组内,1 减去假阳性率对应的百分位数作为认定阈值;以较近关系组内,假阴性率对应的百分位数作为排除阈值。例如,若假阳性率和假阴性率均为 0.01,则将较远关系组内第 99百分位数作为认定阈值,以较近关系组内第 1百分位数作为排除阈值。若认定阈值小于排除阈值,也即系统效能可以达到 1,则将大于等于排除阈值
39、者认定为关系较近者,以保证较小的假阳性率。同时,参考“2021 版规范”中对似然比方法的规定,在各组中以 10 000 和 0.000 1 作为认定阈值和排除阈值,计算准确度和系统效能。1.2.3 参数评估与分析设定=99.999%、=99.99%、=99.9%、=99%4种准确度标准,按照1.2.2节所述,计算两种方法的假阴性率、假阴性率、准确度和系统效能。应用 R v4.2.2软件绘制不同条件设置下两种方法所得系统效能与遗传标记数目的关系图,并在相同遗传标记组合应用于相同鉴定中时,比较相同准确度标准下的 IBS法和LR 法的系统效能,以对比两种方法在半同胞相关鉴定中的应用价值,为半同胞鉴定
40、相关规范的制订提供理论基础。1.3 进行同胞相关鉴定所需遗传标记数目分析为保证较满意地进行与半同胞相关的鉴定,应用的检测系统需要在保证较好准确度的前提下,尽量保证多的案件可以得出明确鉴定意见,也即在符合特定准确度标准(参考现行标准设置为99.99%)的前提下可以得到足够高的系统效能,本研究将这个“足够高”定义为0.95或0.99。在前述模拟中无法满足上述条件的遗传标记-鉴定目的组合下,以曲线拟合的方式,分析三类同胞相关鉴定所需的3种遗传标记的最低数目。根据系统效能的性质推测可知,各组中,其可能接近的最大值和最小值分别为 1和 0,且应当大致以“S”形曲线形式分布,故以“S”型的戈珀兹模型12(
41、Gompertz model,限定取值范围为0,1,如公式1)对现有数据进行曲线拟合,并应用拟合结果预测应用不同类型遗传标记时,在准确率99.99%的前提下,系统效能达到0.95和0.99所需遗传标记的最小数量。y=e-eax+b(1)式中,x和y分别为应用遗传标记数目和预测系统效能,e为自然常数,a和b为曲线拟合中的两个目标参数。2结果2.1 全同胞关系实际案例与模拟案例的比较结果实际案例及模拟案例CIBS、CFSI分布情况如图1、表2所示,经秩和检验,三种遗传标记数量、两种关系个体对计算所得两种参数的分布,在实际案例与模拟案例之间差异无统计学意义(P0.05),说明模拟数据可以用于后续研究
42、。2.2 全同胞、半同胞和无关个体关系的模拟数据分析结果2.2.1 模拟结果示例以三种遗传标记的最大数量为例,模拟得到三种关系的个体对各100万对后,按照1.2.1节所述方式分别计算CIBS和不同类型CLR,结果分布情况如图2所示:(1)基于三种遗传标记组合,不同关系模拟样本的CIBS均呈单峰分布,其峰值的大小顺序均为全同胞半同胞无关个体;(2)相同指数区分不同关系个体对的能力与该指数在这两种关系个体对中的分布曲线重叠部分大小成反比,不论以 CIBS还是 CLR 进行鉴定,1.2.1 节所述三种鉴定的难度由高到低均依次为半同胞与无关个体全同胞与半同胞全同胞与无关个体;(3)由分布曲线重叠部分大
43、小可知,若考虑最大数量,本研究应用的三种遗传标记组合在各种鉴定中的区分能力由高到低依次为 191个 MH257个 SNP55个STR。265Journal of Forensic Medicine,June 2023,Vol.39,No.32.2.2 基于模拟数据的阈值设定与系统效能分析在 1.2.3节设置的 4种准确度标准下计算三种遗传标记系统鉴定三种关系的系统效能(图3和附表1),鉴定目的、准确度标准、检验参数以及遗传标记种类和数量均会影响检测系统的系统效能:(1)系统效能大致随准确度标准的降低或遗传标记数量的上升而上升。(2)在其他条件均相同的前提下,全同胞鉴定系统效能最高;在另外两种鉴
44、定中,多数情况下,全-半同胞鉴定的系统效能高于半同胞鉴定。(3)若模拟最大数量的三种遗传标记,则在其他条件均相同的前提下,系统效能由大到小依次为 191个 MH、257个SNP、55个 STR;(4)其他条件相同时,多数情况下 LR法所得系统效能不小于 IBS 法,且其他条件相同时,两方法系统效能的差距随鉴定目的亲缘关系变远而增大,即全同胞鉴定中两种方法系统效能差值最小,半同胞鉴定最大,全同胞与半同胞鉴定居中。2.2.3 甄别全同胞与半同胞、半同胞与无关个体所需遗传标记数目分析如以99.99%为IBS法的准确度标准,以CLR10 000和CLR99.99%)FS vs.HS0.555 30.8
45、70 70.988 0HS vs.UR0.251 80.150 90.664 8LR法(固定阈值)FS vs.HS0.526 10.777 00.954 9HS vs.UR0.455 50.429 00.841 9 267Journal of Forensic Medicine,June 2023,Vol.39,No.33讨论复杂亲缘关系鉴定中一个比较重要的问题就是如何评价特定试剂盒在特定鉴定目的中的应用价值13,此处应用价值应包含两层含义:其一,可以保证多数案件可以给出明确鉴定意见,即系统效能足够高;其二,给出鉴定意见的案件中错判概率足够小,也即准确度足够高。在存在“硬排除”情形的亲缘关系鉴
46、定中,排除概率可以比较好地评价该价值,但在其他鉴定目的下,该参数应用的理论基础不复存在,故需要通过家系调查或者计算机模拟的方式进行上述评价14。随着目标亲缘关系的扩展,家系调查研究的难度逐渐增加,因为两个体间亲缘关系越远,想要确证他们之间的关系,需要调查的个体数量越大。例如,如想要确证两个体是否是堂兄弟,需要调查他们的祖父母是否是同一对夫妻;而为了确证他们和祖父母的祖孙关系,他们的父亲也需要被调查,若其中任意一个个体缺失,则无法确证目的个体之间的亲缘关系。而这种调查难度的增加,造成了远亲关系相关的研究中,家系调查的样本量往往过小,无法精确得到评价指标15-16。此时,采用计算机模拟大样本量数据
47、的优势便显现出来,如不受试剂盒组合的限制、不受样本采集困难的限制、不受实验检测成本限制,并且模拟数据量越大,所得结果越准确17-19。本研究共采集了 90对全同胞和 90对无关个体,并模拟了全同胞样本和无关个体样本各 100 万对,通过秩和检验可见,二者以 IBS 法和 LR 法计算所得结果的分布差异无统计学意义,表明本研究应用的计算机模拟工具可以较好地应用于复杂亲缘关系鉴定相关研究中。同时,在相同条件(即19至55个STR遗传标记应用于全同胞鉴定,IBS法准确度标准为 99.99%,LR法分别设置认定和排除阈值为 CLR10 000 和 CLR0.000 1)下,对本研究模拟结果与“2021
48、版规范”中表34数据进行比较,两结果虽有一定差别,但各参数间均相互接近,进一步证明了本研究中模拟方法的可信性。而除模拟方法本身的误差因素外,本研究与该标准应用人群数据的不同,也是产生上述差别的原因之一。由于阈值设置方式不同,应用遗传标记数量较大时,“2021版规范”中 LR法所得结果的准确度远高于相同数量下 IBS法所得准确度,这造成了两方法系统效能比较中的“不公平”。而 1.2.2 节介绍的 LR 法阈值的设置方式,可以使两种方法所得准确度相近,从而在一定程度上降低这种“不公平”的程度。本研究中,模拟的两种关系个体数量相等,因此,若分别以ACC、FP、FN和EFF表示准确度、假阳性率、假阴性
49、率和系统效能,则可推导得:ACC=1-(FP+FN)/(2EFF)。因两方法假阳性率和假阴性率相当,故系统效能较大者准确度也较大。本研究结果也表明,若以此方式设置判定阈值,多数情况下 LR法可得到更高的系统效能,故此时该方法所得准确度仍高于相应的准确度标准。当然,依据模拟结果重新设置阈值的方法本身存在一定误差,因此该方法并不应当被推荐应用于实际鉴定中,本研究中如此设置的原因也仅仅是为了在其他条件相近的前提下比较 LR 法和 IBS 法这两种表4 三种遗传标记应用于半同胞相关鉴定时必要数量的估计Tab.4Estimation of minimum amount of three types of
50、 loci in identification involving half siblings遗传标记STRSTRSNPSNPMHMH鉴定目的FS-HSHS-URFS-HSHS-URFS-HSHS-UR拟合参数a-0.055 2-0.052 2-0.017 3-0.012 4-0.029 3-0.022 4b2.467 92.502 92.876 92.881 62.568 02.591 2R20.986 80.994 50.987 40.988 10.994 60.983 0所需最小数量系统效能0.9599105339471190248系统效能0.99128137434602245321注:
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100