收藏 分销(赏)

基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用.pdf

上传人:自信****多点 文档编号:578405 上传时间:2024-01-02 格式:PDF 页数:5 大小:1.41MB
下载 相关 举报
基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用.pdf_第1页
第1页 / 共5页
基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用.pdf_第2页
第2页 / 共5页
基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 43 卷 第 6 期2023 年 06 月Vol.43 NO.6JUN.2023赣南医学院学报JOURNAL OF GANNAN MEDICAL UNIVERSITY投稿网址:http:/基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用黄晋1,邹怡婷2,王建忠3(1.赣南医学院第一临床医学院,江西赣州341000;2.江西工业工程职业技术学院,江西萍乡337000;3.赣南医学院第一附属医院普通外科,江西赣州341000)摘 要:目的:通过构建人工神经网络联合表观基因组学对肝癌组织及正常组织进行分类,为肝癌的诊断提供研究方向。方法:从TCGA数据库下载包含379例肝癌样本及50例正常

2、肝组织样本的DNA甲基化数据集,筛选出差异高甲基化的、位于启动子区的、与对应基因呈负相关的CpG位点并使用Logistic回归分析筛选出与肝癌有关的4个CpG位点,将筛选出的位点使用人工神经网络技术对肝癌组织样本及正常肝组织样本进行分类。计算人工神经网络模型对样本判别的准确性、敏感度、特异度。结果:人工神经网络模型对样本判别的准确性为94.7%、敏感度为96.8%、特异度为92.7%。结论:人工神经网络模型可以很好地区分肝癌组织与正常组织,对肝癌诊断具有较高的价值。关键词:肝细胞癌;人工神经网络;分类中图分类号:R735.7;R446 文献标志码:A 文章编号:1001-5779(2023)0

3、6-0565-05 DOI:10.3969/j.issn.1001-5779.2023.06.003Application of artificial neural network and epigenomics in the diagnosis of hepatocellular carcinomaHUANG Jin1,ZOU Yi-ting2,WANG Jian-zhong3(1.The First Clinical Medical School of Gannan Medical University,Ganzhou,Jiangxi 341000;2.Jiangxi Vocational

4、 College of Industry&Engineering,Pingxiang,Jiangxi 337000;3.Department of General Surgery,The First Affiliated Hospital of Gannan Medical University,Ganzhou,Jiangxi 341000)Abstract :Objective :To use the construction of artificial neural networks combined with epigenomics to classify liver cancer ti

5、ssues and normal tissues to provide research directions for the diagnosis of liver cancer.Methods :The DNA methylation data of 379 HCC samples and 50 samples of regular liver tissues from the cancer genome atlas(TCGA)database was downloaded.The CpG sites that were located within the promoter region,

6、with high differences in methylation and negatively correlated with their corresponding genes were selected.Logistic regression analysis was used to filter out the 4 CpG sites related to hepatocellular carcinoma.The hepatocellular carcinoma samples and regular liver samples were classified with arti

7、ficial neural network.The accuracy,sensitivity,and specificity of artificial neural network models for sample discrimination were calculated.Results :The artificial neuron network models prediction accuracy was 94.7%,the sensitivity was 96.8%and the specificity was 92.7%.Conclusion :The artificial n

8、eural network models could classify hepatocellular carcinoma tissue and normal tissue.It is valuable to the diagnosis of hepatocellular carcinoma.Key words :Hepatocellular carcinoma;Artificial neural network;Classification肝细胞癌(Hepatocellular carcinoma,HCC)是世界上最常见、最致命的侵袭性肿瘤之一,其发病率在所有癌症中排名第4,是癌症中导致死亡的

9、第2大原因1,肝细胞癌的年发病率是2.62。在中国,每年肝癌新发病例约占全世界肝癌新发病例的50%3。目前,HCC的发病率呈持续上升趋势,预计到2025年新发肝癌病例将超过100万例3-4。血源性乙型肝炎(Hepatitis B virus,HBV)、丙型肝炎(Hepatitis C virus,HCV)病毒的慢性感染是导致HCC发生的主要原因5。由于大部分 HCC患者早作者简介:黄晋,男,2020级硕士研究生,研究方向:外科学。E-mail:通信作者:王建忠,男,教授,博士在读,硕士生导师,研究方向:普通外科。E-mail: 5652023 年赣 南 医 学 院 学 报投稿网址:http:/

10、期并无特异性临床表现,确诊时已到达晚期而得不到早期治疗,导致 HCC的死亡率上升6,尽管对于HCC诊断和治疗有所进步,但HCC的总体预后仍然很差,估计5年生存率仅为127。及早识别早期HCC患者并进行早期干预可获得良好的治疗效果,如对早期 HCC 患者进行射频消融(Radiofrequency ablation,RFA)可获得高达 68的 5年生存率8,因此,开发用于识别诊断HCC的分子标志物尤为重要。在许多国家,血清甲胎蛋白(Alpha-fetoprotein,AFP)对HCC的监测广泛用于临床中9,血清中AFP水平为500 ng mL-1被认为具有诊断意义,AFP在早期HCC的筛查、诊断及

11、治疗反应评估中具有重要意义。随着生物技术的发展,越来越多的生物标志物得以发现,其中甲胎蛋白 L3(Alpha-fetoprotein L3,AFP-L3)和Des-脱羧凝血酶原(Des-carboxyprothrombin,DCP)在临床中可作为AFP的补充,两者对小HCC的诊断筛查都优于AFP 10。近些年,已有许多血清HCC生物标志物用于临床研究中,如Glypican-3、Golgi蛋白 73(GP73)和骨桥蛋白11,但这些标志物都因缺乏一定的敏感性与特异性而受到限制。DNA甲基化的改变是人类癌症中最一致的表观遗传改变之一,肿瘤抑制基因启动子区的超甲基化可导致表观遗传沉默而促进癌症的发生

12、发展12,ESTELLER M等13总结了基因甲基化与各种癌症的关系,在肠道肿瘤中可观察到APC和hMLH1的甲基化,在头、颈和肺肿瘤中以DAPK、MGMT甲基化为特征,而BRCA1、GSTP1在乳腺癌、前列腺癌中出现甲基化。且研究发现表观遗传学的改变特别是DNA 的甲基化在 HCC 的发生和发展中起关键作用14,COX-2、p16、RassF1A和TIMP-3的甲基化与肝癌的发生高度相关15,并且这些表观遗传学变化发生在肝癌的早期16。随着新一代测序技术的发展,甲基化阵列芯片已用于癌症CpG位点的甲基化分析,并基于此开发的模型可用于对癌症诊断、预后及治疗结果的评估。7个CpG位点的预后模型已

13、在口腔鳞状细胞癌(Oral squamous cell carcinoma,OSCC)中得到应用17,一种8个CpG甲基化位点的模型可用于术前区分大肠癌的早期和晚期18,CpG位点与RNA转录本结合的模型可用于对早期与晚期肝癌进行分类19。异常的甲基化可发生在肝癌癌变的早期,因此对癌症早期检测并及时干预对肝癌患者预后至关重要。人工神经网络(Artificialneuralnet work,ANN)指的是一种结构类似于“神经元”的算法20,由输入层、隐藏层和输出层构成。其通过模拟人脑及生物的神经系统对信息进行学习,从而使机器获得强大的处理复杂数据尤其是非线性数据的能力21。目前神经网络已广泛用于

14、商业、数据挖掘、药物发现和生物学等领域,在医学领域中,神经网络也已成功应用于疾病检测22。本研究使用TCGA数据库的甲基化芯片阵列数据集,确定肝癌组织与正常组织的差异高甲基化位点,筛选出与对应基因呈负相关的CpG位点并构建Logistic回归模型确定用于诊断肝癌的CpG位点。最后,使用GEO数据库的甲基化数据信息验证模型分类的准确性。1 数据与方法 1.1数据准备 从癌症基因图谱(TCGA)数据门户网站(https:/gdc-portal.nci.nih.gov/)下载377例HCC患者基于Illumina HumanMethylation450 BeadChip的3级DNA甲基化阵列信息、基

15、因表达数据及相应临床数据信息,将其作为训练集,从GEO下载了包含66对癌和癌旁组织的系列号为GSE54503的DNA甲基化阵列信息(Illumina HumanMethylation450 Beadchip检测)及相应的临床数据信息,作为验证集。CpG位点信息的注释使用 GEOGPL13534 的 Illumina 官方注释文件。1.2数据预处理 R语言(version 4.0.3)导入各数据集的甲基化阵列数据、基因表达数据、临床数据信息,使用impute包对甲基化数据的缺失值进行补充,Champ包对甲基化数据进行过滤(过滤掉位于X和Y染色体上的所有探针),低质量的探针将会被删除。为了保证数据

16、的完整性,不对数据进行归一化处理。使用limma包对基因表达数据log2对数转换。1.3筛选用于诊断的差异甲基化 CpG 位点 在TCGA的HCC数据集中将377例患者的379份癌组织样本和50份癌旁组织样本用于探索差异甲基化位点。肿瘤样本与正常样本甲基化水平差异计算为tumor-normal,studentt检验比较两组差异水平,差值的绝对值0.4(|tumor-normal|)且P0.001的差异甲基化位点(DEP)被认为是有意义的,由于基因的高甲基化被认为与不适当的转录沉默有关23,因此,将0.4且P0.05的差异高甲基化位点用于下一步研究。进一步探索得到的差异高甲基化位点,将其与注释文

17、件比对,筛选出位于启动子区(TSS200、TSS1500)的CpG位点,最后合并基因表达数据,将Pearson相关系数0.2且P0.05的位点筛选出来并构建 Logistic 回归模型,进行下一步分析。5666 期黄晋,等 基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用投稿网址:http:/2 结果 2.1候选的CpG位点 在HCC甲基化数据集中,基于筛选标准(|差值|0.4,P0.001)共筛选得到1 697个差异甲基化位点,其中有166个差异高甲基化 CpG 位点和 1 531 个差异低甲基化 CpG 位点(图1),接着在差异高甲基化CpG位点中将位于启动子区的位点筛选出来,共得到

18、37个位点(图2)。合并基因表达矩阵信息,计算这37个CpG位点与对应的基因表达值的Person相关系数(若一个CpG位点对应多个基因,则第一个将作为参考),Person相关系数0.2,P0.05的位点(即高甲基化且对应基因低表达的位点)认为是显著相关的,一共有13个位于启动子区的显著相关的位点,合并13个CpG位点的甲基化矩阵与患者的疾病状态信息,构建Logistic 回归模型,采用逐步回归的方法,将 P0.05的位点筛选出来,一共得到4个CpG位点作为诊断肝癌的特异性位点(表1)。2.2构建人工神经网络模型 使用 Matlab 2020a构建人工神经网络模型,将Logistic回归筛选得到

19、的4 个 CpG 位点用于训练集中构建人工神经网络模型,本研究将设置一个3层的人工神经网络(图3),输入层设定4个神经元,隐藏层设定5个神经元,输出层设定2个神经元,采用反向传播算法,隐藏层的激活函数为Sigmoid函数,输出函数为softmax函数,迭代100次后,误差为0.007 0,学习速率为0.01,梯度下降收敛于410-8,表明模型拟合较好。接着将构建好的人工神经网络模型作用于验证数据集(66份肝癌组织样本,66份正常组织样本)中,模型对验证集分类的准确性达到94.7%,从模型对数据的分类结果来看,有2份肝癌组织被错分到正常组织中,有5份正常组织被错分到肝癌组织中,模型的敏感度为96

20、.8%,特异度为92.7%(表2)。图1肝癌组织与癌旁组织差异甲基化火山图图2差异高甲基化位点基因组分布情况表1Logistic回归筛选CpG位点基因位点cg13879483cg23462514cg26010734cg18004756基因符号USP44RNF212EPHX3GRHL2危险比1 274.434 052.5712 267.609 126.97变异系数7.158.319.419.1295%CI2.8613.344.2213.443.9717.473.1417.91P6.4710-33.3710-45.6310-31.2910-2表2人工神经网络模型对验证集判别结果/n预测类别肿瘤组织

21、正常组织总计实际类别肿瘤组织64266正常组织56166总计6963132图3人工神经网络模型的建立 5672023 年赣 南 医 学 院 学 报投稿网址:http:/3 讨论 HCC是最常见的原发性恶性肿瘤之一,临床上HCC晚期的患者治疗效果较差。临床中最关键的是对HCC患者的识别,并予以积极的治疗措施,因此对 HCC 患者的早期识别并予以干预至关重要。DNA甲基化是一种被广泛研究的表观遗传修饰方式,在肿瘤发生发展过程中发挥重要作用。人工神经网络通过模拟大脑神经网络从外界环境学习并通过内部神经元储存获取的知识,达到对复杂数据进行处理,具有很强的识别与分类能力,在医学领域中主要用于对疾病的诊断

22、及预后的预测23。人工神经网络可以很好地用于临床决策。本研究基于TCGA数据库的HCC患者DNA甲基化阵列数据集筛选得到 13 个 CpG 位 点(cg13879483、cg14231297、cg25537993、cg23462514、cg22557662、cg26010734、cg01268824、cg18004756、cg09626894、cg14159026、cg13545212、cg13564825、cg24368848),将这 13 个CpG位点矩阵合并患者的疾病状态信息构建Logistic回归模型,共筛选得到 4个 CpG位点(cg13879483、cg23462514、cg260

23、10734、cg18004756)作为候选标志物。将4个CpG位点构建人工神经网络模型,并对验证集数据进行预测。本研究构建的人工神经网络模型对肝癌预测的准确性为94.7%,敏感度为96.8%,特异性为92.7%,表明模型具有较高的分类效果。总之,本研究通过对甲基化数据的分析,基于4个CpG位点,通过人工神经网络算法对肝癌组织及正常组织进行分类。模型表现出很高的分类准确性。本研究也存在一定的局限性,即筛选生物标志物的方法基于统计方法而不是生物实验,也未使用生物标本对候选的标志物进行外部验证。在之后的研究中我们希望将这些标志物应用于临床中,进一步探索这些标志物的诊断潜力。参考文献:1 FERLAY

24、 J,SOERJOMATARAM I,DIKSHIT R,et al.Cancer incidence and mortality worldwide:sources,methods and major patterns in GLOBOCAN 2012 J.Int J Cancer,2015,136(5):E359-386.2 GTHLE M,DOLLINGER M M.Epidemiologie und risikofaktoren des hepatozellulren karzinoms J.Radiologe,2014,54(7):654-659.3 TORRE L A,BRAY F

25、,SIEGEL R L,et al.Global cancer statistics,2012 J.CA Cancer J Clin,2015,65(2):87-108.4 MAK L Y,CRUZ-RAM N V,CHINCHILLA-L PEZ P,et al.Global epidemiology,prevention,and management of hepatocellular carcinomaJ.Am Soc Oncol Educ Book,2018,38:262-279.5 BARAZANI Y,HIATT J R,TONG M J,et al.Chronic viral h

26、epatitis and hepatocellular carcinoma J.World J Surg,2007,31(6):1243-1248.6 EL-SERAG H B.Epidemiology of viral hepatitis and hepatocellular carcinomaJ.Gastroenterology,2012,142(6):1264-1273.7 KHALAF N,YING J,MITTAL S,et al.Natural history of untreated hepatocellular carcinoma in a US cohort and the

27、role of cancer surveillanceJ.Clin Gastroenterol Hepatol,2017,15(2):273-281.8 KULIK L,EL-SERAG H B.Epidemiology and management of hepatocellular carcinomaJ.Gastroenterology,2019,156(2):477-491.9 CHANG T S,WU Y C,TUNG S Y,et al.Alpha-fetoprotein measurement benefits hepatocellular carcinoma surveillan

28、ce in patients with cirrhosis J.Am J Gastroenterol,2015,110(6):836-844.10 SONG P P,XIA J F,INAGAKI Y,et al.Controversies regarding and perspectives on clinical utility of biomarkers in hepatocellular carcinomaJ.World J Gastroenterol,2016,22(1):262-274.11 LI D,SATOMURA S.Biomarkers for hepatocellular

29、 carcinoma(HCC):an update J.Adv Exp Med Biol,2015,867:179-193.12 BAYLIN S B,HERMAN J G.DNA hypermethylation in tumorigenesis:epigenetics joins geneticsJ.Trends Genet,2000,16(4):168-174.13 ESTELLER M,CORN P G,BAYLIN S B,et al.A gene hypermethylation profile of human cancer J.Cancer Res,2001,61(8):322

30、5-3229.14 SAITO Y,HIBINO S,SAITO H.Alterations of epigenetics and microRNA in hepatocellular carcinomaJ.Hepatol Res,2014,44(1):31-42.15 LEE S,LEE H J,KIM J H,et al.Aberrant CpG island hypermethylation along multistep hepatocarcinogenesisJ.Am J Pathol,2003,163(4):1371-1378.16 SCEUSI E L,LOOSE D S,WRA

31、Y C J.Clinical implications of DNA methylation in hepatocellular carcinomaJ.HPB,2011,13(6):369-376.17 SHEN S,WANG G,SHI Q,et al.Seven-CpG-based prognostic signature coupled with gene expression predicts survival of oral squamous cell carcinoma J.Clin Epigenetics,2017,9:88.18 HU J,ZHAO F Y,HUANG B,et

32、 al.An eight-CpG-based methylation classifier for preoperative discriminating early and advanced-late stage of colorectal cancer 5686 期黄晋,等 基于人工神经网络技术联合表观基因组学在肝癌诊断中的应用投稿网址:http:/J.Front Genet,2020,11:614160.19 KAUR H,BHALLA S,RAGHAVA G P S.Classification of early and late stage liver hepatocellular

33、carcinoma patients from their genomics and epigenomics profilesJ.PLoS One,2019,14(9):e0221476.20 AUGER S D,JACOBS B M,DOBSON R,et al.Big data,machine learning and artificial intelligence:a neurologists guide J.Pract Neurol,2020,21(1):4-11.21 GARDNER G G,KEATING D,WILLIAMSON T H,et al.Automatic detec

34、tion of diabetic retinopathy using an artificial neural network:a screening tool J.Br J Ophthalmol,1996,80(11):940-944.22 CHEN H,ZHOU X,TANG X,et al.Prediction of lymph node metastasis in superficial esophageal cancer using a pattern recognition neural networkJ.Cancer Manag Res,2020,12:12249-12258.2

35、3 LIU M,JIANG L,GUAN X Y.The genetic and epigenetic alterations in human hepatocellular carcinoma:a recent update J.Protein Cell,2014,5(9):673-691.(收稿:2022-09-09)(修回:2023-04-08)(责任编辑:眭荣燕)21 HE J,ZUO Q Z,HU B,et al.A novel,liver-specific long noncoding RNA LINC01093 suppresses HCC progression by inte

36、raction with IGF2BP1 to facilitate decay of GLI1 mRNA J.Cancer Lett,2019,450:98-109.22 ZHANG S H,XU J Q,CAO H,et al.KB-68A7.1 inhibits hepatocellular carcinoma development through binding to NSD1 and suppressing Wnt/-catenin signalling J.Front Oncol,2022,11:808291.23 YANG Y,GE H,LI D Q,et al.E2F1-in

37、duced LncRNA BAIAP2-AS1 overexpression contributes to the malignant progression of hepatocellular carcinoma via miR-361-3p/SOX4 axis J.Dis Markers,2021,2021:6256369.24 WANG S,XU M F,SUN Z G,et al.LINC01018 confers a novel tumor suppressor role in hepatocellular carcinoma through sponging microRNA-18

38、2-5p J.Am J PhysiolGastrointest Liver Physiol,2019,317(2):G116-G126.25 WEI Y P,WANG Z,ZONG Y,et al.LncRNA MFI2-AS1 promotes HCC progression and metastasis by acting as a competing endogenous RNA of miR-134 to upregulate FOXM1 expressionJ.Biomed Pharmacother,2020,125:109890.26 PENG Y Z,WU G J,QIU X,e

39、t al.Construction and validation of a necroptosis-related LncRNAs prognosis signature of hepatocellular carcinoma J.Front Genet,2022,13:916024.27 WANG W J,YE Y Q,ZHANG X D,et al.Construction of a necroptosis-associated long non-coding RNA signature to predict prognosis and immune response in hepatoc

40、ellular carcinoma J.Front Mol Biosci,2022,9:937979.28 SALERNO F,GUISLAIN A,FREEN-VAN HEEREN J J,et al.Critical role of post-transcriptional regulation for IFN-in tumor-infiltrating T cells J.Oncoimmunology,2018,8(2):e1532762.29 VAN DER LEUN A M,THOMMEN D S,SCHUMACHER T N.CD8+T cell states in human c

41、ancer:insights from single-cell analysis J.Nat Rev Cancer,2020,20(4):218-232.30 RIZVI S,WANG J,EL-KHOUEIRY A B.Liver cancer immunity J.Hepatology,2021,73 Suppl 1(Suppl 1):86-103.31 ZHAO H K,WU L,YAN G F,et al.Inflammation and tumor progression:signaling pathways and targeted interventionJ.Signal Transduct Target Ther,2021,6(1):263.32 LIU X,LU F,CHEN X H.Examination of the role of necroptotic damage-associated molecular patterns in tissue fibrosis J.Front Immunol,2022,13:886374.(收稿:2022-11-30)(修回:2023-03-06)(责任编辑:眭荣燕)(上接第552页)569

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服