收藏 分销(赏)

乳腺癌相关的lncRNA-mRNA共表达扰动网络构建.pdf

上传人:自信****多点 文档编号:389267 上传时间:2023-09-13 格式:PDF 页数:8 大小:4.77MB
下载 相关 举报
乳腺癌相关的lncRNA-mRNA共表达扰动网络构建.pdf_第1页
第1页 / 共8页
乳腺癌相关的lncRNA-mRNA共表达扰动网络构建.pdf_第2页
第2页 / 共8页
乳腺癌相关的lncRNA-mRNA共表达扰动网络构建.pdf_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷 第 期 年 月北京生物医学工程 基金项目:第 批中国博士后科学基金项目()、南京农业大学大学生创新训练项目()资助作者单位:南京农业大学理学院(南京)通信作者:陈园园。:乳腺癌相关的 共表达扰动网络构建黄彦祚 李海龙 卢乐亭 陈园园摘 要 目的 基于复杂生物网络和机器学习方法,识别乳腺癌相关的边缘生物标志物,构建乳腺癌生存预后模型,从而在系统水平解释乳腺癌的发生发展机制。方法 首先基于 数据库的 数据识别乳腺癌相关的 共表达扰动关系对,进一步构建乳腺癌相关的 共表达扰动网络并对网络中的关键基因进行通路富集分析。然后,基于乳腺癌相关的 关系对,构建乳腺癌预测的分类器模型。最后,通过 回归

2、筛选变量构建多因素 比例风险回归模型对乳腺癌患者进行生存预后分析。结果 构建了乳腺癌相关的 共表达扰动网络,其中的关键基因富集分析得到 条与乳腺癌相关的生物通路。分类预测模型的灵敏度、特异度和准确性分别为 、。回归共筛选出 个和乳腺癌生存预后显著相关的 互作关系对,进而构建的生存预测模型把训练集和测试集的乳腺癌患者分为高风险组和低风险组,两组患者生存预后均存在明显差异。结论 共表达互作网络中的关键基因以及乳腺癌相关的边缘生物标志物大多被证明与乳腺癌相关。同时基于边缘生物标志物的预后模型可以稳健地预测乳腺癌患者的生存预后状态,有利于从网络层面更好地理解乳腺癌的发生发展机制。关键词 共表达扰动网络

3、;边缘生物标志物;乳腺癌预测模型;比例风险回归模型:中图分类号 ;文献标志码 文章编号()本文著录格式黄彦祚,李海龙,卢乐亭,等 乳腺癌相关的 共表达扰动网络构建北京生物医学工程,():,():,:(:)【】,【】;引言近年来,越来越多的研究表明,长链非编码(,)在包括癌症在内的许多疾病的发生发展中发挥着重要作用,已受到越来越多的关注。随着高通量测序技术的发展,大量的 被发现,其作用机制的研究也取得了一定进展。目前已在乳腺癌细胞及组织中发现多种异常表达,它们可能在乳腺癌细胞增殖、凋亡、侵袭、转移及药物敏感性等方面起了重要作用。在癌症发展过程中,参与了多种表观遗传复合物的调节过程,从而抑制或激活

4、癌症相关 基因的表达。因此,探讨 互作对乳腺癌发生发展的影响至关重要。复杂疾病(尤其癌症)的发生并不是单个基因失调导致,往往是由多个分子及其相互作用失调引起的。竞争性内源 机制是探索 如何参与恶性肿瘤调控的重要方法之一。近期研究报道通过高通量测序和加权基因共表达网络法(,)可以进行表达谱基因系统分析。等通过微阵列分析的方法识别了 和 的差异表达模块。等通过全基因组关联分析的方法对 调控网络进行综合分析。但国内尚无关于乳腺癌的 互作关系的研究,而复杂生物网络可以从系统层面解释癌症的发生发展机制。为此本文拟基于 数据,计算个体特异的 共表达扰动值,进一步识别乳腺癌相关的 互作关系,并构建共表达扰动

5、网络。同时,基于 互作关系构建区分乳腺癌样本和正常样本的分类器模型。另外,基于单变量 回归识别与乳腺癌生存预后相关的 关系对,通过 回归筛选变量并进一步构建多因素 回归模型,对乳腺癌患者进行生存预后分析。本研究拟通过基因生物网络和机器学习方法,识别乳腺癌相关的边缘生物标志物并构建乳腺癌生存预后模型,在系统水平上解释乳腺癌的发生发展,为制定合适的治疗计划、协助评价治疗结果、预测患者的生存时间等提供重要依据,进而提高乳腺癌预后诊断以及促进精准医疗的发展。材料与方法 数据来源从 数 据 库(:)下载 个乳腺癌样本和 个癌旁组织样本的 数据,以及乳腺癌患者的临床数据;从 数据库(:)下载 版本的基因注

6、释文件;从数据库(:)下载 个 通路基因集。基因表达数据是经过标准化后的 的 格式,共包含基因 个。数据预处理首先对标准化后的 数据进行预处理,第 期 黄彦祚,等:乳腺癌相关的 共表达扰动网络构建删除大于 样本表达 值 为 的 基 因。根 据 基 因 注 释 文 件 共 得 到 含 有 个 基因和 个 基因的表达数据。构建乳腺癌相关的 共表达扰动网络 识别乳腺癌相关的 共表达扰动网络框架见图。对于每个 关系对,基于正常样本的表达数据计算皮尔逊相关系数(,)。挑选出所有显著线性相关的 与 关系对(且 ),即具有共表达关系的 基因互作对。对于每一个共表达的 基因互作对,运用最小二乘法的简单线性回归

7、模型拟合 和 共表达的直线方程,即:()式中:为拟合直线方程的斜率;为拟合直线方程的截距项。设(,)代表第 个样本 的表达量,则可以计算(,)到直线 的距离:()则所有癌症样本的距离之和 可以用来衡量乳腺癌样本在此 互作关系中的共表达扰动情况。若 越大,则代表乳腺癌样本中 共表达扰动越明显。通过链蒙特卡洛(,)随机抽样方法得到互作扰动距离的经验零分布()。所有 的 共表达关系对组成了乳腺癌相关的 互作关系对,这些互作关系对构成了乳腺癌相关的 共表达扰动网络。在整个乳腺癌相关的 共表达扰动网络中,少量度()很高的基因作为网络枢纽参与重要的生命活动,这些基因被认为是影响乳腺癌活动的关键基因。根据

8、的拓扑网络研究,选取度大于 的 基因进行通路富集分析。通过超几何分布检验,计算 值:(,)()式中:为整个乳腺癌相关的 互作网络中的 基因总数;为互作网络中 的关键基因个数;为某条基因通路中的基因个数;为 互作网络中关键基因落入该通路中基因的个数。最后选取 的通路作为显著富集的通路。图 识别乳腺癌相关的 共表达扰动网络框架图 北京生物医学工程 第 卷 基于 互作关系构建乳腺癌预测模型 个乳腺癌样本和 个癌旁组织样本的 数据为训练集,个乳腺癌样本和 个癌旁组织样本数据为独立测试集。以乳腺癌相关的 互作关系的共表达扰动距离为特征,构建预测乳腺癌的随机森林分类器模型,评价模型的预测性能。然后根据特征

9、贡献对 互作关系对进行降序排列,选择前 较为重要的关系作为潜在 边缘生物标志物。本文在 上进行实验,使用 包“”建立预测模型。根据训练集对随机森林模型进行训练,得到反映其预测效果的混淆矩阵。训练后的随机森林模型对独立测试集进行测试,结合袋外错误率、灵敏度、特异度来衡量预测的准确率。袋外错误率(,)定义如下:被分类错误数总数()模型的灵敏度(,),指真实类别为正类的样本中分类预测也为正的比例,即:()式中:为真实类别为正、分类预测也为正的数目;为真实类别为正、分类预测为负的数目。特异度(,),其定义为真实类别为负类的样本中,分类预测也为负的比例:()式中:为真实类别为负、分类预测也为负的数目;为

10、真实类别为负、分类预测为正的数目。准确性(,),指分类正确的记录个数占总记录个数的比例:()、作为评估随机森林模型的性能指标。生存分析利用癌症患者的临床数据,以患者生存时间和状态为因变量,乳腺癌相关的 互作关系对的共表达扰动距离作为协变量,建立单因素 回归模型,其中的共表达扰动距离 为第 个癌症样本到共表达直线方程的距离。选取其中 的 互作关系对。由于协变量过多,在建立多因素 回归模型时可能导致计算复杂以及过拟合的问题,因此选择最小绝对收缩选择算子(,)方 法,利 用 语 言“”、“”、“”、“”软件包对 互 作 关 系 对 进 一 步 筛 选。运 用 方法压缩回归系数,并选取一个交叉检验均方

11、误差最小的 值,从而得到一个最优的 回归模型。其中大部分基因对的系数被缩减到,剩下相对较少非零系数的基因对则被认为是和乳腺癌预后高度相关的 互作关系对。在训练集上构建多因素 回归风险评分方程:()式中:为第 个 互作关系对回归系数;为第 个乳腺癌预后高度相关的 互作关系对;为乳腺癌预后高度相关的 互作关系对的个数。根据公式计算每个患者的风险评分,并以风险评分中位数为截断值,将乳腺癌患者分为低风险组和高风险组,进一步画出 生存曲线。最后用同样的方法对测试集进行生存验证。结果 乳腺癌相关的 共表达扰动互作关系 共表达扰动(转换)分布情况见图,其中 为 的分位点。大于该阈值的互作关系对构成乳腺癌相关

12、的 互作网络。图 乳腺癌样本的 共表达扰动分布 第 期 黄彦祚,等:乳腺癌相关的 共表达扰动网络构建乳腺癌相关的 共表达互作网络中共包含 个 互作关系对,个 和 个,共 个基因。利用 软件将乳腺癌相关的 共表达互作网络可视化,如图 所示。紫色节点表示,蓝色节点表示 图 乳腺癌相关的 共表达互作网络 网络图中共有关键基因 个,包括 个 和 个。其中,一些基因已被证明为与乳腺癌相关,例如,与癌细胞的增殖活性降低 有 关,大 量 存 在 于 衰 老 细 胞 中。下 调 可以抑制乳腺癌细胞的致瘤性和发育。过表达可通过阻滞细胞周期、诱导细胞凋亡等途径抑制乳腺癌细胞增殖。胞外 突变降低了细胞的活动性和理论

13、上的转移能力。上调 可以抑制 的进展,促进 细胞的化疗敏感性和凋亡。在 或蛋白水平上的高表达与乳腺癌患者预后不良相关。过表达 可促进细胞生长,抑制细胞凋亡。富集通路通过基因富集分析得到 条与乳腺癌相关的生物通路,主要包括一些免疫相关的通路:细胞受体信号通路,它被发现是 治疗乳腺癌的潜在信号通路;细胞受体信号通路在三阴性乳腺癌的发展中失调;造血细胞谱系通路,研究发现造血细胞谱系,细胞黏附分子和原发性免疫缺陷明显增加了 型乳腺癌的 通路;样受体信号通路通过缺氧诱导因子增强乳腺癌细胞的恶性特征;自然杀伤细胞的细胞毒信号通路。同时,一些重要的信号转导和信号分子互作通路也被富集:信号通路不仅在乳腺癌发生

14、发展中显著失调,而且在新型抗乳腺癌靶向疗法中发挥重要作用;信号通路中 促进 信号传导并赋予乳腺癌非雌激素依赖性生长;信号通路中 通过激活 信号传导促进乳腺癌干细胞功能;信号通路可能是乳腺癌进展的重要途径,与 相关的基因、和 可能会作为治疗 的候选治疗基因靶标;信号通路,抑制 通路和 信号通路可以抑制乳腺癌细胞迁移;信号通路,通过抑制 信号通路部分抑制乳腺癌的发生。另外,癌症通路,这个与乳腺癌相关的重要通路也被富集。富集的结果如图 所示。分类器模型预测结果模型对测试集的预测精度见表。为,和 分别为 和 ,为 。在训练集和测试集的随机森林模型性能分别为:特异度 和 ;灵敏度 和 ;准确性 和 。表

15、 随机森林模型在测试集上的性能 真实值预测值癌症样本正常样本分类误差癌症样本 正常样本 袋外错误率 基于 互作关系构建了乳腺癌预测模型,识别出 边缘生物标志物。其中有的基因已被证明为与乳腺癌相关:和 共表达老年乳腺癌患者中具有预后意义;表达与肿瘤分化程度有关,随着肿瘤的失分化,的表达能力逐渐增强;基因通过表观沉默或下调改变 激活 抑制比率的平衡,从而促进癌症的发展;基因在乳腺癌中高表达,可以有效预测乳腺癌转移的发生,为乳腺癌的靶向治疗提供依据;通过调节 可以促进乳腺癌细胞的增殖和迁移,因此它可能是乳腺癌的重要调控因子。北京生物医学工程 第 卷图 基因通路富集结果 乳腺癌预后相关的 共表达互作关

16、系对 最终识别出 个乳腺癌生存预后显著相关的 互作关系对,并基于这些互作关系对构建多因素 回归模型:(,)(,)(,)(,)(,)()基于训练集和测试集的两组乳腺癌患者的 生存曲线见图,容易发现不管是训练集还是测试集的两组乳腺癌患者的预后都存在显著差异,且高风险组的生存预后显著劣于低风险组。这个结果表明基于基因对的预后模型可以很好地预测乳腺癌患者的生存时间。讨论与结论目前癌症病理研究一般仅限于群体的基因表达量和突变信息,而乳腺癌个性化医疗处于发展相对缓慢的阶段。但是乳腺癌的发生并不是单个基因导致的,而是由多个分子及其相互作用失调引起的。基因并不是独立存在的,而是存在于许多复杂的分子网络中。因此

17、,构建乳腺癌相关网络从系统层面解释乳腺癌的发生发展机制。但由于条件所限,缺乏相应的临床试验来验证本文结果。在本研究中,基于正常样本基因表达数据,通过癌症样本点偏离拟合直线距离计算每个样本的 共表达扰动情况,识别乳腺癌相关的 互作关系对,并构建乳腺癌相关的 共表达扰动网络。同时对网络中的关键基因进行基因通路富集分析,结果显示这些基因与癌症通路、细胞凋亡通路以及 信号通路等密切相关。通过 比例风险模型识别出与乳腺癌预后相关的 互作关系对,并建立生存风险预测模型,结果表明本研究中基因对的预后模型可以很好地预测乳腺癌患者的生存时间。基于识别出的 边缘生物标志物,发现边缘生物标志物中含有乳腺癌相关的诸多

18、第 期 黄彦祚,等:乳腺癌相关的 共表达扰动网络构建图 基于训练集和测试集的两组乳腺癌患者的 生存曲线 重要基因。已被证实的有:基因 可抑制内分泌治疗后雌激素受体阳性乳腺癌患者的肿瘤起始细胞的数量;通过消除基因 的转录,癌细胞可以在蛋白毒性应激后迅速诱导热休克反应并存活;基因通过抑制 转录来促进泛素介导的 降解,从而促进乳腺癌的细胞增殖并抑制凋亡。值得注意的是,网络中很多关键基因与乳腺癌相关:乳腺癌患者 基因与 显著相关,是一种可靠的乳腺癌预后指标;可作为乳腺癌肿瘤发生、转移和侵袭预测的生物标志物;可以抑制乳腺癌细胞的迁移、侵袭和转移。结果中 和 的共表达很高,是乳腺癌进展的重要调控因子,可以

19、作为乳腺癌预后的指标及潜在的治疗靶点。抑制基因 的表达可抑制乳腺癌细胞的增殖和迁移。、等度较高的基因在乳腺癌中高表达,且与乳腺癌的不良预后密切相关,可以作为基因检测的理论依据。故通过研究可以较准确地找出乳腺癌的决定基因和预测乳腺癌患者的生存时间,对于其他复杂疾病的病因研究以及个性化医疗具有重要的参考价值。基于共表达扰动的乳腺癌相关的 互作网络的构建能够从系统层面更好地理解乳腺癌的发生和发展机制,对提高乳腺癌预后诊断以及促进精准医疗的发展等都有重要的意义。参考文献 ,():,():,():芮小慧长链非编码 在宫颈癌发生中的作用及其机制研究苏州:苏州大学,:,尹冶,丁明霞,陈振杰,等基于 和 数据库构建前列腺癌 网络并筛选相关 临床肿瘤学杂志,():,():,:,:,:,北京生物医学工程 第 卷 ,():,():,():,():,():,():,(),():,():,:,():,():,():,():,():,:,:,():,():,():,():,(),():,():,():郭辉,张斌,胡利民 微小 靶向调控 表达及其对乳腺癌细胞增殖和凋亡的影响 临床肿瘤学杂志,():,():李莉,孟少达,邱爽,等 乳腺癌根治术后皮瓣下积液感染病原学特点及相关因素分析 中华医院感染学杂志,():,():,():,():,():(收稿,修回)第 期 黄彦祚,等:乳腺癌相关的 共表达扰动网络构建

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服