1、 年第卷第期医学理论与实践基于生物信息学分析挖掘与糖尿病和结核病免疫浸润相关的生物标志物高 岩 彭英杰 吴尚英 王媛媛 山东省潍坊市妇幼保健院 潍坊市人民医院 北京大学深圳医院摘要 目目的的:基于生物信息学分析挖掘糖尿病和结核病中与免疫浸润相关的基因从中筛选出具有共同诊断价值的潜在生物标志物 方方法法:从 数据库收集糖尿病和结核病数据信息分别筛选糖尿病和结核病的关键基因集通过 和 进行富集分析和免疫细胞浸润差异分析最后通过公共数据库验证关键基因并筛选靶向 结结果果:筛选出 个在糖尿病和结核病发挥重要作用差异基因免疫细胞浸润分析发现糖尿病中性粒细胞增多结核病中浆细胞和 细胞显著增加筛选出 稳定高
2、表达 结结论论:糖尿病和结核病中 表达异常可能为糖尿病和结核病患者提供潜在的诊断生物标志物以及治疗靶点 基金项目:国家自然科学基金资助项目()山东省医药卫生科技发展计划项目()通信作者:王媛媛关键词 糖尿病 结核病 免疫细胞 生物标志物中图分类号:.文献标识码:/.:.:.:.:.糖尿病()是一种由胰岛素分泌缺陷或其生物作用受损或两者兼有引起的以高血糖为主要特点的慢性代谢紊乱性疾病 年全球约有 亿多成年人(岁)患有糖尿病预计这一数字还会持续增加 结核病()是由于结核分枝杆菌感染()引起的慢性传染病可在多个器官中发病其中肺结核的发病率在 以上 年世界卫生组织报告显示:年新增结核病感染人数 万并且
3、耐药结核病同比增长 死亡人数达到 万严重危害中国公共卫生安全问题 而中国恰好是 和 的双重高负担的大国如何防治成为一个亟待解决的问题虽然大量研究表明 和 有许多共同危险因素例如免疫功能低下或损伤 使得在 患者中 患病率增加反之亦然 但 和 之间具体的影响因素和潜在的分子机制未知对其治疗缺乏具体的建议 因此本研究结合生物信息学方法筛选了 和 之间与免疫系统相关的共表达基因并预测了其 基因和靶向的 并通过在线数据库进行验证 希望本研究可以通过进一步了解 和 共同分子机制来寻找可能的分子标志物材料与方法.数据的收集和纳入标准通过在 数据库(:/./)中以“”“”“”和“”为 关 键 词 进 行 检
4、索 获 得 和 数据集其中包括了 例糖尿病样本、例健康样本、例结核病样本和 例健康对照样本 当前研究中包括的数据集是从公共数据库下载的因此不需要伦理委员会的额外批准并且数据收集和使用是根据 网站发布指南和数据访问政策进行的医学理论与实践 年第卷第期 .差异基因筛选采用 软件.中的 软件包以调整后 .作为筛选标准得到 与正常对照的差异表达基因().加权基因共表达网络分析()使用 的 软件包在基因表达谱基础上计算软阈值功率 并提出共表达相似性以计算邻接关系然后将邻接关系转换为拓扑重叠矩阵()来测量基因的网络连通性 采用平均连锁层次聚类法把相似模式的基因聚类到相同模块(最小 )用簇树的分支和不同颜色
5、表示构建模块关系计算基因模块与表型之间的关系鉴定与临床性状相关的模块 最后 计 算 基 因 显 著 性()和 模 块 成 员()以将模块与临床特征相关联(.)获得关键基因集.、分析采用 软件.的 包对差异基因进行 和 富集分析并用气泡图展示显著富集通路.免疫细胞浸润评估首先从 网站下 载 的 脚 本(:/./)基于 算法计算各样本 种免疫细胞比例使用 工具绘制疾病组与正常对照在免疫细胞浸润方面差异 计算关键基因与浸润免疫细胞之间的 相关系数.蛋白蛋白相互作用()网络构建与模块选择使用在线检索相互作用基因的搜索工具(:/./)构 建 中 的 网络分析蛋白质之间的功能相互作用可以为疾病的发生和发展
6、机制提供新的思路 使用 软件对 网络进行可视化利用 插件筛选 网络中前十的 基因.靶向 基因的 预测使用 和 等在线软件预测靶向 基因的并使用 绘制韦恩图结果.对糖尿病关键基因识别和分析为了对糖尿病关键基因进行识别和分析采用 将 表达数据进行聚类分析选择阈值 为(.)平均连通性为(.)使各基因调控关系符合无尺度分布(见图、)为了进一步分析模块通过构建共表达计算模块特征基因的不相似性来绘制模块聚类树状图在合并了距离.)最后对 的模块基因进行 和 分析(见图)分析发现大部分基因定位在胞质内参与免疫反应细胞的激活和中性粒细胞的激活 分析发现主要富集在代谢途径和内吞作用.结核数据库中差异基因筛选和分析
7、经过筛选从 数 据 集 中 共 筛 选 出 个其中上调的基因为 个下调的基因为 个(见图)绘制差异基因聚类热图(见图)对 个 进行 和 富集分析(见图、)分析发现主要富集于蛋白质结构域特异性结合、结构域结合和肿瘤坏死因子受体结合 富集分析发现主要富集于坏死性凋亡通路、胰岛素信号通路和炎症介质对色氨酸通道调控.筛选共同关键基因通过 的 软件包对 和 差异基因集取交集发现 个关键基因(见图)通过 和 进行富集分析(见图、)分析发现主要富集于线粒体部分 分析发现主要富集于溶酶体通路和氨基酸代谢 将 个基因导入 数据库中构建蛋白质蛋白质互作网络(见图)在 中使用插件 基于“”算法筛选 基因、和 等评分
8、前十的 基因其中、和 为上调基因其余 个为下调基因(见图).免疫细胞浸润及免疫细胞相关性分析利用 反卷积算法评估了糖尿病和结核病中 种免疫细胞的免疫浸润情况结果发现糖尿病组中性粒细胞显著高于对照组结核病组浆细胞和 细胞显著高于对照组(见图、)然后计算 个关键基因与浸润相关性分析发现 个关键基因与中性粒细胞和 细胞呈正相关(见图).关键基因验证和潜在 的预测为进一步验证、和 等 个关键基因 在 糖 尿 病 和 结 核 病 中 的 表 达 情 况 筛 选、和 作为测试数据集对其表达进行验证(见图)结果发现只有 在结核病和糖尿病中稳定高表达且和免疫细胞浸润显著相关(见图)通过 和 在线数据库筛选 个
9、与 基因相关的潜在(见图)并通过 将其可视化(见图)最后通过 数据集对 表达进行验证结果发现只有 与正常组相比低表达(见图)讨论虽然大量研究发现糖尿病引起的代谢改变和免疫功能低下与肺结核感染易感性增加之间有非常紧密的联系但具体作用机制尤其是分子和免疫学机制不清 基于此本研究采取生物信息学方法发现了糖尿病和结核病免疫过程相关的关键基因并通过鉴定靶向关键基因的 发现 和 可能是检测糖尿病和结核病的潜在生物标志物 年第卷第期医学理论与实践图 对糖尿病关键基因识别和分析.分析各种软阈值幂的无尺度拟合指数.平均连通性和样本聚类.基因聚类.模块特征向量聚类.分析 相关的加权基因共表达网络模块.的 与 散点
10、图.和 分析医学理论与实践 年第卷第期 图 结核数据库中差异基因筛选和分析.火山图.聚类热图.分析.分析有研究表明糖尿病患者对结核分枝杆菌感染可能性会增加 倍而且糖尿病也会增加结核病患者过早死亡的风险 免疫功能受损是结核分枝杆菌感染的一个重要前提而糖尿病造成免疫功能低下会是结核病发展的一个重要推力 因此我们采用生物信息学分别筛选了糖尿病和结核病可能与免疫系统相关联的枢纽基因然后将两组基因取交集并对其进行富集分析发现除与免疫密切相关外而且参与溶酶体和氨基酸代谢通路通过 从交集基因中筛选出得分前十的基因这些基因被认为与糖尿病和结核病密切相关 该方法已成功应用于多种生物信息学分析以鉴定与多种疾病表型
11、相关的常见风险基因和机制鉴于免疫细胞在糖尿病和结核病过程中起着至关重要的作用我们首先研究糖尿病和结核病患者中免疫细胞浸润结果发现在糖尿病中 细胞和被激活的肥大细胞占免疫细胞浸润的大部分结核病中 细胞、和被激活的肥大细胞占免疫细胞浸润的大部分 此外与对照组相比糖尿病中 和中性粒细胞均增加结核病中、浆细胞和 细胞显著增加 大量研究表明中性粒细胞作为先天免疫反应的效应器除参与适应性免疫应答外还参与慢性炎症和自身免疫过程 巨噬细胞是结核免疫过程的第一道防线巨噬细胞按其表面分子分为 和 类型 研究表明 巨噬细胞具有抗病原体活性的促炎表型而 巨噬细胞促进抗炎作用和组织修复反应 综上所述推测巨噬细胞和中性粒
12、细胞可能在糖尿病和结核病中起潜在的重要作用最 后 笔 者 通 过、和 进行筛选验证发现只有 在糖尿病和结核病中稳定高表达并且其在肺鳞癌和 年第卷第期医学理论与实践图 筛选共同关键基因.维恩图.分析.分析.筛选前十的关键基因图 种免疫细胞浸润相对比例热图图 疾病组和对照组中每种免疫细胞浸润丰度的小提琴图医学理论与实践 年第卷第期 图 基因和中性粒细胞和 细胞的相关性分析图 关键基因验证和潜在 的预测.关键基因验证.基因表达分析.维恩图.和潜在 互作网络.表达验证肺腺癌中低表达可以作为肺结核诊断和鉴别诊断的潜在标志物 本研究仍存在一定局限性:()本研究收集的样本量较少()本研究只基于公共数据(下转
13、第 页)医学理论与实践 年第卷第期 白允保胡鹏张建明.和 基因多态性与 感染手足口病严重性及易感性的关系研究.病毒学报():.付文静盛爱芹鲍菁等.基因多态性与 感染手足口病严重程度的关联.中华医院感染学杂志():./.():.唐颖谈伟君靳雅丽等.天然高本底地区汉族男性人群 基因 侧翼区多态性分析.中国职业医学():.李祥安刘金亭陈慧敏.感染重度手足口病患者外周血中 细胞、血清乳酸和肿瘤 变化及其意义.中华肿瘤防治杂志():.手足口病诊疗指南(版)编写专家委员会.手足口病诊疗指南(年版).中华传染病杂志():.陈春艳李淑珍李苑等.新冠疫情前后深圳市宝安区手足口病流行病学特征分析.华南预防医学()
14、:.李侗曾梁连春.手足口病危重症预警评估方法研究进展.中国全科医学():.李帮涛雷智贤李虹艾等.肾上腺素能受体基因编码区 位单核苷酸多态性与肠道病毒 感染的关系.中华实验和临床病毒学杂志():.尹创新侯振江.调节性 细胞及其细胞因子在自身免疫性疾病中的研究进展.医学综述():./.():.:?.():.江莉吴晓君黄俊彬等.基因单核苷酸多态性与儿童 相关性的研究.中国实验血液学杂志():.():.:.():.王微马千里谭芳等.云南汉族人群 基因多态性位点与肺癌发生发展的相关性.贵州医科大学学报():.():./.():.收稿日期 (编辑 羽飞)(上接第 页)集的生物信息学分析可能无法完全反映患者实际情况综上所述本研究分析糖尿病和结核病免疫过程中常见的关键基因发现 和 可能是预测糖尿病和结核病的潜在生物标志物 还可以作为肺结核鉴别诊断标志物参考文献 .():.:.():./.:/./.:.():.:.():.()():.():.苏倩郑宏王娟等.的靶基因预测及生物信息学分析.医学理论与实践():.李扬王云李遵等.通过靶向调控 对膀胱癌患者预后影响的生物信息学分析.医学理论与实践():.():./:.:.收稿日期 (编辑 倩楠)