收藏 分销(赏)

整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf

上传人:自信****多点 文档编号:471767 上传时间:2023-10-13 格式:PDF 页数:11 大小:1.62MB
下载 相关 举报
整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf_第1页
第1页 / 共11页
整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf_第2页
第2页 / 共11页
整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Research Papers研究报告生物化学与生物物理进展Progress in Biochemistry and Biophysics2023,50(3):整合受体调控基因表达信息构建细胞通信网络*郭书旗1)张绍武1)*李岩1)张世华2)*(1)西北工业大学自动化学院,信息融合教育部重点实验室,西安 710072;2)中国科学院数学与系统科学研究院,北京 100190)摘要 目的构建细胞通信网络有助于揭示细胞间协同工作机制、生物学过程和疾病发病机理。目前基于配体-受体相互作用构建细胞通信网络的方法大多只考虑配体和受体的表达信息,忽略了受体对其调控基因的信号传递影响,导致构建的细胞通信网络可

2、靠性较低。鉴于此,本文提出IRRG算法,旨在构建更为准确的细胞通信网络,并挖掘具有生物学意义的细胞通信模式。方法本文提出了一种整合受体调控基因表达信息构建细胞通信网络的方法(命名为IRRG)。该方法通过随机游走方式计算受体对下游基因的影响得分,进而与配体-受体共表达量结合构建细胞通信网络。结果使用IRRG构建了小鼠滤泡间表皮(IFE)细胞通信网络并分析了配体-受体对的生物学意义,验证了IRRG计算受体影响得分的稳定性和细胞通信网络构建的可靠性。此外,使用IRRG构建了透明细胞肾细胞癌(ccRCC)的细胞通信网络,挖掘并分析其肿瘤微环境细胞通信模式。结论IRRG可以构建富有生物学意义并且可靠的细

3、胞通信网络,帮助人们从细胞通信的角度更深入地了解多种生物过程。IRRG算法代码可从GitHub获取:https:/ 细胞通信,配体-受体,基因共表达,基因调控网络,随机游走中图分类号 R318.04DOI:10.16476/j.pibb.2022.0099对于多细胞生物来说,细胞通信(也被称为细胞间相互作用)是必不可少的。细胞通过交流和合作形成动态的通信网络,在许多生物过程中发挥着至关重要的作用。例如,驱动细胞分化和器官发育、维持组织器官内稳态、疾病中的免疫相互作用等1-3。细胞通信所涉及的信号传递,通常受蛋白质相互作用影响。由于RNA测序(RNA-seq)数据易获取和分析,且基因表达水平是蛋

4、白质丰度的主要决定因素4,目前细胞通信的研究主要是以转录组学为基础。随着单细胞RNA测序技术(scRNA-seq)技术的发展,海量单细胞测序数据正在迅速积累。这些数据有助于揭示生物组织中潜在的细胞异质性,并为细胞通信研究提供了重要的数据来源。利用单细胞测序数据,从配体-受体(L-R)相互作用角度出发能够有效构建和分析细胞通信网络。目前,已有一些基于配体-受体互作用构建细胞通信网络的研究。Kumar等5通过识别和比较不同肿瘤之间的配体-受体互作用差异,研究了T细胞亚群之间的细胞通信,及与免疫过程关系;Xiong等6根据肝细胞中高表达的配体-受体对,构建了肝细胞配体-受体通信网络,进而研究了患非酒

5、精性脂肪肝炎的患者肝脏微环境中的细胞间串扰。基于配体-受体互作用研究细胞通信的一项主要工作,就是推断配体-受体的互作用强度。目前已经提出了一些策略用于推断配体-受体的互作用强度,例如:使用阈值判断配体和受体是否有效表达7;识别具有差异表达的配体和受体,找到“活跃”的配体-受体对8;通过配体和受体各自表达量的乘积,计算一个连续值推断配体-受体互作用强度9。这些方法较为简单易行,但存在如下潜在局限:基因表达阈值不好选择,配体或受体的表达量过高会导致乘积结果不准确。重要的是,这些方法仅使用了配体和受体的表达量,事实上,参与细胞间通信的信号事件不仅包括细胞间的信号,还包括细胞内的信号通路和转录调控10

6、。受体在接收到配体信号后,会对受体下游的相关基因产生影响,进而改变基因调控网络和转录因子活性。鉴于此,本文从细胞通信的生物现象角度出 国家自然科学基金(62173271,61873202,12126605)资助项目。通讯联系人。张绍武 Tel:029-88431308,E-mail:张世华 Tel:010-82541360,E-mail:收稿日期:2022-03-17,接受日期:2022-05-23 624 2023;50(3)生物化学与生物物理进展 Prog.Biochem.Biophys.发,提出一种整合受体调控基因表达信息的细胞通信网络构建方法 IRRG。该方法利用 KEGG11和Rea

7、ctome12数据库建立不同细胞类型中每个受体对应的基因调控网络(即受体基因调控网络),然后采用随机游走算法计算细胞通信中受体对下游基因的影响程度得分,并将此影响得分与配体-受体共表达量结合,推断配体-受体互作用强度。用于有效挖掘细胞间的通信现象,发现与生物过程密切相关的配体-受体对和关键通信模式。1数据集与方法1.1数据集本文所用数据主要包括配体-受体对数据、信号通路数据、单细胞RNA测序数据。从LRdb数据库13选取配体-受体对,构建配体-受体对数据集(包含3 251组配体-受体对)。LRdb数据库中的配体-受 体 对 来 自 于 Reactome12、HPMR14、HPRD15、Unip

8、ort16、Fantom517等多个数据库,这些配体-受体对可靠性较高、注释详细18。为了有效整合受体调控的基因表达信息,通过Pathway Commons19下载KEGG和Reactome信号通路,构建信号通路数据集,该数据集包含34万组基因相互作用的路径。此外,为了探究多个信号通路数据库对IRRG构建细胞通信网络结果的影响(附件文档 S1 第 1 节),本文在整合 KEGG 和Reactome两个通路数据库的基础上,又整合了PID和Panther两个信号通路数据库,其基因互作信息的数量达到38万多条。单细胞RNA测序数据主要包括小鼠滤泡间表皮组织(GSE67602)20和透明细胞肾细胞癌组

9、织(GSE159115)21单细胞测序数据,及各自的默认细胞类型标签。小鼠滤泡间表皮组织细胞数据集包含720个细胞,它们分为IFE-B、IFE-DI、IFE-DII、IFE-KI、IFE-KII 5种细胞类型20,构成小鼠表皮独特的分层结构,其中IFE-B细胞位于表皮最底部,可以增殖分化形成最外层的IFE-K(由IFE-KI和IFE-KII两个亚型细胞组成)角化层细胞。本文使用同源基因转化将小鼠滤泡间表皮细胞的基因与配体-受体数据库以及信号通路数据库中的基因对应。肾透明细胞癌组织样本(SI_22368)和正常组织样本(SI_22369)分别包含 2 779、1 495 个细胞,肾 透 明 细

10、胞 癌 组 织 细 胞 分 为 肿 瘤 细 胞(tumor)、平 滑 肌 细 胞(vascular smooth muscle cell,vSMC)、巨噬细胞(macrophage,Macro)、T 细胞(T cell)、B 细胞(B cell)、内皮细胞(endothelial,Endo)6种细胞类型,正常组织细胞分为上皮细胞(epithelial)、vSMC、Macro、T 细胞、B细胞、Endo 6种细胞类型。1.2受体基因调控网络构建构建受体在各个细胞类型中的基因调控网络是整合受体调控基因表达信息的前提。对于特定细胞类型中的受体,考虑到单细胞数据的稀疏性,本文选择该细胞类型中部分基因作

11、为候选调控基因,用于构建受体基因调控网络。鉴于滤除特定细胞类型大部分细胞中均不表达的基因可以降低算法运行时间,且筛选候选调控基因的比例并非越大越好(大的筛选比例会使有效信息数量减少)。因此,本文按照20%的比例值筛选候选调控基因。然后,利用通路数据集中的基因关系,并根据表S1中的基因互作用简化规则,确定受体和其候选调控基因及候选调控基因间的连接。如果基因间的作用类型属于控制(Control),则基因间通过单向边连接;如果互作用类型属于反应(Reaction)和复合物(Complex),则基因间通过双向边连接。经过上述步骤,可能会得到几个不连通的子网络,仅保留受体基因所在的基因调控子网络,进而构

12、建出受体基因调控网络。1.3IRRG算法IRRG算法主要由如下3部分组成:a.受体影响得分计算;b.特异性配体-受体对筛选;c.细胞通信网络构建(图1)。a.受体影响得分计算使用一种改进的随机游走DwanRank算法22计算受体影响分(Rscore)以计算指定细胞类型中某一个受体R的受体影响得分为例,其迭代公式如下:Rt+1m=(1-dm)fm+dmn=1Nadjmnrtndegn,1 m,n N (1)其中,N表示受体R对应的受体基因调控网络中的基因节点数目;rt+1m表示第t+1次迭代后基因m的影响得分;adjmn表示基因m和基因n的邻接关系,如果基因m指向基因n,则adjmn=1;deg

13、n表示基因n 的入度;dm=degm(degm+3)为一动态阻尼系数,基因节点的入度越大,其阻尼系数亦越大,进而网络中更多的连接信息被纳入计算;r0n表示某类型细胞分为两组后基因n的差异表达值;fm表示将某类型细胞分为两组后基因 m 差异表达的归一化值。郭书旗,等:整合受体调控基因表达信息构建细胞通信网络2023;50(3)625 r0n和fm的计算过程如下:首先根据受体R在各个细胞中是否有效表达(本文设置基因有效表达值为0),将某类型细胞分为受体有效表达细胞和未表达细胞两组,然后分别计算两组细胞中受体基因调控网络的基因平均表达量EI、EII,求取二者的绝对 差 值 计 算r0=r01,r0m

14、,r0N,即r0=|EI EII|。根据r0计算fm,即fm=r0m k=1Nr0k。迭代更新rt+1,直至当rt+1 rt 0.001时,则认为该受体基因调控网络游走已达到稳定状态,并从此基因调控网络中获取受体R的稳定值。重复上述过程,可以计算出指定细胞类型中所有受体的稳定值,即向量R=R1,RL,L 为该细胞类型中有效的受体个数。然后对向量R中的值进行归一化,得到特定细胞类型中L个受体的影响得分。b.特异性配体-受体对筛选鉴于部分配体-受体对在不同的细胞类型之间普遍表达、不能提供关于特定细胞状态间的交流信息,IRRG采用置换检验筛选特异配体-受体对,用于构建特异性细胞通信网络。考虑到配体和

15、受体的基因表达是细胞的通信基础,将配体-受体对的共表达量作为置换检验依据,进而筛选特异性配体-受体对。下面以A、B、C 3种细胞类型为例说明如何筛选特异性配体-受体对,首先随机置换所有细胞类型的标签,此时,3种细胞类型会得到新的基因表达矩阵;然后重新计算任意二类细胞(包含同类细胞)之间配体-受体的共表达量,重复1 000次随机置换得到零分布,如果某配体-受体对的 P0.05,则认为该配体-受体对具有特异性(图1b)。筛选出来的特异性配体-受体对用于构建细胞通信网络。c.细胞通信网络构建考虑到配体-受体的共表达是细胞通信的基础,而受体影响得分代表受体在细胞通信中对下游基因R1R2R3RL-1RL

16、R1 LR1LR2LR3LRH-1LRHCoExpSignificant Permutation test LR1LR3LRH=RscoreLRscoreAL R LRscoreFabp5 Rxra 5.35App Lrp1 2.76BABCTop ranked L-R pairLR1LR3LRH(a)(b)(c)PathwayLRdbscRNA-seq DataRLRLR1R1IterateIterateRLSignificant CoExpLR1LR3LRHR1R3RHCoExpFig.1Schematic diagram of IRRG(a)Calculating the impact

17、scores of receptors with the improved restart random walker algorithm.The green arrows represent the integration of gene expression information.(b)Screening the specific L-R pairs with Permutation test.(c)Building the cellular communication network.626 2023;50(3)生物化学与生物物理进展 Prog.Biochem.Biophys.的影响程

18、度,综合配体-受体共表达量(CoExp)和受体影响得分(Rscore),将二者的乘积用于度量配体-受体的互作用强度(LRscore)。LRscorei=CoExpi Rscorei(2)其中,LRscorei表示指细胞类型A和B之间第i对配体-受体的细胞通信强度;CoExpi为第i对配体-受体中的配体在细胞类型A中的平均表达量与受体在细胞类型 B 中的平均表达量之积的算术平方根;Rscorei表示第i对配体-受体中受体在细胞类型B中的影响得分。将细胞类型A和B之间所有特异配体-受体对的互作用强度相加,其加和值可作为细胞通信网络的边权重(即通信强度),即EdgeA B=i=1ILRscorei

19、(3)基于此,可以计算出所有细胞类型间的通信强度,进而构建出细胞通信网络。2结果与讨论鉴于搭建受体基因调控网络时滤除特定细胞类型中大部分细胞中均不表达的基因,可以降低算法运行时间,但过大的筛选比例可能会使有效信息数量减少,本文首先在小鼠滤泡间表皮组织数据集上通过分别设置10%、20%的基因筛选比例阈值构建受体基因调控网络。然后采用随机游走算法计算受体得分,发现10%基因筛选比例阈值下的受体得分计算时间为56 min左右,20%基因筛选比例阈值下的受体得分计算时间为20 min左右。此外,两种基因筛选比例下的各细胞类型受体得分差异较小(图S1)。因此,本文按照20%的比例值筛选候选调控基因构建受

20、体基因调控网络。为验证IRRG算法构建细胞通信网络性能,我们 首 先 在 小 鼠 滤 泡 间 表 皮 细 胞(mouse interfollicular epidermal cells,IFE)和人类肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)的单细胞测序数据上应用本文的IRRG算法,分别构建小鼠滤泡间表皮细胞通信网络和肾透明细胞癌细胞通信网络,分析细胞通信模式。然后通过下采样策略,评估IRRG算法计算的受体影响得分,能否有效反映受体对调控基因的影响。最后,根据细胞通信网络互作用强度大小,统计排名靠前的配体-受体对所拥有的支持文献数量,对比分析了I

21、RRG与现有其他细胞网络构建方法的性能。2.1小鼠滤泡间表皮细胞和肾透明细胞癌细胞通信网络构建结果2.1.1小鼠滤泡间表皮细胞(IFE)通信网络构建结果IFE在保护皮肤中发挥关键作用,鉴于其特殊的分层结构及单细胞测序数据可以公开获取,采用IRRG算法构建了5种IFE细胞类型间的通信网络(图2a),并通过细胞类型间通信强度和特异性配体-受体对数量(图2b、c),分析5种细胞类型之间的细胞通信模式。从图2a可以看到,IFE-KII参与的细胞通信强度较弱,IFE-B细胞所涉及的细胞通信能力较强,此通信模式可能与这两类细胞的功能有关。IFE-B细胞位于表皮的基底层,是一类增殖细胞,它们可以增殖分化形成

22、上基底层细胞,而IFE-KII细胞是一类最终分化的角质层细胞,它们是防止感染和受伤的重要屏障,该类细胞逐渐被去掉细胞核并从皮肤表面脱落20,23-24,结合IFE-KII释放信号强度远大于接受信号强度的现象,意味着其可能在保护小鼠皮肤中倾向担当“哨兵”角色;IFE-DII具有出色的信号释放和接收能力,暗示其可能担任“桥梁”角色、维持多层细胞间通信信号的正常传递;IFE-KI细胞与其分层结构相对较远的细胞(如IFE-B)有较高的通信强度,说明小鼠滤泡间表皮不同层细胞间存在远距离细胞通信,这些细胞通信现象有助于全面了解小鼠表皮不同层细胞间的协同工作机制。为了帮助发现IFE-B细胞分化形成完整皮肤组

23、织的过程和机理,及IFE-KII细胞防止皮肤组织感染和受伤的屏障功能,进一步分析了表皮基底层细胞 IFE-B 与其上层细胞(即 IFE-DI、IFE-DII、IFE-KI细胞)、角质层细胞IFE-KII细胞与其下层细胞(即IFE-KI、IFE-DII、IFE-DI、IFE-B细胞)间互作用强度较高的配体-受体对(图3)。由于IFE-B与IFE-KII之间的通信强度较低(13.58),图3中没有给出IFE-B与IFE-KII间互作用强度较高的配体-受体对统计结果。从图3可以看出,IFE-B与其上层细胞的通信过程中,普遍存在与受体Errb2相关的配体-受体对,这可能与受体Errb2参与表皮组织的表

24、皮生长因子刺激反应、上皮细胞增殖、细胞生长正向调节、伤口愈合等许多重要生物过程25-27有关,此结果说明小鼠滤泡间表皮细胞通信中受体Errb2发挥其重要的生物学功能。IFE-B与IFE-DII的通信中,与表皮生长因子受体Egfr相关的配体-受体对较多,这可能与受体Egfr参与表皮发育、细郭书旗,等:整合受体调控基因表达信息构建细胞通信网络2023;50(3)627 胞迁移正向调节和细胞分化等过程28-29有关。IFE-B与IFE-DI通信中,与受体Sdc4相关的配体-受体对拥有高互作用强度,这可能与受体Sdc4主要参与细胞迁移和伤口愈合等过程30-31有关。IFE-KII 与其下层细胞的通信过

25、程中,受体Erbb2和配体Btc、Ereg、Tgfa参与了细胞通信,它们均与小鼠表皮组织的生物过程相关32,说明IFE-KII细胞可能在促进下层细胞形成完整表皮的过程中发挥重要功能。IFE-KII与IFE-B通信过程中,受体Rpsa主要参与上皮细胞分化,受体Itga6、Itgb4 在细胞迁移和皮肤形态发生中具有积极作用33-34。IFE-KII 和 IFE-KI 通 信 过 程 中,受 体Il1rap可以产生白介素-1受体辅助蛋白,促进各种白介素的产生,用于激活免疫细胞或影响炎症反应35-36,这为IFE-K细胞作为防止入侵的屏障、发挥皮肤抗炎功能提供了有力证据。以上这些结果表明,本文的 IR

26、RG 算法可以有效计算细胞通信强度,并能够构建出具有生物学意义的细胞通信网络。另外,符合表皮生理过程不同细胞类型间的关键配体-受体对发现,有助于深入研究小鼠滤泡间表皮组织中特定层次细胞所扮演的角色,及不同类型细胞协同工作所发挥的生物学功能。2.1.2肾透明细胞癌细胞通信网络构建结果肿瘤微环境中的细胞通信研究有助于发现肿瘤的生长、转移等机制。为验证IRRG算法能否有效挖掘癌细胞的通信模式,从肾透明细胞癌的单细胞RNA测序数据出发,采用IRRG算法分别构建肾透明细胞癌组织和正常组织的细胞通信网络(图S2),并分别计算肾透明细胞癌组织中,各个细胞类型间通信强度与正常组织中对应细胞类型间通信强度的Fo

27、ldChange值(图S3)及差异值(图S4),分析肾透明细胞癌细胞的通信模式。由于肾透明细胞癌组织中肿瘤细胞主要由上皮细胞癌变形成,将Tumor 与 Epithelial 对应。从图 S3,S4 可以看出,IFE-B(330)IFE-DI(152)IFE-DII(123)IFE-KI(95)IFE-KII(20)101.4270.80100.8290.8951.0498.0690.25150.83110.3549.19143.76143.25191.97177.3477.8055.6764.36113.9592.9745.5114.4310.3526.1734.6527.3350100150

28、22011518221310414586159162742341692262471191831212002121025940731075550100150200IFEBIFEDIIFEDII IFEKI IFEKIIIFEBIFEDIIFEDIIIFEKIIFEKIILRIFEBIFEDIIFEDII IFEKI IFEKIIIFEBIFEDIIFEDIIIFEKIIFEKIILR(a)(b)(c)Fig.2Cell communication results of mouse IFE cells with IRRG algorithm(a)Mouse cell communication n

29、etwork built with IRRG from the scRNA-seq gene expression profiles of 5 kinds of mouse IFE cells.The node size of every cell type depends on the number of cells it contains,and the thickness of each edge represents the communication strength between two cell types.The number in brackets after each c

30、ell type represents the number of cells contained in such cell type.(b)The strength values of cell communication among 5 kinds of mouse IFE cells.(c)Number of specific ligand-receptor pairs among 5 kinds of mouse IFE cells.012345IFE-BIFE-DIIFE-DIIIFE-KIIFE-KIIErbb2Hsp90b1Rps27aHsp90aa1Uba52UbcBtcEre

31、gTgfaIFE-BIFE-DIIFE-DIIIFE-KIEgfrAnxa1Uba52Calm1BtcSdc4Thbs1Rspo3Lrp1ApoeCalrCtgfRpsa Itga6 Itgb4 Itgb1Dusp18Il1rapIl1aSenderLigandReceiverReceptorFig.3Heatmap of some key ligand-receptor pairs in the communication process among five kinds of mouse IFE cells 628 2023;50(3)生物化学与生物物理进展 Prog.Biochem.Bi

32、ophys.肾透明细胞癌中的肿瘤细胞(tumor cell)与B细胞(B cell)、内皮细胞(endothelial cell,Endo)、巨噬细胞(macrophage,Macro)、T 细胞(T cell)、血管平滑肌细胞(vascular smooth muscle cells,vSMCs)间的通信强度明显高于相应其正常组织中的 上 皮 细 胞(epithelial)与 B cell、endothelial、Macro、T cell、vSMCs间的通信强度,表明肿瘤细胞在肿瘤微环境中可通过增加与其他细胞的通信强度,加速癌症的发展,这些现象在许多研究中已被证明37-39。作为免疫细胞的T

33、细胞与B细胞,在肾癌组织中的通信强度明显低于其正常组织中的通信强度,说明T细胞与B细胞间的通信强弱与肾癌的发生发展密切相关。另外,肾癌组织中的其他5种细胞(B cell、endothelial、Macro、T cell、tumor)与vSMCs间的通信强度明显高于其正常组织中其他 5 种细胞(B cell、endothelial、Macro、T cell、epithelial)与vSMCs间的通信强度,暗示高强度的vSMCs通信在肾癌发展过程中扮演重要角色,其原因可能在于vSMC细胞是构成血管壁组织结构及维持血管张力的主要细胞成分,它们能够为肿瘤输送氧气和营养、转移癌细胞40-41。为了进一步

34、研究肾癌组织中特有的细胞通信模式,以tumor和epithelial细胞为信号释放源,将肾癌组织和正常组织中的其他 5 种细胞(B cell、endothelial、Macro、T cell、vSMCs)作为受体细胞类型,分别挑选出各个受体细胞类型中互作用强度大小排名前五的受体,然后对这些受体在基因网络中所调控的一阶、二阶基因进行KEGG通路富集分析(图S5)。从图S5可以看出,肾透明细胞癌组织中的通路富集结果在基因比例(GeneRatio)和对数P值(LogPvalue)上大于正常组织的通路富集结果,且肾透明细胞癌组织中 T 细胞(T cell)与内皮细胞(Endo)的通路富集结果与其正常组

35、织中的通路富集结果也明显不同。例如,肾透明细胞癌组织中的T细胞富集信号通路“Proteoglycans in cancer”,主要负责在细胞膜和周围的外基质之间提供接触联系,在调节癌细胞黏附和迁移方面起着核心作用42。富集信号通路“ECM-receptor interaction”参与肿瘤的脱落、黏附、运动和增殖43。另外,肾透明细胞癌组织T细胞中缺少部分免疫相关的富集信号通路,而T细胞的特异性免疫,在对抗肿瘤发生发展过程中发挥其重要功能作用44,此结果说明肿瘤细胞可能通过细胞通信抑制T细胞的免疫。表S2给出了肾透明细胞癌组织和正常组织分别特有的富集信号通路,例如肾癌组织中的 vSMCs 所富

36、集的“EGFR tyrosine kinase inhibitor resistance”通路,会干扰表皮生长因子抑制剂的治疗效果,通过促进血管的形成间接帮助癌症生长。前人研究也已证实45-46,透明细胞肾细胞癌作为高度血管化的肿瘤,vSMCs被认为是肿瘤病理性过度血管生成的关键,存在潜在的新治疗靶点。综合上述实验结果表明,通过IRRG算法分别构建肾透明细胞癌组织和正常组织的细胞通信网络,有助于揭示肿瘤细胞如何通过调控周围正常细胞完成自身生长或迁移的肿瘤发育过程,发现透明细胞肾细胞癌中的特异富集信号通路,深入了解肿瘤微环境的细胞通信模式。2.2受体影响得分计算的稳定性分析为验证IRRG算法计算

37、的Rscore能否有效表示细胞通信中受体对调控基因的影响,采用下采样策略评估受体影响得分计算的稳定性。鉴于IFE-KI和IFE-KII类细胞拥有相同的角化功能,而IFE-DI和IFE-DII类细胞拥有相同的分化功能,为保证下采样后每类细胞拥有一定的细胞数量,首先将小鼠滤泡间表皮中的 IFE-KI 和 IFE-KII 细胞合并为 IFE-K 角 化 层 细 胞(interfollicular epidermis keratinized layer cells)、IFE-DI和IFE-DII细胞合并为 IFE-D 分 化 细 胞(interfollicular epidermis differen

38、tiated cells),于是小鼠滤泡间表皮细胞分为IFE-B、IFE-K和IFE-D 3类,然后按照70%、50%、30%、10%的采样比例分别从这3类细胞中随机抽样,采用IRRG算法计算3类细胞中的受体影响得分,并计算采样前/后共有的受体影响得分的皮尔逊相关系数。此过程重复30次,图4为其下采样前/后受体影响得分的相关性箱状图。从图4可以看出,对于 IFE-B、IFE-K 和 IFE-D 3 类细胞,采样70%后计算的受体影响得分与采样前计算的受体影响得分的相关系数均在0.9以上。当采样率为50%时,只有IFE-D细胞中的受体影响得分与其采样前受体影响得分的相关系数小于 0.9。当采样率

39、为30%时,3种细胞的受体影响分数与它们采样前受体影响得分的相关系数在0.80.9之间。当采样率为10%时,3种细胞的受体影响分数与它们采样前受体影响得分的相关系数明显下降,例如,IFE-B细胞采样前/后的受体影响得分相关系数降低到0.50.6,IFE-D细胞降低到0.40.5,IFE-K细胞降低到0.50.7。郭书旗,等:整合受体调控基因表达信息构建细胞通信网络2023;50(3)629 综上结果分析可知,采样率大于30%的条件下,IRRG算法计算的受体影响得分具有良好的稳定性。也就是说,在细胞数保持一定量的条件下,IRRG计算出的受体影响得分,仍能够有效表示细胞通信过程中受体对调控基因的影

40、响。这说明IRRG可以合理地整合受体调控基因表达信息,有效计算出受体对下游调控基因的影响程度得分。2.3IRRG算法性能分析为了验证 IRRG 算法构建细胞通信网络的性能,从小鼠滤泡间表皮细胞的单细胞RNA测序数据 出 发,分 别 采 用 IRRG 算 法 和 NATMI47、SCR13两种方法构建小鼠滤泡间表皮 5 种细胞(IFE-B、IFE-DI、IFE-DII、IFE-KI、IFE-KII)间的细胞通信网络。NATMI38仅使用配体-受体的共表达量计算配体-受体互作用强度;SCR13通过结合配体-受体的共表达量和归一化单细胞测序基因表达矩阵,计算配体-受体互作用强度,并认为有效配体-受体

41、对的互作用强度大于0.5。另外,为了验证本文的受体影响得分计算策略及特异性配体-受体对筛选策略的有效性,分别删除IRRG算法中受体影响得分计算及特异性配体-受体对筛选单元,设计IRRG-RS和IRRG-SLR二种消融方法,其中IRRG-RS表示在IRRG算法中删除受体影响得分计算单元,IRRG-SLR表示在IRRG算法中删除特异性配体-受体对筛选单元。根据LRdb数据库中配体-受体的文献注释,在上述5种方法所构建的细胞通信网络中,统计各细胞类型间(共25组)相互作用强度大小排名前20、30、40的配体-受体对所拥有的支持文献数量,其统计结果如图S6所示,每种方法在所有细胞类型间互作用强度排名靠

42、前的配体-受体对所拥有的支持文献总数如图5所示。从图5可以看出,IRRG算法所构建的细胞通信网络中,配体-受体对所拥有的支持文献总数高于NATMI和SCR两种方法。以 IFE-KII 细胞自通信的前 20 对配体-受体为例(图S6a),IRRG推断出的20对配体-受体中,12对配体-受体共有 15 篇支持文献:Btc-Erbb248、Arf1-Pld249-50、Btc-Egfr51-52、Scgb1a1-Lmbr1l 53、Tgfa-Erbb2 54、Il1a-Il1rap 55、Il1a-Il1r256、Btc-Erbb357、Tgfa-Egfr58-59、Il1rn-Il1r260、La

43、mb1-Itgb161、Il1a-Il1r162;NATMI 推断出的 20 对配体-受体中,仅7对配体-受体共有8篇支撑文献:Il1a-Il1r256、Cdh1-Ptprf63、Scgb1a1-Lmbr1l 53、Apoe-Ldlr 64-65、Btc-Erbb2 48、Hmgb1-Sdc166、Il1rn-Il1r260;SCR 推断出的 20 对配体-受体中,仅9对配体-受体共有10篇支撑文献:Il1a-Il1r256、Cdh1-Ptprf63、Scgb1a1-Lmbr1l53、Apoe-Ldlr64-65、Btc-Erbb248、Il1rn-Il1r260、Efnb2-Rhbdl267

44、、App-Ncstn68、Apoe-Lrp169。IRRG推断出的其他细胞类型间的前20对配体-受体,所拥有的支持文献数量信息如表S3所示。为了进一步验证IRRG算法相较于NATMI和SCR算法优势的显著性,利用Wilcoxon符号秩检验,对3种算法在25组细胞类型间预测排名靠前配体-受体对支撑文献数量的差异性,进行了统计显著性检验(图S7)。从图 S7 可以看出,IRRG 的表现显著优于NATMI、SCR 两种常用细胞通信网络构建方法,意味着IRRG构建的细胞通信网络的可靠性和可解释性相对较高。另外,IRRG算法所构建的细胞通信网络中,排名靠前的配体-受体对所拥有的支持0.40.60.81.

45、070503010Sampling rate/%Pearson correlation coefficientIFEB70503010Sampling rate/%Pearson correlation coefficientIFEK0.40.60.81.070503010Sampling rate/%Pearson correlation coefficient0.40.60.81.0IFEDFig.4Pearson correlation coefficient of receptor influence scores before and after down-sampling 630

46、2023;50(3)生物化学与生物物理进展 Prog.Biochem.Biophys.文献总数大于 IRRG-RS和 IRRG-SLR两种消融方法,说明受体影响得分计算策略和特异性配体-受体对筛选策略能够有效提高细胞通信网络构建的可靠性。此外,考虑到细胞生物功能的相似性,也分析了IRRG构建IFE 3种细胞(IFE-K、IFE-D、IFE-B)间细胞通信网络的性能(附件文档S1第2节,表S4),结果显示IRRG仍拥有最好的表现。上述结果分析表明,IRRG算法能够发现细胞通信过程中重要的配体-受体对,这有助于研究细胞通信模式,从细胞通信层面研究生物过程。另外,消融实验结果充分说明了细胞通信网络构

47、建中,考虑受体对下游调控基因的影响及筛选特异性配体-受体对的有效性。3结论单细胞RNA测序技术的快速发展为基于配体-受体的细胞通信研究提供了丰富的数据。虽然目前存在一些方法从单细胞RNA测序数据出发,通过计算配体-受体互作强度构建细胞通信网络,但这些方法忽略了细胞通信中受体会将接受到的信号传递给其他基因,仅依据配体和受体的共表达量,计算配体-受体的互作用强度构建细胞通信网络,不能有效发现或挖掘细胞通信模式。鉴于此,本文提出一个构建细胞通信网络的计算工具IRRG。具体而言,IRRG工具根据信号通路中的基因关系构建受体基因调控网络,采用改进的随机游走算法计算受体对调控基因的影响得分,并将此受体影响

48、得分与其配体-受体的共表达量整合,计算细胞间的配体-受体互作用强度。小鼠滤泡间表皮细胞和肾癌组织细胞上的实验结果表明,IRRG工具能够构建出具有一定生物学解释性的细胞通信网络,可以发现表皮生理过程细胞间通信的关键配体-受体对及肾细胞癌的特异富集信号通路。与现有其他细胞通信网络构建方法相比,IRRG工具得到的细胞间配体-受体对所拥有的支撑文献数量相对较多,说明IRRG工具构建的细胞通信网络比较可靠。随着空间转录组技术的发展,如何结合单细胞空间位置信息精确构建细胞通信网络、发现新的细胞间通信模式,未来仍然需要进一步深入研究。附件 见本文网络版(http:/或http:/)。PIBB_2022009

49、9_Doc S1.pdfPIBB_20220099_Tab S1.pdfPIBB_20220099_Tab S2.pdfPIBB_20220099_Tab S3.xlsxPIBB_20220099_Tab S4.xlsxPIBB_20220099_Fig S1.pdfPIBB_20220099_Fig S2.pdfPIBB_20220099_Fig S3.pdfPIBB_20220099_Fig S4.pdfPIBB_20220099_Fig S5.pdfPIBB_20220099_Fig S6.pdfPIBB_20220099_Fig S7.pdf参考文献1Kirouac D C,Madla

50、mbayan G J,Yu M,et al.Cell-cell interaction networks regulate blood stem and progenitor cell fate.Mol Syst Biol,2009,5(1):29302505007501 000Literature counts203040Top ligand-receptor pairsMethod:NATMI:SCR:IRRG_RS:IRRG_SLR:IRRGFig.5Total number of the supported literatures of top 20,30,and 40 ligand-

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 品牌综合 > 临存文档

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服