资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,21,流行病学,Epidemics,流行病和传播网络,流行性疾病的研究一直是生物学与社会学融合在一起的专题研究,流行性疾病,如流感、,H7N9,、麻疹、性病等,都是通过人际传播,极端情况下,一种单一疾病暴发可能会对世界产生重大影响。如,14,世纪初欧洲人向美洲迁徙时,腺鼠疫在美洲暴发,,7,年内超过,20%,的欧洲人死于该病,4,月,5,日,上海关闭松江区沪淮农副产品批发市场活禽交易区,所有禽鸟被扑杀,共计,20536,只;,4,月,7,日,上海交大捣毁校内鸟窝,2,流行病和传播网络,决定流行病传播模式的因素:,病原体特性:传染性、传染周期、严重性,接触网络,传染概率,人们关心的问题:,多大范围?是否需要采取措施?(有些传染病会自生自灭,例如季节性传染病),多长时间?会不会反复?,对患者影响的程度?(生命、损伤、不适),3,流行病传播与行为思想传播,相似点:两者都是通过接触网络在人之间传播,某种程度上思想传播也是一种,“社会传染”,区别:,对于社会性传染,宜采用决策模型,对于疾病传播,宜采用随机模型,4,最简单的传染病模型,-,分支过程,分支过程形成树结构接触网络,最初一个人携带病菌进入人群,以一个独立的概率,p,传染给遇到的每个人,假设疾病感染期间每个人遇到,k,个其他人,以同样的概率将疾病传染给所遇到的人,5,分支过程,传染过程停止的条件?,6,基本再生数,由单一个体引起的新发病例数,期望值,,记为,R,0,,,R,0,=p*k,疾病在分支过程模型中传播的结果取决于基本再生数是小于,1,还是大于,1,如果,R,0,1,,则疾病持续在每一波以大于,0,的概率至少传染一个人(证明参见,21.8,节),7,基本再生数,R,0,=p*k,,当,R,0,接近于,1,时有一个,刀刃,(,knife-edge,)特性,如果,R,0,略低于,1,,略微增加传染概率,p,;结果可能会使,R,0,高于,1,,造成一个疾病突然的巨大爆发,如果略微减少疾病的传染性,将导致,R,0,减小到,1,以下,可以消除疾病大范围流行的风险,同样,稍微改变人群间联系的数目,k,也会对结果产生很大影响,8,基本再生数,结论:当门槛值,R,0,=1,附近,社会应该付出加倍的努力减小基本再生数,降低,k,:如隔离人群,降低,p,:提倡良好的卫生行为和习惯,减少细菌传播,如戴口罩,勤洗手等,9,分之过程太简化,分支过程模型显然是疾病传播的一个非常简化的模型,没有考虑接触网络中的三角关系、弱连接,实际的疾病传播要复杂得多,10,SIR,流行病模型,1927,年用动力学的方法建立,W.O.Kermack,A.G.McKendrick.,Contributions to the mathematical theory of epidemics,part IJ.Proceedings of the Royal Society of London,1927,115:700721(,引用,2680,),11,1876,-,1943 Scottish physician and epidemiologist,1898-1970,biochemist and mathematical epidemiologist,SIR,流行病模型,SIR,模型可以应用于任何网络结构,接触网络中的每个节点在流行病传播过程中经历三个状态,敏感期,(,S,usceptible),:易感者,有可能被一个患病的网络邻居节点感染,感染期,(,I,nfectious),:患病者,以一定的概率将疾病传染给处于敏感期的邻居,隔离期,(,R,emoved),:痊愈并免疫者,当一个节点经历了完整的感染期,就不再会被传染,也不会再对其他节点造成威胁,相当,于,从接触网络中移出,12,SIR,流行病模型,SIR,模型流行病的传播进展情况取决于基础网络结构,以及两个量值:,p,(传染的概率)和,t,I,(感染期的长度),最初,一些节点处于感染期,I,,所有其他节点处在敏感期,S,每个进入,I,的节点,v,在固定的步骤,t,I,期间内具有传染性,在,t,I,的每一步,,v,以概率,p,将疾病传染给它的处于易感状态的邻居,经过,t,I,步后,节点,v,不再具有传染性,也不会再受感染;进入隔离期,R,,成为接触网络中的无效节点,13,敏,感,S,感染,I,隔离,R,SIR,流行病模型,易感人数、传染人数、移出人数分别为,S(t),I(t),R(t),,占比分别为,s(t),i(t),r(t),:,个人单位时间与其他人平均有效接触次数,:,单位时间治愈人数,SIR,模型描述为:,14,SIR,流行病模型,给定,和,的,SIR,时间曲线,设,=1,=0.4,s(at start)=0.99,i(at start)=0.0,15,疾病什么时候消失呢?,取决于:,/,。如果发病率高于痊愈率,则疾病会持续,否则疾病将消失,SIR,模型示例,接触网络是有向图,,t,I,=1,最初节点,y,和,z,感染疾病,粗线边界的阴影节点处于感染状态,I,细线边界的阴影节点处于隔离状态,R,16,SIR,模型扩展,对不同的节点组合采用不同的感染概率,p,值:,对于有向接触网络中一对节点,v,、,w,,,v,连接到,w,,设其相应的传播概率为,p,v,w,p,v,w,值较高意味着接触密切,容易传染;反之则表示接触比较稀少,可对节点感染期长度的随机性建模,受感染节点在感染期内每一步都以概率,q,恢复健康,其它细节不变,将状态,I,进一步分离成若干子状态,感染的早、中、晚期,允许子状态中的传染概率有所不同,17,网络结构对疾病传播起不同的作用,网络由每层两个节点组成向右无限伸延,,t,I,=1,,传染概率,p=2/3,,最左边的两个节点是最初传染者,R,0,是由一个节点造成的新病例数,预期为,4/3 1,每条边不传播疾病的概率为,1/3,,所有四条边都没导致疾病传播的概率为,(1/3),4,于是每一层成为最后一层(疾病传染终止层)的概率至少是,1/81,18,SIR,的静态图示(渗透模型),接触网络每条边预先投掷硬币(按照给定传染概率,p,),投掷硬币成功的边定义为,开放边,;其余的边定义为,阻塞边,利用开放边和阻塞边描述流行病传播过程:最终受感染的节点正是那些能够从最初感染节点沿着在网络中随机选定的,开放边,达到的节点,注意:每次运行结果可能不同,19,图中,粗黑线为开放边,不是所有开放边都起作用(比如,wr,),SIS,流行病模型,SIR,模型只适用于一次患病终身免疫的疾病,SIS,模型描述了更一般的情况:节点结束感染状态后便循环回到敏感状态,并具备再次感染的条件。节点在,S,和,I,两种状态中交替,因此得名,SIS,模型,最初,一些节点处于状态,I,,其余节点处于状态,S,每个进入状态,I,的节点,v,在固定数量的步骤,t,I,期间内具有传染性,在,t,I,期间的每一步,,v,以概率,p,将疾病传染给其所有处在状态,S,的邻居,经过,t,I,步骤后,节点,v,不再具有传染性,返回状态,S,20,敏感,S,感染,I,SIS,流行病模型,SIS,模型,描述为:,21,SIS,流行病模型,SIS,模型的例子:接触网络由,3,个节点组成,,t,I,=1,。可以想象是,3,个人居住的公寓,或三口之家。观察节点,v,感染、恢复、再次感染的过程,22,SIS,模型特点,SIS,模型下的传染病的流行周期比,SIR,模型的要长,具有“刀刃”特点,可以证明,对于特定类型的接触网络,存在特定传染概率,p,,在,p,的门槛值附近,,SIS,传染病在一边表现为“快速消失”,在另一边则会“持续一个很长的时间”,该传染概率门槛值以非常微妙的方式依赖于网络结构,23,SIR,与,SIS,的关系,SIS,模型的一些基本变体可视为,SIR,模型的特例,设,t,I,=1,,将节点,v,在每一个时间步骤视为“不同的个体”,可以将,SIS,模型表示为,SIR,模型,在每个时间点,t=0,、,1,、,2,、,3,,为每个节点分别创建一个节点副本,形成的网络称为,时间扩展接触网络,。对于原网络中,v,连接到,w,的边,在扩展网络中创建,t,时刻,v,的副本到,t+1,时刻,w,的副本的边,24,SIR,与,SIS,的关系,25,SIRS,流行病模型,将,SIR,和,SIS,结合起来,疾病有暂时免疫特性:受感染节点恢复后短暂地经过,R,状态,再回到状态,SSIRS,模型,开始某些节点在,I,状态,其他在,S,状态,进入,I,状态的节点,v,在固定步骤数,t,I,内具有传染性,在,t,I,期间每个步骤,节点,v,将疾病传播给敏感邻居的概率为,p,经过,t,I,步骤后,,v,不再具有传染性,进入状态,R,并在固定步骤数,t,R,期间维持在该状态。在,R,状态,t,R,步骤,后,节点,v,回到,S,状态,26,SIRS,流行病模型,疾病传播过程受量值,p,、,t,I,以及暂时免疫长度,t,R,的影响,同时受到网络结构的影响,27,感染,I,敏感,S,t,I,t,R,隔离,R,SIRS,模型描述为:,SIRS,模型下的同步振荡效应,28,S,T,U,V,W,X,S,I,S,S,S,S,.,R,I,.,.,.,.,S,R,I,.,.,.,.,S,R,I,.,.,.,.,S,R,I,I,.,.,.,.,.,R,I,.,.,.,.,S,R,I,.,.,.,.,S,R,I,.,.,.,.,S,R,I,.,.,.,.,S,R,I,T,S,U,W,X,V,SIRS,模型下的同步振荡效应,Watts,和,Strogatz,论述了小世界特性与同步性的关联,,Kuperman,和,Abramson,展示了这种关联自然地导致流行病的同步和振荡,Marcelo Kuperman,Guillermo Abramson,Small world effect in an epidemiological model,.,Physical Review Letters,2001,86(13):2909-2912,29,SIRS,模型下的同步振荡效应,t,I,=4,,,t,R,=9,N,inf,(0)=0.1,模拟,c=0.01,0.2,0.9,三种情况,30,结论:当弱连接,(远程)边占比例比,较高时,所有节点,被传,染,的,周期,趋于同步。经历被传染,持续相同的时间,进入隔离,之后又同时被传染,SIRS,模型下的同步振荡效应,为什么会有同步震荡?,当,c,较小时:,00.5,,网络呈现较高的有序的聚集特点,疾病周期会在一个局部区域内完成,之后进入免疫期(不活跃期),当,c,值较大时:,0.5,,弱连接打破了有序的聚集区域,刚刚痊愈的个体可能又通过一个弱连接被再次感染。因此整个网络呈现同步状态,31,接触与并发,前面讨论的模型都是以一个相对,静态,的接触网络为基础,其中所有的连接在整个流行病传播过程都存在。这对于传染性较高且传染速度较快的流行病是一个合理的简化假设,这些假设是否适用于那些需要很长时间在人群中传播的疾病?如艾滋病等,32,接触与并发,对于这类疾病,重要的是要考虑到接触是,短暂,的这一事实,将接触网络的每条边注明其存在的时段,此类疾病具有双向传染的特性,采用无向边表示疾病可以从一对伙伴的任一方传染给对方,33,接触与并发,短暂接触的影响,节点,u,在时刻,1,患有疾病,可能传染给通向节点,y,的所有节点,包括中间节点,v,、,w,节点,u,不能将疾病传染给节点,x,:,u,将疾病传染到,w,时,,w,与,x,的伙伴关系已经结束,34,u,v,w,x,y,1,5,7,11,2,6,12,16,接触与并发,短暂接触的影响,将,w-v,和,w-y,伙伴关系的时间参数对换,节点,u,在之前可以将疾病一直传染到节点,y,,对换后,,w-y,的伙伴关系在,u,可能将疾病传染给,w,时就已经结束了,35,u,v,w,x,y,1,5,7,11,2,6,12,16,接触与并发,短暂接触,只掌握接触网络的结构信息是不够的,关系的,时序信息,也相当重要,网络中边对应于特定的时期这种建模方法是许多领域的研究专题,包括社会学、流行病学、数学、计算机科学,不同的接触时机不只是潜在地影响到谁会将疾病传染给谁,这种时序模式还可以,影响流行病,整体的严重性,并发,(concurrency),是特别,被关注和担忧的时序模式,并发性研究是发现接触网络中的关系对应的时间对特定类型模型的影响,36,接触与并发,并发伙伴关系:一个人与多个人有伙伴关系,并且有时间重叠,串行模式通过时间效应把网络不同区域隔开;并行模式却使得带病节点可以将疾病传播到网络任何其他节点,37,u,v,w,1,5,6,10,u,v,w,1,5,2,6,串行伙伴关系,并行伙伴关系,接触与并发,在较大规模网络中,并发效应对疾病的传播作用尤其突出,38,v,w,x,y,1,5,7,11,2,6,12,16,u,v,w,x,y,1,5,1,5,2,6,3,7,u,任何节点没有并行伙伴关系,所有伙伴关系都有时间重叠,一个生物学基因遗传的研究,线粒体夏娃理论:,1987,年,,Rebecca Cann,、,Mark Stoneking,和,Allan Wilson,在,Nature,杂志上发表一篇论文引起轰动,Mitochondrial DNA and human evolution,Nature,325,31-36(01 January 1987),线粒体,DNA,严格按照母系遗传,现代全人类的线粒体,DNA,基本相同,每个人都有一条母系祖先的线索,称为母亲的血统。所有这些血统源自,10,万至,20,万年前(,14,万年)的一个单一女子,很可能是在非洲,她是我们当代所有人的母系祖先,39,相关生物遗传知识,40,脱氧核苷酸,a,基因,b,DNA,c,染色体,d,染色质,特定的脱氧核苷酸序列代表遗传信息,每个基因含多个脱氧核苷酸,具有遗传效应的,DNA,片段,每个,DNA,分子含多个基因,主要载体,每条染色体含有,1,或,2,个,DNA,分子,解旋,高度螺旋化,缩短变粗,基因在染色体上呈直线排列,基本单位,a,b,c,d,相关生物遗传知识,41,染色体,DNA,基因,脱氧核苷酸,染色体是,DNA,的主要载体,每个染色体上有,1,个,DNA,分子(复制前),主要遗传物质,基因是有遗传效应的,DNA,片段,每个,DNA,分子含有许多基因,遗传物质的结构功能单位,基因中脱氧核苷酸的排列顺序,代表遗传信息,每个基因中含有许多脱氧核苷酸,相关生物遗传知识,42,线粒体遗传的网络结构动力学解释,Wright-Fisher,单亲祖先模型:,每一代的人口数量保持在固定的,N,当前一代,N,个个体产生新一代的,N,个个体,每个后代由一个单亲产生,从当前一代中独立地均匀随机选择,这样,当前一代的一个个体可能会有多个孩子,这样,就可以构造一个网络,节点是个体,代际分层,边代表单亲关系,43,线粒体遗传的网络结构动力学解释,每个个体都向上连接到自己的母亲,时间自上向下展开,最底层表示当前有,N,个个体,从底部开始,任何一个个体都可以沿着向上的边追溯他她的单亲血统,能否说明这些边最终将汇聚到一点?,44,线粒体遗传的网络结构动力学解释,简单的概率分析,可以发现当前给定数量的个体在向上追溯单亲祖先的过程中会不断发生汇聚(发现同一个母亲),于是独立的线索越来越少,最终汇聚到一点,这个距当代最近的汇聚点就是,线粒体夏娃,45,基因遗传学的解释,当时肯定同时生活着许多女人(以及男人),只不过她们的线粒体基因没有遗传到现在,不仅是线粒体基因存在这种情形,人的任何一种基因,只要把它们的突变过程追溯得足够远,总能找到一个共同祖先,这些祖先生活的时间可能各不相同,甚至未必是人,有的可能要追溯到人进化出来之前的某个生物,46,Wright-Fisher,单亲祖先模型的意义,可以分析单亲物种的遗传特点,可以分析双亲物种中那些只由单亲遗传的现象,如线粒体,DNA,分析社会继承行为(包括学术继承等),47,Wright-Fisher,单亲祖先模型的意义,上溯到第十代,有多少不同的人是与你有血缘关系的祖辈?,48,魔兽世界中的病毒传播,魔,兽,世界(,World of Warcraft,、,WoW,)是游戏公司,Blizzard Entertainment,所,制作的一款大型多人在线角色扮演,游戏,,2005,年,6,月,6,日正式,商业化运营,2005,年,9,月,魔兽,世界开放,了一些新任务,其中包括杀死一条会传播恶性,传染病,”Corrupted Blood”,的,大,蛇,Hakkar,49,魔兽世界中的病毒传播,根据设计者的本意,只有较高级别的玩家才可能感染瘟疫,而这种玩家一般都实力强大,能够,痊愈,由于管理人员的失误,,,病毒,扩散,到人口密集的“大城市”内,引发大规模混乱,有大约,400,万名玩家,感染,大量,玩家染疾,“死亡”,50,魔兽世界中的病毒传播,51,被疫病感染的铁炉堡,奥格瑞玛白骨累累,魔兽世界中的病毒传播,新泽西拉特格斯大学的,Eric Lofgren,和波士顿塔夫茨大学教授,Nina,Fefferman,The untapped potential of virtual game worlds to shed light on real world epidemics,.,The Lancet infectious diseases,2007,7(9):625-629.,52,魔兽世界中的病毒传播,传染病流行的原因:,感染了疾病的,玩家通过“心灵传输”,的方式突破隔离区进入,城市,玩家拥有,的宠物魔,兽也在传播瘟疫中起到了重要,作用,有一些玩家在好奇心驱使下偷偷进入“疾病隔离区”,结果自己也染上病毒,53,魔兽世界中的病毒传播,对现实世界的启示:,研究游戏中的瘟疫蔓延很有现实意义,,它无疑,是一个提供标本和经验的绝佳,场所,“心灵传输”和宠物存在,于虚拟世界,但游戏中事态的发展趋势也与真实世界有类似之,处,心灵传输,VS,全球交通系统,受感染,的宠物,VS,感染,禽流感但无明显症状,的禽类,病毒在不同物种之间,传播,研究游戏中的瘟疫蔓延,有助于深入解析流行病学所涉及的复杂社会,因素,预测人们面对恶性传染病时的,行为,预测恶性传染病,的传播速度、传播模式,公共疫情应对策略,54,互联网,病毒传播,1,Modeling the spread of active worms,.,Chen Z,Gao L,Kwiat K.,INFOCOM,2003.,22nd,Annual Joint,Conference,of the IEEE Computer and,Communications,.,2003,3:1890-1900.,55,互联网,病毒,传播,1,Modeling,the spread of active worms can help us understand,how active worms,spread,how we can monitor,detect and defend against the propagation of worms,effectively,This paper present a model,referred to as the,Analytical Active Worm Propagation,(,AAWP,)model,which characterizes the propagation of active worms,56,互联网病毒传播,1,Parameters in AAWP,57,Parameters,Notation,Explanation,#of vulnerable machines,N,the number of vulnerable machines,Size of,hitlist,h,the number of infected machines at the beginning of the spread of active worms,Scanning rate,s,the average number of machines scanned by an infected machine per unit time,Death rate,d,the rate at which an infection is detected on a machine and eliminated without patching,Patching rate,p,the rate at which an infected or vulnerable machine becomes invulnerable,互联网病毒传播,1,The AAWP,model,If there are m,i,vulnerable machines(including the infected ones),and n,i,infected computers,then on average,the next time tick will,have,newly,infected machines,where s is the,scanning rate,m,0,=N,n,0,=h,Given death rate d and patching rate p,on the next time tick the number of total infected machines will be,58,互联网病毒传播,1,Effect of Hitlist,Size and,Patching Rate,59,All cases are for 1,000,000 vulnerable machines,a scanning rate of,100 scans/second,and a death rate of 0.001/second,互联网病毒传播,1,The differences between AAWP and Epidemiological,model,The Epidemiological model uses a,continuous,time differential equation,while the AAWP model is based on a,discrete,time,model,The Epidemiological model neither considers the patching rate nor the time that it takes the worm to infect a machine,while the AAWP model does,The AAWP model considers the case that the worm can infect the same destination at the same time,while the,Epidemiological model ignores the case,60,互联网病毒传播,1,Comparing the AAWP Model to the Epidemiological model,61,互联网病毒传播,1,Simulating the Code Red v2 Worm,62,互联网病毒传播,1,Conclusion,The AAWP model used deterministic approximation and gives more realistic,results,An,address space of 2,24,(at least 2,20,)IP addresses is large enough to obtain realistic,results,the AAWP model is used to evaluate the,performance of,a simple sensor detection,system,the AAWP model is used to,evaluate the,performance of the LaBrea tool defense system,63,互联网,病毒传播,2,Internet quarantine:Requirements for containing self-propagating,code,.,Moore,D,Shannon C,Voelker G M,et al.,INFOCOM,2003.,22nd,Annual Joint,Conference,of the IEEE Computer and,Communications,.,2003,3:1901-1910.,64,互联网病毒传播,2,Background,Outbreak,On July 19th,2001,a self-propagating program,or worm called Code-Red v2 was released into the,Internet,The,speed,Over,14,hours,the worm infected almost 360,000 hosts,reaching an incidence of 2,000 hosts per minute before,peaking,Damage:,severe,The direct costs of recovering from this epidemic(including subsequent strains of Code-Red)have been estimated in excess of$2.6,billion,65,互联网病毒传播,2,Three,methods,Prevention,Treatment,Containment,E.g.firewall,filters,Containment is used to protect individual networks,and isolate infected,hosts,Containment is the most viable of these,strategies,there is hope that containment can be completely,automated,since containment can potentially be deployed in the network,(without,requiring universal deployment on every Internet,host),66,互联网病毒传播,2,Modeling,Worms,SI epidemic model,67,where T is a constant,互联网病毒传播,2,The simulated propagation of Code-Red-like worms,68,互联网病毒传播,2,Modeling Containment,Systems,Reaction,time,To include the time necessary for detection of malicious,activity,The time required to activate any containment strategy once this information has been,received,Containment,strategy,Address blacklisting,Content,filtering,Deployment,Scenarios,Practically,a global deployment is impossible.,Ideally,a global deployment is preferable.,May be deploying at the border of ISP,networks,69,互联网病毒传播,2,the effectiveness of the containment strategy as a,function of the reaction,time,70,To contain worms to 10%of vulnerable hosts after 24 hours of spreading at 10 probes/sec(Code Red):,Address blacklisting:reaction time must be 25,minutes,Content filtering:reaction time must be 3 hours,Result,:content filtering is more effective,互联网病毒传播,2,the relationship be-tween containment effectiveness and worm aggressiveness,71,Figures are in log-log,scale,address,blacklisting continues to require a significantly larger reaction time than content,filtering,highly aggressive worms require extremely challenging,reaction times,even for content filtering containment systems,互联网病毒传播,2,Deployment Scenarios,72,Difference,in performance,because,of,the difference,in,path coverage,Code-Red,like worm,互联网病毒传播,2,Conclusion,Reaction,time,require the system to activate filtering mechanisms,within minutes,of the start of an,epidemic,Containment,strategy,content,filtering is,significantly more,effective than address,blacklisting,Deployment,scenarios,cooperation and coordination among,ISPs will,need to be extensive,73,在线社会网络中的信息传播,背景,社会网络中的信息传播,或谣言,传播是,社会通信的,一种,重要形式,在,各种人类,事务中扮演重要,角色,准确地描述谣言的传播过程,可以有效地促进有益,消息的扩散,,抑制有害信息的传播或,爆发,谣言可以理解为一,种“思想的传染”,,但与传染病不同的是,谣言,传播,的定量模型和考察有更多的,限制,传染病传播模型和谣言传播模型,都基于,平均,场(,mean-field,),理论,74,在线社会网络中的信息传播,信息传播模型,在线社会,网络,G=(V,E,),,,其中,为,V,用户,集合,,,E,为,用户的好友,关系集合,用户分为,3,类,:,无知,者,i,传播者,s,沉默者,o,和,r,,其密度分别为,i(t),s(t),o(t,),r(t),传播,机制,无知者以,概率,获知,信息,I,获知信息,I,的无知者以,概率,转发,该信息,变为传播者,而以,概率,1-,变为,沉默,者,传播者以,概率,(,自发地)变为沉默者,75,在线社会网络中的信息传播,信息传播模型的平均场方程,76,在线社会网络中的信息传播,不相关无标度网络,77,网络规模,N=10000,幂,指数分别为,2.5,3.5,5,最小度,m=1,=1,0.01,1,=0.3,步长为,0.01,幂指数越小,网络非均匀性越大,信息传播范围越广,幂指数,越大,网络均匀性,越大,,网络结构倾向于随机结构,信息,传播范围,越小,在线社会网络中的信息传播,不相关无标度网络,78,幂指数越小,,网络结构越不均匀,沉默者的密度达到稳定值(最大值)的时间越早,传播者的,密度,达到峰值的时间也越早,信息传播达到稳态的速度越快,幂指数越大,网络,的结构,越均匀,沉默者的密度达到稳定值(最大值)的时间越晚,传播者的密度,达到,峰值的时间也越晚,信息传播达到稳态的速度越慢,79,在线社会网络中的信息传播,不相关无标度网络,=0.5,=0.5,随着,的,增加,信息传播的范围更广,在线社会网络中的信息传播,相关,无标度,网络,80,幂指数为,3,=0.5,=0.5,=0.3,随着,的,增加,沉默者的最终比例逐渐下降,这说,明度的,正相关性减小了信息的传播范围,81,在线社会网络中的信息传播,相关,无标度网络,度的正相关性不仅减小了信息,的传播,范围,同时也降低了信息的传播速度,导致在正相关网络中,传播者密度,达到,最大值、沉默者密度达到稳态值的时间都较晚,在线社会网络中的信息,传播,-,结论,信息在异,质,网络中的传播,范围更大,,传播速度也,更,快,模型参数,和对信息的传播起促进作用,,而,对,信息,的传播,起,抑制作用,当,较小,时,幂指数对信息传播的影响较显著,,当,增大,时,幂,指数的,影响,逐渐,减弱最终被,覆盖,在网络结构一定的情况下,,参数,决定,了信息传播的,范围,网络的正相关性抑制了信息的传播(传播范围和传播速度),82,小结,疾病传染的简单网络模型:,分支结构、,SIR,、,SIS,、,SIRS,不同模型下的不同现象与问题,介绍了传染病模型在生物遗传中的应用,介绍,了虚拟世界中传染病传播的实例,介绍,了互联网病毒传播、信息传播等,3,个实际工作,83,深度学习:分支过程与合并过程,分支,过程,流行病在简单接触网络结构中的传播过程,被感染的个体遇到,k,个其他人,并以概率,p,传染,新,的病体数为,R,0,=pk,,即基本再生数,证明,If,R,0,1,then,q,*,0,q,*,为持续概率,q,n,的极值,方法,分,步证明:考虑树结构中每一层受感染个体数的期望值,84,分支过程,感染个体数的期望值,第,n,层的个体总数为,k,n,设随机变量,X,n,表示第,n,层受感染的个体数,j,表示第,n,层的不同个体,随机变量,Y,nj,当,j,受感染时为,1,,否则为,0,,则有,显然,m=k,n,,又,Y,nj,的期望值正好是个体,j,受感染的概率,85,分支过程,感染个体数的期望值,第,n,层个体,j,受感染的前提是,从根到,j,的,n,个接触节点都成功向下层传递了疾病,节点以独立概率,p,传播疾病,则,EY,nj,=p,n,,则,86,分支过程,由,期望值推导持续概率,对期望值进行如下定义:,等式右边等价于,则有,EXn,至少不比第一项小,而第一项正是,q,n,,即,又,可,得,R,0,1,then q,*,0,需要利用,q,n,的公式确定,q,*,的精确值,87,分支过程,q,n,的公式,q,n,的取值取决于三个量值,每个个体接触节点数,k,传染概率,p,树结构的层数,n,考虑事件,(*),(*),疾病通过根的第一个接触节点,j,传播,并继续传播到,j,可能达到的部分,可,推得,事件,(*),发生的概率为,pq,n-1,,不发生的概率为,1-,pq,n-1,,,则,所有节点都不发生该过程的概率为,(1-pq,n-1,),k,88,分支过程,q,n,的公式,又所有节点都不发生该过程的概率也为,1-,q,n,,则有,1-q,n,=,(,1-pq,n-1,),k,q,n,=1-,(,1-pq,n-1
展开阅读全文