收藏 分销(赏)

马尔可夫链的概念及转移概率.doc

上传人:精*** 文档编号:1337499 上传时间:2024-04-23 格式:DOC 页数:12 大小:79.04KB 下载积分:8 金币
下载 相关 举报
马尔可夫链的概念及转移概率.doc_第1页
第1页 / 共12页
马尔可夫链的概念及转移概率.doc_第2页
第2页 / 共12页


点击查看更多>>
资源描述
第四章 4.1 马尔可夫链的的概念及转移概率 一、知识回顾 二、马尔可夫链的的定义 三、转移概率 四、马尔可夫链的一些简单例子 五、总结 一、知识回顾 1. 条件概率 定义:设A,B为两个事件,且P(A)>0,称 PBA=P(AB)P(A) 为事件A发生条件下B事件发生的条件概率。 将条件概率公式移项即得到所谓的乘法公式: PAB=P(A)P(B|A) 2.全概率公式 设试验E的样本空间为S,A为E的事件,若B1,B2,⋯,Bn为S的一个完备事件组,既满足条件: 1). B1,B2,⋯,Bn两两互不相容,即BiBj=∅,i≠j,i,j=1,2,⋯,n 2). B1∪B2∪⋯∪Bn=S,且有PBi>0,i=1,2,⋯,n,则 PA=i=1nPBiPA|Bi 此式称为全概率公式。 3.矩阵乘法 矩阵乘法的定义 A=a11a12a13a21a22a23,B=b11b12b21b22b31b32C=c11c12c21c22 如果c11=a11×b11+a12×b21+a13×b31 c12=a11×b12+a12×b22+a13×b32 c21=a21×b11+a22×b21+a23×b31 c22=a21×b12+a22×b22+a23×b32 那么矩阵C叫做矩阵A和B的乘积,记作C=AB 4.马尔可夫过程的分类 马尔可夫过程按其状态和时间参数是连续的或离散的,可分为三类: (1) 时间、状态都是离散的马尔科夫过程,称为马尔可夫链; (2) 时间连续、状态离散的马尔科夫过程称为连续时间的马尔可夫链的; (3) 时间、状态都连续的马尔科夫过程。 二、马尔科夫链的定义 定义4.1 设有随机过程{Xn,n∈T},若对于任意的整数n∈T和任意的i0,i1,…,in+1∈I,条件概率都满足 P{Xn+1=in+1|X0=i0,X1=i1,…,Xn=in} =P{Xn+1=in+1|Xn=in} (4.1.1) 则称{Xn,n∈T}为马尔科夫链,简称马氏链。 式(4.1.1)即为马氏链,他表明在状态X(0)=i0,X(1)=i1,…X(n)=in已知的条件下,X(n+1)=j的条件概率与X(0)=i0,X(1)=i1,…X(n-1)=in-1无关,而仅与X(n)所处的状态in有关。 式(4.1.1)是马尔科夫链的马氏性(或无后效性)的数学表达式。由定义知 P{X0=i0,X1=i1,…,Xn=in} =PXn=inX0=i0,X1=i1,…,Xn-1=in-1 ∙P{X0=i0,X1=i1,…,Xn-1=in-1} =PXn=inXn-1=in-1 PX0=i0,X1=i1,…,Xn-1=in-1=… =PX1=i1X0=i0P{X0=i0} 可见,马尔科夫链的统计特性完全由条件概率 P{Xn+1=in+1|Xn=in} 所决定。如何确定这个条件概率,是马尔科夫链理论和应用中的重要问题之一。 现举一例说明上述概念: 例4.1.1 箱中装有c个白球和d个黑球,每次从箱子中任取一球,抽出的球要到从箱子中再抽出一球后才放回箱中,每抽出一球作为一次取样试验。 现引进随机变量序列为{Xn,n=1,2,⋯},每次取样试验的所有可能结果只有两个,即白球或黑球。若以数a1代表白球,以数a2代表黑球则有 Xn=a1,第n次抽球结果为白球a2,第n次抽球结果为黑球 由上所述的抽球规则可知,任意第n次抽到黑球或白球的概率只与第n-1次抽得球的结果有关,而与第n-2次,第n-3次,⋯,第1次,抽的球的结果无关, 由此可知上述随机变量序列{Xn,n=1,2,⋯},为马氏链。 三、转移概率 定义4.2 称条件概率 pijn=P{Xn+1=j|Xn=i} 为马尔科夫链{Xn,n∈T}在时刻N的一步转移概率,其中i,j∈T,简称为转移概率。 条件概率pijn:随机游动的质点在时刻n处于状态i的条件下,下一步转移到状态j的你改率。 一般地,转移概率pijn不仅与状态i,j有关,而且与时刻n有关。当pijn不依赖与时刻n时,表示马尔科夫链具有平稳转移概率。 定义4.3 若对任意的i,j∈T,马尔科夫链{Xn,n∈T}的转移概率pijn与n无关则称马尔科夫链是齐次的,并记pijn为pij。 下面我们只讨论齐次马尔科夫链通常将“齐次”两个字省略。 设P表示一步转移概率pij所组成的矩阵,且状态空间I={1,2,…},则 P=p11p12…p21p22………… p1n…p2n……… 称为系统状态的一步转移概率矩阵。它具有性质: (1) pij≥0,i,j∈I; (2) j∈Tpij=1,i∈I. (2)式中对j求和是对状态空间I的所有可能状态进行的,此性质说明一步转移概率矩阵中任一行元素之和为1.通常称满足上述(1)、(2)性质的矩阵为随机矩阵。 定义4.4 称条件概率 pij(n)=PXm+n=jXm=i, i,j∈I, m≥0, n≥1 为马尔科夫链{Xn,n∈T}的n步转移概率,并称 P(n)=(pij(n)) 为马尔科夫链的n步转移矩阵,其中pijn≥0,j∈Tpijn=1,即P(n)也是随机矩阵。 当n=1是,pij(1)=pij,此时一步转移矩阵P(1)=P. 此外我们规定 pij0=0,i≠j,1,i=j. 定理4.1 设{Xn,n∈T}为马尔科夫链,则对任意整数n≥0,0≤l<n和i,j∈T,n步转移概率pij(n)具有下列性质: (1) pij(n)=k∈Ipiklpkjn-l; (2) pij(n)=k1∈I…kn-1∈Ipik1pk1k2…pkn-1j; (3) P(n)=PP(n-1); (4) P(n)=Pn. 证 (1)利用全概率公式及马尔科夫性,有 pij(n)=P{Xm+n=j|Xm=i}=P{Xm=i,Xm+n=j}P{Xm=i} =k∈IP{Xm=i,Xm+l=k,Xm+n=j}P{Xm=i,Xm+l=k}∙P{Xm+l=k|Xm=i} =k∈Ipkjn-lpikl(m)=k∈Ipiklpkjn-l (2)在(1)中令l=1,k=k1得 pij(n)=k∈Ipik1pk1jn-l; 这是一个递推公式,故可递推得到 pij(n)=k1∈I…kn-1∈Ipik1pk1k2…pkn-1j; (3)在(1)中令l=1,利用矩阵乘法可证。 (4)由(3),利用归纳法可证。 定理4.1中(1)式称为切普曼——柯尔莫哥洛夫方程,简称C-K方程。它在马尔科夫链的转移概率的计算中起着重要的作用。(2)式说明n步转移概率完全由一步转移概率决定。(4)式说明齐次马尔科夫链的n步转移概率矩阵是一步转移概率矩阵的n次乘方。 定义4.5 设{Xn,n∈T}为马尔科夫链,称 pj=P{X0=j}和pjn=pXn=j,(j∈I) 为{Xn,n∈T}的初始概率和绝对概率,并分别成{pj,j∈I}和{pj(n),j∈I}为{Xn,n∈T}的初始分布和绝对分布,简记为{pj}和{pjn}。称概率向量 PTn=(p1n,p2n,…) 为n时刻的绝对概率向量,而称 PT0=(p1,p2,…) 为初始概率 定理4.2 设{Xn,n∈T}为马尔科夫链,则对任意j∈I和n≥1,绝对概率pj(n)具有下列性质: (1)pjn=i∈Ipipij(n); (2)pjn=i∈Ipi(n-1)pij; (3)PTn=PT(0)P(n); (4)PTn=PT(n-1)P. 证 (1) pjn=PXn=j=i∈IPX0=i, Xn=j =i∈IPXn=j|X0=iPX0=i=i∈Ipipij(n) (2)pjn=PXn=j=i∈IPXn=j, Xn-1=i =i∈IPXn=j| Xn-1=iPXn-1=i =i∈Ipi(n-1)pij (3)与(4)中式是(1)与(2)中式的矩阵乘积形式,显然成立。证毕。 定理4.3 设{Xn,n∈T}为马尔科夫链,则对任意i1,…in∈I和n≥1,有 PX1=i1,…,Xn=in=i∈Ipipii1…pin-1in 证由全概率公式及马氏性质有 PX1=i1,⋯,Xn=in=Pi∈IX0=i, X1=i1,⋯,Xn=in =i∈IPX0=i, X1=i1,⋯,Xn=in =i∈IPX0=iPX1=i1X0=i⋯ ∙PXn=in|X0=i, ⋯,Xn-1=in-1 =i∈IPX0=iPX1=i1X0=i⋯ PXn=in|Xn-1=in-1 =i∈Ipipii1⋯pin-1in 证毕 一、 马尔可夫链的的一些简单例子 马尔科夫链在研究质点的随机运动、自动控制、通信技术、生物工程、经济管理等领域中有着广泛的应用。 例4.1 无限制随机游动 设质点在数轴上移动,每次移动一格,向右移动的概率为p,向左移动的概率为q=1-p,这种运动称为无限制随机游动。以Xn表示时刻n质点所处的位置,则{Xn,n∈T}是一个齐次马尔科夫链,试写出它的一步和k步转移概率。 解 显然{Xn,n∈T}的状态空间I={0,±1,±2,…},其一步转移概率矩阵为 P=………q ……0p ……0……0…… q0…… p……… 设在第k不转移中向右移了x步,向左移了y步,且经过k步转移状态从i进入j,则 x+y=k,x-y=j-i, 从而 x=k+(j-i)2,y=k-(j-i)2. 由于x,y都只能取整数,所以k±(j-i)必须是偶数。又在k步中哪x步向右,哪y步向左是任意的,选取的方法有ckx种。于是 pij(k)=ckxpxqy,k+j-i为偶数0,k+j-i为奇数。 例4.2 赌徒输光问题 两赌徒甲、乙一系列赌博。赌徒甲有a元。赌徒乙有b元,每赌一局输者给赢者1元,没有和局,直到两人中有一个输光为止。设在每一局中,甲赢的概率为p,输的概率为q=1-p,求甲输光的概率。 这个实质上是带有两个吸收壁的随机游动,其状态空间I={0,1,2,…,c},c=a+b.故现在的问题是求质点从a点出发到达0状态先于到达c状态的概率. 解 设ui表示甲从状态i出发转移到状态0的概率,我们要计算的就是ua。由于0和c是吸收状态,故 u0=1,uc=0. 由全概率公式 ui=pui+1+qui-1,i=1,2,…c-1. (3.1) 上式的含义是,甲从有i元开始赌到输光的概率等于“他接下去赢了一局(概率为p),处于状态i+1后再输光”;和“他接下去输了一局(概率为q),处于状态i-1后再输光”这两个事件的和事件的概率。 由于p+q=1,(3.1)式实质上是一个差分方程 ui+1-ui=rui-ui-1,i=1,2,…,c-1, (3.2) 其中r=qp,其边界条件为 u0=1,uc=0. (3.3) 先讨论r=1,即p=q=12的情况,此时(3.2)为 ui+1-ui=ui-ui-1, 令i=1,2,…,c-1,u1=u0+a,得 u2=u1+a=u0+2a, … ui=ui-1+a=u0+ia, … uc=uc-1+a=u0+ca. 将u0=1,uc=0代入最后一式,得参数 a=-1c, 所以ui=1-ic,i=1,2,…,c-1. 令i=a,求得甲输光的概率为ui=1-ac=ba+b. 上述结果表明,在p=q情况下(即甲、乙每局比赛中输赢是等可能的情况下),甲输光的概率与乙的赌本b成正比,即赌本小者输光的可能性大。 由于甲、乙的地位是对称的,故乙输光的概率为 ub=aa+b. 由于ua+ub=1,表明甲、乙中必有一人要输光,赌博迟早要结束。 再讨论r≠1,即p≠q的情况。由(3.2)式得 uc-uk=i=kc-1r(ui-ui-1)=i=kc-1riu1-u0 =u1-1rk-rc1-r. (4.14) 令k=0,由于uc=0,有 1=1-u11-rc1-r 即 1-u1=1-r1-rc 代入(3.4)式,得 ua=rk-rc1-rc,k=1,2,…,c-1. 令k=a,的甲输光的概率 ua=ra-rc1-rc 由对称性,乙输光的概率为(r1=p/q) ub=r1b-r1c1-r1c 由于ua+ub=1,因此在r≠1时,即p≠q时两个人中也总有一个人要输光的。 例4.3 天气预报有问题 设昨日、今日都下雨,明日有雨的概率为0.7;昨日无雨,今日有雨,明日有雨的概率为0.5;昨日有雨、今日无雨,明日有雨的概率为0.4;昨日、今日均无雨,明日有雨的概率为0.2.若星期一、星期二均下雨,求星期四下雨的概率。 解 设昨日,今日连续两天有雨称为状态0(RR);昨日无雨,今日有雨称为状态1(NR);昨日有雨,今日无雨称为状态2(RN);昨日,今日无雨称为状态3(NN);。由于天气预报模型可看作一个四状态的马尔可夫链,其转移概率为 p00=PR今R明R昨R今}=P{连续三天有雨} =PR明R昨R今}=0.7, p01=PN今R明R昨R今}=0(不可能事件), p02=PR今N明R昨R今}=PN明R昨R今}=1-0.7=0.3, p03=PN今N明R昨R今}=0(不可能事件), 其中R代表有雨,N代表无雨。类似的可以得到所有状态的一步转移概率。于是它的一步转移概率矩阵为 P=p00p01p10p11p02p03p12p13p20p21p30p31p22p23p32p33=0.700.500.300.5000.400.200.600.8 其两步转移概率矩阵为: P(2)=PP=0.700.500.300.5000.400.200.600.80.700.500.300.5000.400.200.600.8=0.490.120.350.200.210.180.150.300.200.120.100.160.200.480.100.64 由于星期四下雨意味着过程所处的状态为0或1,因此星期一,星期二连续下雨,星期四又下雨的概率为 P=p00(2)+p01(2)=0.49+0.12=0.61 例4.4 设质点在线段[1,4]上作随机游动,假设它只能在时刻n∈T发生移动,且只能停留在1,2,3,4点上。当质点转移到2,3点时,它以13的概率向左或向右移动一格,或停留在原处。当质点移动到点1时,它以概率1停留在原处。当质点移动到点4时,它以概率1移动到点3。若以Xn表示质点在时刻n所处的位置,则{Xn,n∈T}是一个齐次马尔科夫链,其转移概率矩阵为 P=101313 0013001300 131310 各状态之间的转移关系及相应的转移概率如图所示。 例中的点1称为吸收壁,即质点一旦到达这种状态后就被吸收住了,不再移动;点4称为反射壁,即质点一旦到达这种状态后,必然被反射出去。 例4.5 生灭链。观察某种生物群体,以Xn表示在时刻n群体的数目,设为i个数量单位,如在时刻n+1增生到i+1个数量单位的概率为bi,减灭到i-1个数量单位的概率为ai,保持不变的概率为ri=1-(ai+bi),则{Xn,n≥0}为齐次马尔科夫链,I={0,1,2,…},其转移概率为 pij=bi,j=i+1,ri,i=j,ai,j=i-1. (a0=0),称此马尔科夫链为生灭链。 总结
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服