1、 第四章 4.1 马尔可夫链的的概念及转移概率 一、知识回顾 二、马尔可夫链的的定义 三、转移概率 四、马尔可夫链的一些简单例子 五、总结 一、知识回顾 1. 条件概率 定义:设A,B为两个事件,且P(A)>0,称 PBA=P(AB)P(A) 为事件A发生条件下B事件发生的条件概率。 将条件概率公式移项即得到所谓的乘法公式: PAB=P(A)P(B|A) 2.全概率公式 设试验E的样本空间为S,A为E的事件,若B1,B2,⋯,Bn为S的一个完备事件组,既满足条件: 1). B1,B2,⋯,Bn两两互不相容,即BiBj=∅,i≠j,i,j=1,2,⋯,n
2、2). B1∪B2∪⋯∪Bn=S,且有PBi>0,i=1,2,⋯,n,则 PA=i=1nPBiPA|Bi 此式称为全概率公式。 3.矩阵乘法 矩阵乘法的定义 A=a11a12a13a21a22a23,B=b11b12b21b22b31b32C=c11c12c21c22 如果c11=a11×b11+a12×b21+a13×b31 c12=a11×b12+a12×b22+a13×b32 c21=a21×b11+a22×b21+a23×b31 c22=a21×b12+a22×b22+a23×b32 那么矩阵C叫做矩
3、阵A和B的乘积,记作C=AB 4.马尔可夫过程的分类 马尔可夫过程按其状态和时间参数是连续的或离散的,可分为三类: (1) 时间、状态都是离散的马尔科夫过程,称为马尔可夫链; (2) 时间连续、状态离散的马尔科夫过程称为连续时间的马尔可夫链的; (3) 时间、状态都连续的马尔科夫过程。 二、马尔科夫链的定义 定义4.1 设有随机过程{Xn,n∈T},若对于任意的整数n∈T和任意的i0,i1,…,in+1∈I,条件概率都满足 P{Xn+1=in+1|X0=i0,X1=i1,…,Xn=in} =P{Xn+1=in+1|Xn=in} (4.1.1)
4、 则称{Xn,n∈T}为马尔科夫链,简称马氏链。 式(4.1.1)即为马氏链,他表明在状态X(0)=i0,X(1)=i1,…X(n)=in已知的条件下,X(n+1)=j的条件概率与X(0)=i0,X(1)=i1,…X(n-1)=in-1无关,而仅与X(n)所处的状态in有关。 式(4.1.1)是马尔科夫链的马氏性(或无后效性)的数学表达式。由定义知 P{X0=i0,X1=i1,…,Xn=in} =PXn=inX0=i0,X1=i1,…,Xn-1=in-1 ∙P{X0=i0,X1=i1,…,Xn-1=in-1} =PX
5、n=inXn-1=in-1 PX0=i0,X1=i1,…,Xn-1=in-1=… =PX1=i1X0=i0P{X0=i0} 可见,马尔科夫链的统计特性完全由条件概率 P{Xn+1=in+1|Xn=in} 所决定。如何确定这个条件概率,是马尔科夫链理论和应用中的重要问题之一。 现举一例说明上述概念: 例4.1.1 箱中装有c个白球和d个黑球,每次从箱子中任取一球,抽出的球要到从箱子中再抽出一球后才放回箱中,每抽出一球作为一次取样试验。 现引进随机变量序列为{Xn,n=1,2,⋯},每次取样试验的所有可能结果只有两个,即白球或黑球。若以数a1代表白球,以数a2代表黑球
6、则有 Xn=a1,第n次抽球结果为白球a2,第n次抽球结果为黑球 由上所述的抽球规则可知,任意第n次抽到黑球或白球的概率只与第n-1次抽得球的结果有关,而与第n-2次,第n-3次,⋯,第1次,抽的球的结果无关, 由此可知上述随机变量序列{Xn,n=1,2,⋯},为马氏链。 三、转移概率 定义4.2 称条件概率 pijn=P{Xn+1=j|Xn=i} 为马尔科夫链{Xn,n∈T}在时刻N的一步转移概率,其中i,j∈T,简称为转移概率。 条件概率pijn:随机游动的质点在时刻n处于状态i的条件下,下一步转移到状态j的你改率。 一般地,转移概率pijn不仅与状
7、态i,j有关,而且与时刻n有关。当pijn不依赖与时刻n时,表示马尔科夫链具有平稳转移概率。 定义4.3 若对任意的i,j∈T,马尔科夫链{Xn,n∈T}的转移概率pijn与n无关则称马尔科夫链是齐次的,并记pijn为pij。 下面我们只讨论齐次马尔科夫链通常将“齐次”两个字省略。 设P表示一步转移概率pij所组成的矩阵,且状态空间I={1,2,…},则 P=p11p12…p21p22………… p1n…p2n……… 称为系统状态的一步转移概率矩阵。它具有性质: (1) pij≥0,i,j∈I; (2) j∈Tpij=1,i∈I. (2)式中对j求和是对状态空
8、间I的所有可能状态进行的,此性质说明一步转移概率矩阵中任一行元素之和为1.通常称满足上述(1)、(2)性质的矩阵为随机矩阵。 定义4.4 称条件概率 pij(n)=PXm+n=jXm=i, i,j∈I, m≥0, n≥1 为马尔科夫链{Xn,n∈T}的n步转移概率,并称 P(n)=(pij(n)) 为马尔科夫链的n步转移矩阵,其中pijn≥0,j∈Tpijn=1,即P(n)也是随机矩阵。 当n=1是,pij(1)=pij,此时一步转移矩阵P(1)=P. 此外我们规定 pij0=0,i≠j,1,i=j. 定理4.1 设{Xn,n∈T}为马尔科夫链,则对任意整数n≥0
9、0≤l 10、l=1,k=k1得
pij(n)=k∈Ipik1pk1jn-l;
这是一个递推公式,故可递推得到
pij(n)=k1∈I…kn-1∈Ipik1pk1k2…pkn-1j;
(3)在(1)中令l=1,利用矩阵乘法可证。
(4)由(3),利用归纳法可证。
定理4.1中(1)式称为切普曼——柯尔莫哥洛夫方程,简称C-K方程。它在马尔科夫链的转移概率的计算中起着重要的作用。(2)式说明n步转移概率完全由一步转移概率决定。(4)式说明齐次马尔科夫链的n步转移概率矩阵是一步转移概率矩阵的n次乘方。
定义4.5 设{Xn,n∈T}为马尔科夫链,称
pj=P{X0=j}和pjn=pXn=j, 11、j∈I)
为{Xn,n∈T}的初始概率和绝对概率,并分别成{pj,j∈I}和{pj(n),j∈I}为{Xn,n∈T}的初始分布和绝对分布,简记为{pj}和{pjn}。称概率向量
PTn=(p1n,p2n,…)
为n时刻的绝对概率向量,而称
PT0=(p1,p2,…)
为初始概率
定理4.2 设{Xn,n∈T}为马尔科夫链,则对任意j∈I和n≥1,绝对概率pj(n)具有下列性质:
(1)pjn=i∈Ipipij(n);
(2)pjn=i∈Ipi(n-1)pij;
(3)PTn=PT(0)P(n);
(4)PTn=PT(n-1)P.
证 (1) pjn=PXn=j= 12、i∈IPX0=i, Xn=j
=i∈IPXn=j|X0=iPX0=i=i∈Ipipij(n)
(2)pjn=PXn=j=i∈IPXn=j, Xn-1=i
=i∈IPXn=j| Xn-1=iPXn-1=i
=i∈Ipi(n-1)pij
(3)与(4)中式是(1)与(2)中式的矩阵乘积形式,显然成立。证毕。
定理4.3 设{Xn,n∈T}为马尔科夫链,则对任意i1,…in∈I和n≥1,有
PX1=i1,…,Xn=in=i∈Ipipii1…pin-1in
证由全概率公式及马氏性质有
PX1=i1,⋯,Xn 13、in=Pi∈IX0=i, X1=i1,⋯,Xn=in
=i∈IPX0=i, X1=i1,⋯,Xn=in
=i∈IPX0=iPX1=i1X0=i⋯
∙PXn=in|X0=i, ⋯,Xn-1=in-1
=i∈IPX0=iPX1=i1X0=i⋯
PXn=in|Xn-1=in-1
=i∈Ipipii1⋯pin-1in
证毕
一、 马尔可夫链的的一些简单例子
马尔科夫链在研究质点的随机运动、自动控制、通信技术、生物工程、经济管理等领域中有着广泛的应用。
例4.1 无限制随机游动
设 14、质点在数轴上移动,每次移动一格,向右移动的概率为p,向左移动的概率为q=1-p,这种运动称为无限制随机游动。以Xn表示时刻n质点所处的位置,则{Xn,n∈T}是一个齐次马尔科夫链,试写出它的一步和k步转移概率。
解 显然{Xn,n∈T}的状态空间I={0,±1,±2,…},其一步转移概率矩阵为
P=………q ……0p ……0……0…… q0…… p………
设在第k不转移中向右移了x步,向左移了y步,且经过k步转移状态从i进入j,则
x+y=k,x-y=j-i,
从而
x=k+(j-i)2,y=k-(j-i)2.
由于x,y都只能取整数,所以k± 15、j-i)必须是偶数。又在k步中哪x步向右,哪y步向左是任意的,选取的方法有ckx种。于是
pij(k)=ckxpxqy,k+j-i为偶数0,k+j-i为奇数。
例4.2 赌徒输光问题
两赌徒甲、乙一系列赌博。赌徒甲有a元。赌徒乙有b元,每赌一局输者给赢者1元,没有和局,直到两人中有一个输光为止。设在每一局中,甲赢的概率为p,输的概率为q=1-p,求甲输光的概率。
这个实质上是带有两个吸收壁的随机游动,其状态空间I={0,1,2,…,c},c=a+b.故现在的问题是求质点从a点出发到达0状态先于到达c状态的概率.
解 设ui表示甲从状态i出发转移到状态0的概率,我们要计算的就 16、是ua。由于0和c是吸收状态,故
u0=1,uc=0.
由全概率公式
ui=pui+1+qui-1,i=1,2,…c-1. (3.1)
上式的含义是,甲从有i元开始赌到输光的概率等于“他接下去赢了一局(概率为p),处于状态i+1后再输光”;和“他接下去输了一局(概率为q),处于状态i-1后再输光”这两个事件的和事件的概率。
由于p+q=1,(3.1)式实质上是一个差分方程
ui+1-ui=rui-ui-1,i=1,2,…,c-1, (3.2)
其中r=qp,其边界条件为
u0=1,uc=0. (3.3)
先讨论r=1 17、即p=q=12的情况,此时(3.2)为
ui+1-ui=ui-ui-1,
令i=1,2,…,c-1,u1=u0+a,得
u2=u1+a=u0+2a,
…
ui=ui-1+a=u0+ia,
…
uc=uc-1+a=u0+ca.
将u0=1,uc=0代入最后一式,得参数
a=-1c,
所以ui=1-ic,i=1,2,…,c-1.
令i=a,求得甲输光的概率为ui=1-ac=ba+b.
上述结果表明,在p=q情况下(即甲、乙每局比赛中输赢是等可能的情况下),甲输光的概率与乙的赌本b成正比,即赌本小者输光的可能性大。
由于甲、乙的地位是对称的,故乙输光的概率为
ub=aa 18、b.
由于ua+ub=1,表明甲、乙中必有一人要输光,赌博迟早要结束。
再讨论r≠1,即p≠q的情况。由(3.2)式得
uc-uk=i=kc-1r(ui-ui-1)=i=kc-1riu1-u0
=u1-1rk-rc1-r. (4.14)
令k=0,由于uc=0,有
1=1-u11-rc1-r
即 1-u1=1-r1-rc
代入(3.4)式,得
ua=rk-rc1-rc,k=1,2,…,c-1.
19、令k=a,的甲输光的概率
ua=ra-rc1-rc
由对称性,乙输光的概率为(r1=p/q)
ub=r1b-r1c1-r1c
由于ua+ub=1,因此在r≠1时,即p≠q时两个人中也总有一个人要输光的。
例4.3 天气预报有问题
设昨日、今日都下雨,明日有雨的概率为0.7;昨日无雨,今日有雨,明日有雨的概率为0.5;昨日有雨、今日无雨,明日有雨的概率为0.4;昨日、今日均无雨,明日有雨的概率为0.2.若星期一、星期二均下雨,求星期四下雨的概率。
解 设昨日,今日连续两天有雨称为状态0(RR);昨日无雨,今日有雨称为状态1(NR);昨日有雨,今日无雨称为状态2(RN);昨日 20、今日无雨称为状态3(NN);。由于天气预报模型可看作一个四状态的马尔可夫链,其转移概率为
p00=PR今R明R昨R今}=P{连续三天有雨}
=PR明R昨R今}=0.7,
p01=PN今R明R昨R今}=0(不可能事件),
p02=PR今N明R昨R今}=PN明R昨R今}=1-0.7=0.3,
p03=PN今N明R昨R今}=0(不可能事件),
其中R代表有雨,N代表无雨。类似的可以得到所有状态的一步转移概率。于是它的一步转移概率矩阵为
P=p00p01p10p11p02p03p12p13p20p21p30p31p22p23p32p33=0.700.500.300.5000.400.2 21、00.600.8
其两步转移概率矩阵为:
P(2)=PP=0.700.500.300.5000.400.200.600.80.700.500.300.5000.400.200.600.8=0.490.120.350.200.210.180.150.300.200.120.100.160.200.480.100.64
由于星期四下雨意味着过程所处的状态为0或1,因此星期一,星期二连续下雨,星期四又下雨的概率为
P=p00(2)+p01(2)=0.49+0.12=0.61
例4.4 设质点在线段[1,4]上作随机游动,假设它只能在时刻n∈T发生移动,且只能停留在1,2,3,4点上。当 22、质点转移到2,3点时,它以13的概率向左或向右移动一格,或停留在原处。当质点移动到点1时,它以概率1停留在原处。当质点移动到点4时,它以概率1移动到点3。若以Xn表示质点在时刻n所处的位置,则{Xn,n∈T}是一个齐次马尔科夫链,其转移概率矩阵为
P=101313 0013001300 131310
各状态之间的转移关系及相应的转移概率如图所示。
例中的点1称为吸收壁,即质点一旦到达这种状态后就被吸收住了,不再移动;点4称为反射壁,即质点一旦到达这种状态后,必然被反射出去。
例4.5 生灭链。观察某种生物群体,以Xn表示在时刻n群体的数目,设为i个数量单位,如在时刻n+1增生到i+1个数量单位的概率为bi,减灭到i-1个数量单位的概率为ai,保持不变的概率为ri=1-(ai+bi),则{Xn,n≥0}为齐次马尔科夫链,I={0,1,2,…},其转移概率为
pij=bi,j=i+1,ri,i=j,ai,j=i-1.
(a0=0),称此马尔科夫链为生灭链。
总结






