资源描述
第28章 基于正态分布和概率函数拟合的金融投资风险分析模型——风险分析
28.1案例背景
风险度量与预测研究一直是金融投资的一大热点问题,已知某公司在金融投资中,需要考虑如下两个问题:
1)准备用数额为1000万元的资金投资某种金融资产(如股票,外汇等)。它必须根据历史数据估计在下一个周期(如1天)内的损失的数额超过10万元的可能性有多大,以及能以95%的置信度保证损失的数额不会超过多少。
2)如果要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为多少。
下面表28.1是该公司在过去一年255个交易日的日收益额(单位:万元)的统计数据,假定每天结算一次,保持每天在市场上的投资额为1000万元。
表28.1 公司过去一年255个交易日的日收益额统计数据(单位:万元)
收益额
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
天数
1
1
1
1
1
2
1
2
1
4
0
2
6
3
4
7
收益额
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
天数
5
8
5
7
10
14
8
19
9
11
11
14
10
6
6
8
收益额
1
0
-1
-2
-3
-4
-5
-6
-7
-8
-9
-10
-11
-12
-13
-14
天数
9
5
9
3
7
4
1
6
2
5
5
3
2
2
1
0
收益额
-15
-16
-17
-18
-19
-20
-21
-22
-23
-24
-25
-26
-27
-28
-29
-30
天数
1
0
0
0
0
0
0
1
0
0
1
0
0
0
0
0
要求:
1) 参考以上数据,建立两种模型来解决前述的两个问题,并对这两个模型加以比较;
2) 讨论二周期情形(如今后两天内)上述两个问题的答案。
3) 陈述上述两个问题的一般形式(即初始投资额为M,限定损失额为L,置信度为 1-,T 个周期)及其解决方案。
28.2.模型建立
28.2.1 正态分布模型
由于生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述,那么对于这个金融投资的实际问题,根据给定的该公司在过去一年255个交易日的日收益额的统计数据,容易想到该数据很有可能符合正态分布。为直观判断,用Matlab软件做样本的频率直方图,并对比与样本同期望、同方差的正态分布图,见图28.1、28.2。
图28.1 样本频率直方图 图28.2与样本同期望、同方差的正态分布图
由图28.1及28.2可知,两者很相近。故本章首先通过统计学的方法,根据样本来检验数据关于分布的正态性假设。从而考虑建立正态分布模型进行求解。用Matlab编程估计正态分布的参数,并作相应的检验,就可以近似的得到正态分布的概率密度函数和概率分布函数。
正态分布模型求解的关键是对所给数据的正态性检验,本章采用经典的拟合检验法和专用于检验分布是否为正态的“偏峰、峰度检验法”两种方法分别进行验证。
28.2.2 拟合检验法
(1)作原假设:
过去一年255个交易日的日收益额的总体分布为正态分布,即
X服从正态分布
(2)作的数据统计表:
由样本值、、…作实轴的分割区间,(-∞,-12),[-12,-8),[-8,-4),[-4,-0),[0,4) ,[4,6),[6,8),[8,10),[10,12),[12,16),[16,20),[20,24),[24,27),[27,+∞),共计14个区间(即=14),定第i个区间的实际频数,并计算,(),其中,确定理论频数()。用Matlab编程求解,程序及结果详见28.3,本章中,且表28.2知,满足要求。
(3)取检验统计量:
根据定理:若充分,,则当为真时(不论中的分布属什么分布),统计量总是近似地服从自由度为的分布,其中r是被估计的参数的个数。即
本章中=255, =14,=2,并给定显著性水平,则,查分布表可得,即拒绝域。
(4)检验:
由Matlab计算得到=10.6743<19.6751,即,则接受,认为X服从正态分布。
28.2.3 偏峰、峰度检验法
偏度、峰度检验法的理论依据是正态分布密度曲线是对称的且陡缓适当。因此被检验的数据若来自正态总体,其对应的经验分布密度曲线就不能偏斜太多,不能陡缓过分。为此考察两个数字特征,一个是偏度,另一个是峰度。
(1)原假设:X服从正态分布。
(2)作数据统计:
本章用Matlab编程计算样本偏度与样本峰度,详见28.3求得结果分别为,。同时计算相关参数、、,如下:
(3)给定显著性水平,在,很大时由
查正态分布表确定分为点,则拒绝域为
(4)判别:
,即,则接受,认为总体X服从正态分布。
28.2.4 利用正态分布模型求解问题
由上述两种检验方式知,255个交易日的日投资效益分布近似服从正态分布。其中正态分布的参数分别用样本的均值与标准差来进行估计,可以得到正态分布的概率密度函数和概率分布函数:
概率密度函数 ()
概率分布函数 ()
对于所给问题,分三种情况(一周期情形、两周期情形和一般情形)依次求解。
(1)一周期情形:
第一问中估计在下一个周期(如1天)内的损失的数额超过10万元的可能性,即为,查标准正态分布表得,
所以一个周期内损失超过10 万元的概率为3.84%。
求解以95%的置信度保证损失的数额的最大值,设为X万元(),则得,化为,,
,
查标准正态分布表得,,故8.72。
第二问可由概率论相关知识得到, 。即在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为1146.8万元。
(2)两周期情形:
当为两周期情形时,收益额、为独立同分布,即、,则服从,故相应的计算方法同一周期情形,不再累述,结果为:两个周期内损失超过10 万元的概率为3.67%,以95%的置信度保证损失的数额不会超过7.95万元,两个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多为1258.4万元。
(3)一般情形:
设T个周期的收益额分别为,则它们也满足独立同分布,即,故服从,计算方法也同上,转化为标准正态分布来求解。推导过程如下:
第一问第一小题:
第一问第二小题:(设能以的置信度保证损失的数额不会超过X)
(查表得)
第二问: (设T个周期内的损失超过L万元的可能性不大于的初始投资额最多为)
28.3 MATLAB实现
根据拟合检验法和偏峰、峰度检验法的相关理论,用MATLAB软件编程实现对所给样本数据的正态性检验。
2.3.1拟合检验法
拟合检验法的MATLAB求解代码及运行结果如下:
x=[33 32 31 30 29 28 28 27 26 26 25 24 24 24 24 22 22 21 21 21 21 21 21 20 20 20 19 19 19 19 18 18 18 18 18 18 18 17 17 17 17 17 16 16 16 16 16 16 16 16 15 15 15 15 15 14 14 14 14 14 14 14 13 13 13 13 13 13 13 13 13 13 12 12 12 12 12 12 12 12 12 12 12 12 12 12 11 11 11 11 11 11 11 11 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 3 3 3 3 3 3 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 0 0 0 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -2 -2 -2 -3 -3 -3 -3 -3 -3 -3 -4 -4 -4 -4 -5 -6 -6 -6 -6 -6 -6 -7 -7 -8 -8 -8 -8 -8 -9 -9 -9 -9 -9 -10 -10 -10 -11 -11 -12 -12 -13 -15 -22 -25 ];
mm=minmax(x) %求数据中的最小数和最大数
hist(x,14) %画直方图
fi=[length(find(x<-12)),...
length(find(x>=-12&x<-8)),...
length(find(x>=-8&x<-4)),...
length(find(x>=-4&x<0)),...
length(find(x>=0&x<4)),...
length(find(x>=4&x<6)),...
length(find(x>=6&x<8)),...
length(find(x>=8&x<10)),...
length(find(x>=10&x<12)),...
length(find(x>=12&x<16)),...
length(find(x>=16&x<20)),...
length(find(x>=20&x<24)),...
length(find(x>=24&x<27)),...
length(find(x>=27))] %各区间上出现的频数
mu=mean(x),sigma=std(x) %均值和标准差
fendian=[-12,-8,-4,0,4,6,8,10,12,16,20,24,27] %区间的分点
p0=normcdf(fendian,mu,sigma) %分点处分布函数的值
p1=diff(p0) %中间各区间的概率
p=[p0(1),p1,1-p0(13)] %所有区间的概率
p2=255*p %n*
chi=(fi-255*p).^2./(255*p)
chisum=sum(chi) %皮尔逊统计量的值
x_a=chi2inv(0.95,11) %chi2分布的0.95分位数
程序运行结果:
mm =
-25 33
fi =
4 12 14 23 28 16 25 20 27 36 24 11 7 8
mu =
7.4863
sigma =
9.8520
fendian =
-12 -8 -4 0 4 6 8 10 12 16 20 24 27
p0 =
Columns 1 through 11
0.0240 0.0580 0.1218 0.2237 0.3617 0.4400 0.5208 0.6007 0.6766 0.8063 0.8980
Columns 12 through 13
0.9531 0.9762
p1 =
Columns 1 through 11
0.0340 0.0638 0.1018 0.1381 0.0783 0.0808 0.0799 0.0759 0.1297 0.0917 0.0552
Column 12
0.0230
p =
Columns 1 through 11
0.0240 0.0340 0.0638 0.1018 0.1381 0.0783 0.0808 0.0799 0.0759 0.1297 0.0917
Columns 12 through 14
0.0552 0.0230 0.0238
p2 =
Columns 1 through 11
6.1123 8.6746 16.2800 25.9677 35.2041 19.9723 20.5913 20.3752 19.3502 33.0663 23.3931
Columns 12 through 14
14.0659 5.8748 6.0724
chi =
Columns 1 through 11
0.7300 1.2748 0.3193 0.3392 1.4742 0.7901 0.9439 0.0069 3.0243 0.2603 0.0157
Columns 12 through 14
0.6683 0.2155 0.6119
chisum =
10.6744
x_a =
19.6751
根据以上Matlab程序求解后,将计算结果列于表28.2。
表28.2 拟合检验法计算结果统计表
序号
分组区间
-
1
(-∞,-12)
4
6.1123
-2.1123
0.7300
2
[-12,-8)
12
8.6746
3.3254
1.2748
3
[-8,-4)
14
16.28
-2.2800
0.3193
4
[-4,-0)
23
25.9677
-2.9677
0.3392
5
[0,4)
28
35.041
-7.2041
1.4742
6
[4,6)
16
19.9723
-3.9723
0.7901
7
[6,8)
25
20.5913
4.4087
0.9439
8
[8,10)
20
20.3752
-0.3752
0.0069
9
[10,12)
27
19.3502
7.6498
3.0242
10
[12,16)
36
33.0663
2.9337
0.2603
11
[16,20)
24
23.3931
0.6069
0.0157
12
[20,24)
11
14.0659
-3.0659
0.6683
13
[24,27)
7
5.8748
1.1252
0.2155
14
[27,+∞)
8
6.0724
1.9276
0.6119
255
255
=10.6743
在使用拟合检验法时,要求样本容量必须足够大,一般 ,同时理论频数不能太小,一般,在本章中,且由上表知,满足要求。
2.3.2 偏峰、峰度检验法
样本历史数据的相关统计量(偏峰、峰度检验法)的MATLAB求解代码及运行结果如下:
x=[33 32 31 30 29 28 28 27 26 26 25 24 24 24 24 22 22 21 21 21 21 21 21 20 20 20 19 19 19 19 18 18 18 18 18 18 18 17 17 17 17 17 16 16 16 16 16 16 16 16 15 15 15 15 15 14 14 14 14 14 14 14 13 13 13 13 13 13 13 13 13 13 12 12 12 12 12 12 12 12 12 12 12 12 12 12 11 11 11 11 11 11 11 11 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 3 3 3 3 3 3 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 0 0 0 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -2 -2 -2 -3 -3 -3 -3 -3 -3 -3 -4 -4 -4 -4 -5 -6 -6 -6 -6 -6 -6 -7 -7 -8 -8 -8 -8 -8 -9 -9 -9 -9 -9 -10 -10 -10 -11 -11 -12 -12 -13 -15 -22 -25 ];
t1=mean(x) %均值(期望)
t2=std(x) %标准差
t3=skewness(x) %偏度
t4=var(x) %方差
t5=kurtosis(x) %峰度
hist(x,15) %画直方图
normplot(x) %分布的正态性检验图
程序运行结果:
t1 =
7.4863
t2 =
9.8520
t3 =
-0.1307
t4 =
97.0618
t5 =
3.2195
根据以上Matlab程序求解得到样本偏度与样本峰度,分别为,。
28.4 案例扩展
本章案例也可以考虑采用概率函数拟合模型计算。该模型思考的关键在于,不具体考虑历史样本的分布,如何通过直接分析数据来拟合概率密度函数和概率分布函数进行求解。
2.4.1概率密度函数拟合模型
对于255天历史数据的随机变量(日收益额),根据计算其样本值为万元时的概率,采用拟合方式可以获得随机变量的一个概率密度函数估计。
运用Matlab Toolboxes中的Curve Fitting Tool对收益额发生的概率进行模拟,通过多种函数的模拟,去除不符合条件的,得到如下结果:
f(x) =a1*exp(-((x-b1)/c1)^2) + a2*exp(-((x-b2)/c2)^2)+ a3*exp(-((x-b3)/c3)^2)
a1 = 0
b1 = 9.635
c1 = 0.0002259
a2 = 0.03106 (0.02071, 0.04141)
b2 = 6.976 (4.905, 9.047)
c2 = 15.54 (12.07, 19.02)
a3 = 0.02068 (0.008923, 0.03243)
b3 = 9.736 (8.273, 11.2)
c3 = 4.243 (1.437, 7.049)
.
收益额近似服从以为概率密度的函数关系。因此,.
问题一、运用Mathematica软件求解得, ,即一个周期内损失超过10 万元的概率为5.23%。以95%的置信度保证损失的数额不会超过10.25万元。
问题二、有 。即在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为975.61万元。
28.4.2概率分布函数拟合模型
对于255天历史数据的日收益额随机变量,根据计算其样本值为万元时的概率,并累加时的概率,采用拟合方式可以获得随机变量的一个概率分布函数估计。
运用Matlab Toolboxes中的Curve Fitting Tool工具,模拟出日收益额的概率分布函数,函数如下:
其中:;
;
;
;
;
;
;
由此根据概率分布函数上述问题可以直接求解。
问题一、一个周期内损失超过10 万元的概率为:,95%的置信度保证损失的数额不会超过9.20万元。
问题二、有 ,即在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为1086.96万元。
28.4.3两种模型比较
第一种正态分布模型通过为历史数据的正态分布验证,再用Matlab工具箱得到正态分布函数及相关参数,方法较为普遍,难点在于正态分布验证,不过Matlab也提供了很多非参数检验的方法。该模型结合数理统计与概率论的知识,能很好的求解风险投资问题,并容易推广到两个周期甚至T个周期(初始投资额为M,限定损失额为L,置信度为)的一般形式。第二种概率函数拟合模型,通过拟合分别建立了概率密度函数和分布函数,有Matlab拟合图像可知,概率密度函数由于散点乱,拟合效果差,对问题的求解与实际预期的效果不太相符。概率分布函数,除个别点外,拟合效果还是非常好的,一个周期的问题能得到较好的解决,但将其推广到两个周期以及一般形式还是有一定困难的。
28.4.4 案例推广
上述两种模型,大体上可以反映风险投资中的风险概率问题,运用数理统计的方法对历史交易日收益额数据的处理,得出极限风险损失值,及风险概率。模型一通过检验证实属于正态分布,但是实际投资中很多学者考虑各种资产的关联以及大量数据的研究表示,收益额并不属于正态分布,这样就降低了模型的实用性。尽管如此,上述模型对于投资者的投资行为起到参考和指导作用。为了更符合实际投资问题,可以考虑VaR以及CVaR模型,后者是对前者的改进和完善。
其次,对于这种单向投资的历史资料数据风险问题,可采用密度演化方法,构造一个与随机变量相关的虚拟随机过程,通过可获取虚拟随机过程的瞬时概率密度函数,进而获得随机变量的概率密度函数估计进行风险分析。
另外,考虑到实际投资的组合问题,投资者可能要通过投资风险来选择哪种投资。因而可根据风险收益比K的大小来决定是否投资或投资多少。风险收益比K定义为所有正收益期望与所有损失期望的比值。即每承担一个单位的风险所获取的收益大小,该指标愈大表明在承担相同风险的情况下.所获取的收益愈大.亦即在获取的收益一定时,所承担的风险愈小。
28.5参考文献
[1] 赵静,但琦.数学建模与数学实验(第三版),北京:高等教育出版社,2008 。
[2] 吴世农,陈斌,风险度量方法与金融资产配置模型的理论和实证研究,经济研究,1999年第9期:30-38页,1999年。
[3] 朱淑珍.金融创新与金融风险:发展中的两难,上海:复旦大学出版社,2002。
展开阅读全文