资源描述
数学建模_心脏病判别论文
心脏病的判别
摘 要
本文研究的是一个判别分析类问题,解决的是如何根据就诊者的各项生理指标数据,判别就诊者是否患有心脏病以及患病的程度,并确定哪些指标是影响人们患心脏病的关键因素,从而减少化验的指标,以便人们可以及时发现疾病。
首先我们对题目中给出的数据进行了处理,通过查找资料以及合理的判断,将-9进行了合理的赋值。
对于问题一,首先通过对患病情况的分析将患病程度划分为0、1、2、3、4五个总体,从而建立了多总体fisher判别模型,利用spss软件对13个判别指标进行分析,去除错误数据判别指标L、M,最后得出fisher判别函数,并利用求得的Fisher判别函数,对已给出的病患情况进行回代分析,最终回代结果显示“是否患病”的正确率为97.2%,判断“患病程度”的正确率为85.6%。
对于问题二,首先在问题一确定的判别函数和判别思想的基础上,通过分析,去除错误数据过多的判别指标L、M,得到了新的fisher判别函数。然后我们运用excel软件,将44名就诊人员的11项有效判别指标的数据代入判别函数求解,通过判断,得出各自的患病情况结果未写出来。
。
对于问题三,运用主成份分析法进行判别指标的遴选。首先在问题一分析患心脏病程度及心脏病判别指标间联系的基础上,在保留心脏病判别指标的前提下,剔除心脏病检测指标中某些被认为可以被用于表示对应心脏病判别情况的部分。接着,运用主成份分析法,分析各判别指标对最终结果评判的影响,分析各成分指标间的贡献率,最终因此,我们得出H、C、K、J、I、M为主要因素。
对于问题四,首先我们在问题三遴选判别指标的基础上,运用spss软件对相关指标分析,建立多总体fisher 判别模型,得到相关系数,最终确定fisher 判别函数。接着利用及求解问题二相同的方法,将44名就诊人员13项指标的数据代入得出的判别函数中进行求解,将得出的结果及问题二中得到的结果比较,我们发现:筛选后所建立的判别方法及判别准则在判断“是否患病”时,正确率较高;而在判别“患病程度”时,就有一定的偏差数据
。这及模型以及算法本身的准确度有一定的关系,也及我们处理数据时的正确性有一定关系。
本文综合运用了fisher 判别法、主成份分析法等分析方法,构建相对应的fisher 判别模型,结合spss、excel等软件,对心脏病判别的问题进行了多角度的分析,并给出了利用筛减优化指标判别心脏病患病情况的方法。在文章的最后对所建模型的优缺点进行了分析,并对模型的适用范围进行了推广,在实际应用中有较大的参考价值。
关键字: 多总体fisher判别 主成份分析法心脏病的判别
一.问题重述
心脏是维持全身血液循环的最重要器官。由于现代人不正确的饮食和运动习惯等因素,心脏病患者人数逐年上升,心脏病已经成为威胁人类生命的十大疾病之一,除了老年人,中青年也成为心脏病猝死的高危人群。年轻人的心脏病突发往往没有明显先兆,突然发作时很危险,心脏病的病因很多,有时很难判断一个人是否患有心脏病。附录二是到某医院做心脏病检测的一些确诊者的生理指标数据(指标A,B,…M的含义见附录二,指标N表示是否确诊为心脏病以及患病的程度)。请尝试建立合适的数学模型讨论下列问题:
问题一:根据附录一中的数据,提出判别心脏病以及患病程度的方法,并检验你提出方法的正确性。
问题二:按照问题一提出的方法,判断附录三中的44名就诊人员的患病情况。
问题三:能否根据附录二的数据特征,确定哪些指标是影响人们患心脏病的关键或主因素,以便减少化验的指标。
问题四:根据问题三的结果,重复问题二的工作,并及问题二的结果对比作进一步分析。
二.问题分析
2.1问题一的分析
问题一要求在已知就诊者各项生理指标及患病情况的前提下,提出判别心脏病以及患病程度的方法,并检验提出方法的正确性。考虑到此题通过研究个体的观测指标来推断该个体的所属类型,我们采用判别分析法中的fisher判别法进行求解。本问题为多元分析中的判别分析,现在利用Fisher判别法来处理该问题。
Fisher判别法的基本思想: 从个总体中抽取具有个指标的样品观测数据,借助方差分析的构造一个线性判别函数: ,其中系数确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。有了线性判别函数后,对于一个新的样品,将它的个指标值代入以上线性判别函数式中求出值,然后根据一定的判别规则,就可以判别新的样品属于哪个总体。
首先,我们对指标中的数据进行分析,剔除其中有误的数据指标L、M,然后可以通过spss软件处理原始数据,衡量剩余的11项指标的相应的标准差、方差、均值等。然后,利用所给数据求解出相应的fisher判别函数,建立判别准则,从而得到确定心脏病以及患病程度的方法。最后,通过回代法,将确诊者的各项指标代入判别函数,通过判别准则得出分类情况,再及原来的分类情况进行对比,即可计算出正确率,从而验证所得出方法的正确性。
2.2问题二的分析
问题二要求在第一问的求解基础上,利用求解问题一的方法和思想分析44名待诊断者的信息,对相应的指标数据进行合理的取舍和转换,得到对应的fisher 判别函数,然后通过excel软件,将附录二中44名待诊断者的数据代入判别函数中,即可分析得到最终的判别结果。
2.3问题三的分析
问题三要求根据给出的数据,筛选出能影响人们患心脏病的关键或主要因素,以便能够减少化验指标。首先我们利用spss软件对剔除错误数据指标后的剩余11个指标进行分析,然后利用主成份分析的方法,确定最终可以用来判别患病情况的主成份,接着利用spss软件分析得到11个指标间的主成份正交解,剔除系数绝对值最小的项,最终确定可以用来判别患病情况的主要指标。
2.4问题四的分析
问题四要求依据问题三的结果,重复问题二中对于44名待诊患者患病情况的判断,并及问题二中的判别结果作比较。根据问题三中分析得到的可以用来判别患病情况的主成份指标,运用spss软件分析,通过fisher 判别方法,求得最终的fisher判别式,通过指标回代的方法,利用及问题二中类似的方法,可以分析得到减少分析指标后的患病情况分析结果。
最后将问题四中的结果和问题二中的结果作比较,分析出用两种不同的方法对患病情况预测的准确率。
三.模型的假设及符号说明
3.1模型假设
假设1:假定就诊人员的身体状况只有患心脏病和健康(非心脏病患者)两类,不考虑就诊人员的其他疾病因素以及身体素质的差异对疾病的影响。
假设2:假设除了表中列出的指标外,其他指标对是否患心脏病影响很小。
假设3:假设题目中所给的数据是在相同的条件下测得的。
假设4:假设样品的估计平均值、协方差分别等于总体的平均值、协方差
年龄
性别
胸痛类型
静息血压
血清中胆固醇含量 mg/dl
空腹时血糖 > 120 mg/dl
静息时心电图结果
最大心跳速率
运动是否诱发心绞痛
运动心电图ST下降程度
ST段斜坡
大血管属性
地中海贫血
心脏疾病的诊断结果
总体
样品
判别系数
F分布统计检定值
3.2符号说明
51 / 5151 / 51
四.数据的预处理
4.1附录二数据的预处理
根据确诊者的表格信息(具体见附录二),其中患心脏病人数为93个,正常的为157个。由于数据中有‘-9’这一异常数据,为了便于模型的建立及分析,我们利用个案剔除法和均值替换法将数据作如下处理(各指标属性见符号说明):
(一)剔除法
(1)直接剔除法:对于指标L、M,由于在这两项判别指标中,数据-9在所数据中分别占有98.8%和89.2%的比率。由于比重过大,我们分析这两项指标可能对于最终患病情况的判别没有较大的影响,故而,在建立模型和模型的求解过程中,可以不予考虑这两项指标对心脏病结果的判别。
(2)个案剔除法:对于指标H、I,由于在这两项判别指标中,数据-9仅仅在所有数据中出现一次,由于所占比重太小,因此我们将这两项指标中的-9转换为0,便于数据的正确处理。
(二)均值替换法
均值替换法就是将该项目剔除异常数据后取剩余数据的平均值的整数来替换异常或缺失数据的方法,即:先剔除后替换的思想。E为血清中胆固醇含量,先将该指标下的-9剔除,然后求解剩余数值的效范围的平均值作为该指标下-9的替换值,将用于后面模型建立及分析的有效数据。
其中:在附录二中指标K表示ST段斜坡,1: 上升,2: 平,3: 下降,我们将正常
人的K指标下的-9置为2;患病情况下的-9将依据患病程度作不同的赋值置换处理:患病程度为1和3等级的患者,其K指标中的-9将分别置换成及之一一对应的1和3,其它患病等级的患者,其K指标中的-9将统一置换成1。
4.2附录三中数据的预处理
在附录二数据的预处理的前提下,为了能够正确利用问题一中的分析结果对附录三中的待诊的44名患者进行心脏病的判别,因此在附录二数据预处理的前提下,将K指标中的异常数据用“均值替换法”作相应的改变处理:先将这44名患者的第K指标中的数据-9剔除,然后求解数值的效范围的平均值作为该指标下-9的替换值。其它判别指标在附录一数据预处理的基础上不作任何改变。
其中:具体的数据处理结果见附录(插入数据处理图表)
五.模型的建立及求解
5.1问题一模型的建立及求解
5.1.1问题一模型的建立
本问题为多元分析中的判别分析,我们建立多个总体的fisher判别分析模型。
1、假设共有个总体,抽取样品数分别为,则令;第i个总体的第a个样品的观测向量为。则,建立的判别函数为:其中,。
2.根据求随机变量线性组合的均值和方差的性质可知,在总体上的样本均值和样本方差分别为:其中,和分别是总体内x的样本均值向量和样本协方差矩阵。
记为总的均值向量,则,Fisher准则下的目标就是要选取系数向量c,使得如下值最大,即:
其中是人为的正的加权系数,它可以取为先验概率。
3.如果取,并将代入上式可化为:
其中A为总体之间样本协方差矩阵,E为组内离差阵,即:
4.为求的最大值,根据极值存在的必要条件,令,利用对向量求导的公式:
因此,。
这说明及c恰好是A、E矩阵的广义特征根及其对应的特征向量。由于一般都要求加权协差阵E是正定的,因此由代数知识可知,上式非零特征根个数m不超过min(k-1,p),又因为A为非负定的,所以非零特征根必为正根,记为,于是可构造m个判别函数:
5.对于每一个判别函数必须给出一个用以衡量判别能力的指标定义为:
m0个判别函数的判别能力定义为:
6.当取m0=1时(即只取一个判别函数),此时有两种可供选用的方法
i)不加权法
若
则判
ii)加权法
将按大小次序排列,记为,相应判别函数的标准差重排为。令:
则可作为及之间分界点。如果x使得,则判。
7.当取时,也有类似两种供选用的方法
i)不加权法
记
对待判样品,计算
若则判。
ii)加权法
考虑到每个判别函数的判别能力不同,记
其中是由求出的特征根。
若则判。
我们按照上面的模型将样本分为5个总体,分别为0,1,2,3,4,从而建立了五个总体的fisher判别模型,然后通过spss软件进行求解。
5.1.2模型解答过程
5.1.2.1确定判别函数
Fisher判别函数的输出如表2所示。
表2:各分类判别函数系数
分类函数系数
指标
N
0
1
2
3
4
A
1.393
1.362
1.364
1.441
1.397
B
4.029
4.295
4.778
5.081
3.988
C
6.276
7.329
7.242
6.587
6.937
D
.415
.406
.433
.435
.437
E
.058
.062
.071
.067
.074
F
-10.570
-8.299
-8.347
-9.002
-10.139
G
1.804
1.106
1.672
3.119
2.722
H
.578
.586
.566
.563
.567
I
-4.949
-2.096
-1.317
-2.936
-.493
J
-.749
.114
.450
1.006
1.898
K
20.787
15.306
15.163
21.306
16.831
(常量)
-139.155
-133.837
-137.915
-150.140
-145.453
Fisher 的线性判别式函数
根据分类函数系数表格可得出各类型的Fisher判别函数为:
;
;
;
;
。
将某待诊者的11项生理指标分别带入到上述各类型对应的Fisher判别函数,得到五个对应的Fisher函数值,最后,通过回代法,将确诊者的各项指标代入判别函数,通过判别准则得出分类情况,再及原来的分类情况进行对比,即可计算出正确率,从而验证所得出方法的正确性。
5.1.3运用模型一进行检验
根据得出的判别函数以及判断准则,将原确诊者的各项指标分别带入各类型对应的Fisher判别函数,进行判别,并将其及原确诊信息对比如下:(其中序号表示人数排号,N表示判断所得的数据,验证表示确诊数据)。缩略表格如下表3,具体见附录三。
表三:
序号
N
验证
序号
N
验证
序号
N
验证
1
0
0
91
0
0
181
0
0
2
1
0
92
0
0
182
1
2
3
0
0
93
0
0
183
0
0
4
3
4
94
2
4
184
3
4
5
0
0
95
0
0
185
0
3
…
...
…
…
…
…
…
…
…
86
3
3
176
4
4
246
1
2
87
3
3
177
4
4
247
0
1
88
0
4
178
3
3
248
2
1
89
2
1
179
0
0
249
2
3
90
0
2
180
0
0
250
2
3
结果分析:
经过比对,我们可以看出,有26个人在“是否患病”中被判断错误,有41个人在“患病程度”中被判断错误,由此,我们得出:
判断“是否患病”的准确率为
判断“患病程度”的准确率为。
5.1.4模型一的检验分析
通过spss软件得出的分类结果如下表:
表4
分类结果b,c
N
预测组成员
合计
0
1
2
3
4
初始
计数
0
137
8
5
3
4
157
1
2
19
5
4
4
34
2
0
7
5
2
9
23
3
3
1
1
11
7
23
4
0
0
1
2
10
13
%
0
87.3
5.1
3.2
1.9
2.5
100.0
1
5.9
55.9
14.7
11.8
11.8
100.0
2
.0
30.4
21.7
8.7
39.1
100.0
3
13.0
4.3
4.3
47.8
30.4
100.0
4
.0
.0
7.7
15.4
76.9
100.0
交叉验证a
计数
0
137
6
6
3
5
157
1
2
17
7
4
4
34
2
0
11
0
2
10
23
3
5
2
2
6
8
23
4
0
0
2
4
7
13
%
0
87.3
3.8
3.8
1.9
3.2
100.0
1
5.9
50.0
20.6
11.8
11.8
100.0
2
.0
47.8
.0
8.7
43.5
100.0
3
21.7
8.7
8.7
26.1
34.8
100.0
4
.0
.0
15.4
30.8
53.8
100.0
a. 仅对分析中的案例进行交叉验证。在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b. 已对初始分组案例中的 72.8% 个进行了正确分类。
c. 已对交叉验证分组案例中的 66.8% 个进行了正确分类。
检验结果分析:
由上表可得,该模型判别的正确率为72.8%,及原结果较为吻合。而从上面所判别的患病情况中,利用我们选取的fisher 判别方法求解是否患病准确率为89.6%,患病程度的准确率为83.6%,及实际结果的吻合度比较高,结果较为理想,符合实际的要求。
5.2问题二的解答
5.2.1判别函数的确定
Fisher判别函数的输出如表5所示:
表5
分类函数系数
指标
N
0
1
2
3
4
A
1.393
1.362
1.364
1.441
1.397
B
4.029
4.295
4.778
5.081
3.988
C
6.276
7.329
7.242
6.587
6.937
D
.415
.406
.433
.435
.437
E
.058
.062
.071
.067
.074
F
-10.570
-8.299
-8.347
-9.002
-10.139
G
1.804
1.106
1.672
3.119
2.722
H
.578
.586
.566
.563
.567
I
-4.949
-2.096
-1.317
-2.936
-.493
J
-.749
.114
.450
1.006
1.898
K
20.787
15.306
15.163
21.306
16.831
(常量)
-139.155
-133.837
-137.915
-150.140
-145.453
Fisher 的线性判别式函数
根据分类函数系数表格可得出Fisher判别函数,如下:
;
;
;
;
。
然后将待诊者的各项生理指标分别代入到上述各类型对应的Fisher判别函数,得到五个对应的Fisher函数值,根据Fisher后验概率最大这一判别规则,即所得函数值最大,可以判断某待诊者所属的类型。
5.2.2待诊情况判别
我们将44位待诊断者数据带入到上述判别函数并进行判别,得出结果如下(序号代表患者号,N表示患病情况):
表6
序号
N
序号
N
序号
N
序号
N
序号
N
1
2
10
1
19
0
28
0
37
0
2
2
11
0
20
2
29
4
38
0
3
3
12
0
21
0
30
4
39
0
4
3
13
1
22
0
31
0
40
1
5
1
14
1
23
0
32
3
41
0
6
4
15
0
24
4
33
3
42
0
7
0
16
1
25
0
34
1
43
1
8
0
17
0
26
0
35
0
44
0
9
0
18
2
27
0
36
0
判定结果分析:
从上表中可知,44名待诊断者中,正常的有24名,患心脏病程度为1级的有8名,患心脏病程度为2级的有4名,患心脏病程度为3级的有4名,患心脏病程度为4级的有4名。用fisher 判定方法对44名待诊者病情的诊断,虽然不能100%的判断出待诊者所属的患病类型,不可避免的会出现误判的情况,但在一定的程度上,利用该方法能够对待诊者做出简单、快速、较为准确的判断,有一定的实际意义。
5.3问题三模型的建立及求解
5.3.1问题三模型的建立(删改)
Step1. 为消除不同变量的量纲的影响,首先需要对变量进行标准化中处理;本部分涉及到的指标共11个,样本对象250个,第个样本的第个指标值为,将
各标准化值按如下方式进行标准化为
其中:和分别为指标的均值和标准差。标准化的目的在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。
Step2. 计算标准化数据的相关系数阵,求出相关系数矩阵的特征值和特征向量。
记第i 个指标及第i¢ 个指标的相关系数为,其计算方法为:
则相关系数矩阵为,其中:
Step3:计算特征值及特征向量;
计算相关系数矩阵R 的特征值
Step4. 确定个主成分,进行统计分析。p
根据以上步骤,本文利用SPSS 统计软件,首先求得各指标的相关性系数表(见附件5),
从表中可以发现,某些指标具有很强的相关性,如果直接用这些指标对酿酒葡萄质量进行分级,不仅会使得运算量过大,同时还会造成信息的重叠,影响分级的客观性。主成分分析可以把多个指标转化成少数几个不相关的综合指标。以红葡萄为例,相应主成分的特征值和累计贡献率如下表:
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
2.770
25.178
25.178
2.770
25.178
25.178
1.071
9.737
9.737
2
1.341
12.194
37.372
1.341
12.194
37.372
1.030
9.361
19.098
3
1.110
10.094
47.466
1.110
10.094
47.466
1.011
9.188
28.286
4
1.060
9.639
57.105
1.060
9.639
57.105
1.009
9.171
37.457
5
.931
8.465
65.570
.931
8.465
65.570
1.006
9.145
46.602
6
.917
8.337
73.907
.917
8.337
73.907
1.005
9.137
55.739
7
.822
7.471
81.378
.822
7.471
81.378
1.005
9.135
64.873
8
.692
6.291
87.669
.692
6.291
87.669
1.002
9.113
73.986
9
.596
5.418
93.087
.596
5.418
93.087
1.001
9.104
83.090
10
.461
4.193
97.280
.461
4.193
97.280
.999
9.082
92.172
11
.299
2.720
100.000
.299
2.720
100.000
.861
7.828
100.000
提取方法:主成份分析。
由以上分析利用SPSS 统计软件计算得到主成分分析正交解:
旋转成份矩阵a
指标
成份
1
2
3
4
5
6
7
8
9
10
11
A
.065
.040
.959
.115
.020
.089
-.001
-.003
-.006
-.218
.077
B
.055
.090
.000
.048
.025
.027
.987
-.081
-.040
-.030
.039
C
.153
.948
.041
.015
.064
.023
.101
-.081
-.005
-.144
.187
D
.082
.015
.108
.981
.029
.032
.049
.063
.022
-.079
.064
E
.054
.057
.019
.028
.990
.076
.025
.034
-.002
-.052
.053
F
.023
.022
.081
.032
.076
.990
.027
.047
.019
-.013
.052
G
.038
-.003
-.006
.021
-.002
.019
-.039
.035
.997
.004
.022
H
-.117
-.150
-.235
-.089
-.060
-.014
-.035
-.001
.005
.937
-.135
I
.380
.260
.107
.093
.079
.079
.057
.027
.033
-.176
.848
J
.933
.153
.067
.091
.060
.023
.062
.022
.045
-.112
.265
K
.020
-.070
-.003
.061
.034
.047
-.080
.990
.036
-.001
.017
提取方法 :主成份。旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 6 次迭代后收敛。
结果分析:
由上表可知,F、G、B、A、D、E的F值较小,首先剔除,此时分类正确率为82.4%,及问题二中的结果分析相差不大,当剔除H指标的时候,分类正确率明显降低,说明H对判别造成较明显的影响。综上,我们最终选定H、C、K、J、I、M为影响人们患心脏病的主要因素。
8.问题四的解答
8.1问题四求解
根据问题三的分析,选定H、C、K、J、I、M为影响人们患心脏病的主要因素。通过spss软件,得出新的Fisher判别函数的输出表,如表9所示:
表9
分类函数系数
指标
N
0
1
2
3
4
A
.683
.660
.687
.753
.719
B
3.716
4.015
4.445
4.634
3.551
C
2.788
4.090
4.186
3.381
3.960
D
.372
.365
.394
.396
.399
E
.050
.054
.062
.058
.066
F
-8.047
-5.634
-5.689
-6.341
-7.357
J
-2.728
-1.339
-.806
-.534
.818
K
19.023
14.043
14.053
19.886
15.842
(常量)
-70.677
-65.991
-74.730
-85.683
-81.880
Fisher 的线性判别式函数
根据分类函数系数表格可得出各类型的Fisher判别函数为:
;
;
;
;
然后再将待诊者的各项生理指标分别带入到上述各类型对应的Fisher判别函数,根据Fisher后验概率最大这一判别规则,判断某待诊者所属的类型。如下表:
表10
序号
N
序号
N
序号
N
序号
N
序号
N
1
3
10
1
19
0
28
3
37
0
2
2
11
0
20
3
29
3
38
0
3
4
12
0
21
4
30
4
39
0
4
0
13
1
22
0
31
0
40
1
5
2
14
0
23
0
32
0
41
0
6
4
15
0
24
4
33
4
42
0
7
0
16
0
25
0
34
1
43
1
8
0
17
0
26
0
35
0
44
0
9
0
18
3
27
0
36
0
判别结果分析:
从上表中可知,44名待诊断者中,未患病者有26名,患心脏病程度为1级的有5名,患心脏病程度为2级的有2名,患心脏病程度为3级的有5名,患心脏病程度为4级的有6名
8.2结果分析
将问题二及问题四所判断出的结果对比做成如下表格:
表11
序号
N2
N4
序号
N2
N4
序号
N2
N4
序号
N2
N4
序号
N2
N4
1
2
3
10
1
1
19
0
0
28
0
3
37
0
0
2
2
2
11
0
0
20
2
3
29
4
3
38
0
0
3
3
4
12
0
0
21
0
4
30
4
4
39
0
0
4
3
0
13
1
1
22
0
0
31
0
0
40
1
1
5
1
2
14
1
0
23
0
0
32
3
0
41
0
0
6
4
4
15
0
0
24
4
4
33
3
4
42
0
0
7
0
0
16
1
0
25
0
0
34
1
1
43
1
1
8
0
0
17
0
0
26
0
0
35
0
0
44
0
0
9
0
0
18
2
3
27
0
0
36
0
0
从表格的对比分析可以看出,两次结果差别不大,全部44组数据中,只有13对判断不一致。这从另外一个方面说明,我们的判断方法不是特别准确,仍存在一定的误差。但是,我们在判断“是否患病”时具有较高的准确率,只是在判别“患病程度”时准确率较低,这说明可能是在对数据进行分析时,没有很好的将有问题的数据-9进行合理的置换。(斟酌)
9. 模型的评价、改进及推广
8.1模型评价
虽然,该模型并不能100%的判断出待诊者所属的患病类型,但是,利用该模型能够对待诊者做出简单、快速、较为准确的判断,能够解决医学上现在所面临的问题。同时,也成为医学上一种新的诊断方式,及传统的诊断方式相比,准确率得到了大幅提高,治疗效果也会更为显著。
8.2模型改进
在此模型下,我们是假设把几乎所有判别变量都选入判别函数,并通过计算标准化判别函数系数,没有辨认出不重要的判别变量,所以最后的判别正确率不太高,因此我们必须对模型进行改进,可以考虑多踢除一些影响不大的相关指标。
8.3模型推广
此类判别问题可以推广到天气预报中,比如有一段较长时间关于某地区每天气象的记录资料(晴阴雨、气温、气压、湿度等),建立一种用连续五天的气象资料来预报第六天的天气的方法。
参考文献
[1] 于林,数学建模主次因素的判别,三峡大学理学院
[2]杨清源,心脏病医学全接触 ,复旦大学出版社,2007-05 。
[3]45c3b3567ec8b74.html
附录
附录一:已确诊的信息
A
B
C
D
E
F
G
H
I
J
K
L
M
N
40
1
2
140
289
0
0
172
0
0
-9
-9
-9
0
49
0
3
160
180
0
0
156
0
1
2
-9
-9
1
37
1
2
130
283
0
1
98
0
0
-9
-9
-9
0
48
0
4
138
214
0
0
108
1
1.5
2
-9
-9
3
54
1
3
150
-9
0
0
122
0
0
-9
-9
-9
0
39
1
3
120
339
0
0
170
0
0
-9
-9
-9
0
45
0
2
130
237
0
0
170
0
0
-9
-9
-9
0
54
1
2
110
208
0
0
142
0
0
-9
-9
-9
0
37
1
4
140
207
0
0
130
1
1.5
2
-9
-9
1
48
0
2
120
284
0
0
120
0
0
-9
-9
-9
0
37
0
3
130
211
0
0
142
0
0
-9
-9
-9
0
58
1
2
136
164
0
1
99
1
2
2
-9
-9
3
39
1
2
120
204
0
0
145
0
0
-9
-9
-9
0
49
1
4
140
234
0
0
140
1
1
2
-9
-9
3
42
0
3
115
211
0
1
137
0
0
-9
-9
-9
0
54
0
2
120
273
0
0
150
0
1.5
2
-9
-9
0
38
1
4
110
196
0
0
166
0
0
-9
-9
-9
1
43
0
2
120
201
0
0
165
0
0
-9
-9
-9
0
60
1
4
100
248
0
0
125
0
1
2
-9
-9
1
36
1
2
120
267
0
0
160
0
3
2
-9
-9
1
43
0
1
100
223
0
0
142
0
0
-9
-9
-9
0
44
1
2
120
184
0
0
142
0
1
2
-9
-9
0
49
0
2
124
201
0
0
164
0
0
-9
-9
-9
0
44
1
2
150
288
0
0
150
1
3
2
-9
-9
3
40
1
3
130
215
0
0
138
0
0
-9
-9
-9
0
36
1
3
130
209
0
0
178
0
0
-9
-9
-9
0
53
1
4
124
260
0
1
112
1
3
2
-9
-9
0
52
1
2
120
284
0
0
118
0
0
-9
-9
-9
0
53
0
2
113
468
-9
0
127
0
0
-9
-9
-9
0
51
1
2
125
188
0
0
145
0
0
-9
-9
-9
0
53
1
3
145
518
0
0
130
0
0
-9
-9
-9
3
56
1
3
130
-9
0
0
114
0
0
-9
-9
-9
0
54
1
4
125
224
0
0
122
0
2
2
-9
-9
1
41
1
4
130
172
0
1
130
0
2
2
-9
-9
3
43
0
2
150
186
0
0
154
0
0
-9
-9
-9
0
32
1
2
125
254
0
0
155
展开阅读全文