收藏 分销(赏)

第4章-判别分析1【可编辑的PPT文档】.ppt

上传人:w****g 文档编号:2470626 上传时间:2024-05-30 格式:PPT 页数:73 大小:2.50MB
下载 相关 举报
第4章-判别分析1【可编辑的PPT文档】.ppt_第1页
第1页 / 共73页
第4章-判别分析1【可编辑的PPT文档】.ppt_第2页
第2页 / 共73页
第4章-判别分析1【可编辑的PPT文档】.ppt_第3页
第3页 / 共73页
第4章-判别分析1【可编辑的PPT文档】.ppt_第4页
第4页 / 共73页
第4章-判别分析1【可编辑的PPT文档】.ppt_第5页
第5页 / 共73页
点击查看更多>>
资源描述

1、第四章第四章 判别分析判别分析第一节第一节 引言引言 第二节第二节 距离判别法距离判别法 第三节第三节 贝叶斯(贝叶斯(Bayes)判别法)判别法 第四节第四节 费歇(费歇(Fisher)判别法)判别法 第五节第五节 实例分析与计算机实现实例分析与计算机实现 1第一节第一节 引言引言n在我们的日常生活和工作实践中,常常会遇到判别分析问题,在我们的日常生活和工作实践中,常常会遇到判别分析问题,即根据历史上划分类别的有关资料和某种最优准则,确定一即根据历史上划分类别的有关资料和某种最优准则,确定一种判别方法,判定一个新的样本归属哪一类。种判别方法,判定一个新的样本归属哪一类。n例如,某医院有部分患

2、有肺炎、肝炎、冠心病、糖尿病等病例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的资料,记录了每个患者若干项症状指标数据。现在想利人的资料,记录了每个患者若干项症状指标数据。现在想利用现有的这些资料找出一种方法,使得对于一个新的病人,用现有的这些资料找出一种方法,使得对于一个新的病人,当测得这些症状指标数据时,能够判定其患有哪种病。当测得这些症状指标数据时,能够判定其患有哪种病。n又如,在天气预报中,我们有一段较长时间关于某地区每天又如,在天气预报中,我们有一段较长时间关于某地区每天气象的记录资料(晴阴雨、气温、气压、湿度等),现在想气象的记录资料(晴阴雨、气温、气压、湿度等),现在想建

3、立一种用连续五天的气象资料来预报第六天是什么天气的建立一种用连续五天的气象资料来预报第六天是什么天气的方法。这些问题都可以应用判别分析方法予以解决。方法。这些问题都可以应用判别分析方法予以解决。2n把这类问题用数学语言来表达,可以叙述如下:设把这类问题用数学语言来表达,可以叙述如下:设有有n个样本,对每个样本测得个样本,对每个样本测得p项指标(变量)的数项指标(变量)的数据,已知每个样本属于据,已知每个样本属于k个类别(或总体)个类别(或总体)G1,G2,Gk中的某一类,且它们的分布函数分别为中的某一类,且它们的分布函数分别为F1(x),F2(x),Fk(x)。我们希望利用这些数。我们希望利用

4、这些数据,找出一种判别函数,使得这一函数具有某种最据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别优性质,能把属于不同类别的样本点尽可能地区别开来,并对测得同样开来,并对测得同样p项指标(变量)数据的一个新项指标(变量)数据的一个新样本,能判定这个样本归属于哪一类。样本,能判定这个样本归属于哪一类。3判别分析内容很丰富,方法众多:判别分析内容很丰富,方法众多:n按判别的总体数来区分,有两个总体判别分析和多总体判别按判别的总体数来区分,有两个总体判别分析和多总体判别分析;分析;n按区分不同总体所用的数学模型来分,有线性判别和非线性按区分不同总体所用的数学模

5、型来分,有线性判别和非线性判别;判别;n按判别时所处理的变量方法不同,有逐步判别和序贯判别等。按判别时所处理的变量方法不同,有逐步判别和序贯判别等。n判别分析可以从不同角度提出问题,因此有不同的判别准则,判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、如马氏距离最小准则、Fisher准则、平均损失最小准则、最准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。则的不同又提出多种判别方法。n本章仅介绍常用的几种判别分析方法:距离判别法、本章仅介绍常用的几种判别分析方

6、法:距离判别法、Fisher判别法、判别法、Bayes判别法。判别法。4第二节第二节 距离判别法距离判别法一一 马氏距离的概念马氏距离的概念 二二 距离判别的思想及方法距离判别的思想及方法 三三 判别分析的实质判别分析的实质 5一、马氏距离的概念一、马氏距离的概念n 6图图4.178二、距离判别的思想及方法二、距离判别的思想及方法 1、两个总体的距离判别问题、两个总体的距离判别问题n 问题:设有协方差矩阵问题:设有协方差矩阵相等的两个总体相等的两个总体G1和和G2,其均值,其均值分别是分别是 1和和 2,对于一个新的样品,对于一个新的样品X,要判断它来自哪个总,要判断它来自哪个总体。体。n 一

7、般的想法是计算新样品一般的想法是计算新样品X到两个总体的马氏距离到两个总体的马氏距离D2(X,G1)和和D2(X,G2),并按照如下的判别规则进行判断,并按照如下的判别规则进行判断n这个判别规则的等价描述为:求新样品这个判别规则的等价描述为:求新样品X到到G1的距离与到的距离与到G2的距离之差,如果其值为正,的距离之差,如果其值为正,X属于属于G2;否则;否则X属于属于G1。9三、判别分析的实质三、判别分析的实质*n我们知道,判别分析就是希望利用已经测得的变量我们知道,判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种数据,找出一种判别函数,使得这一函数具有某种最优

8、性质,能把属于不同类别的样本点尽可能地区最优性质,能把属于不同类别的样本点尽可能地区别开来。为了更清楚的认识判别分析的实质,以便别开来。为了更清楚的认识判别分析的实质,以便能灵活的应用判别分析方法解决实际问题,我们有能灵活的应用判别分析方法解决实际问题,我们有必要了解必要了解“划分划分”这样概念。这样概念。n设设R1,R2,Rk是是p维空间维空间R p的的k个子集,如果它个子集,如果它们互不相交,且它们的和集为们互不相交,且它们的和集为R p,则称,则称R1,R2,Rk为为R p的一个划分。的一个划分。10n n 这样我们将会发现,判别分析问题实质上就是在某种意义上,这样我们将会发现,判别分析

9、问题实质上就是在某种意义上,以最优的性质对以最优的性质对p维空间维空间R p构造一个构造一个“划分划分”,这个,这个“划分划分”就构成了一个判别规则。这一思想将在后面的各节中体现就构成了一个判别规则。这一思想将在后面的各节中体现的更加清楚。的更加清楚。11第三节第三节 贝叶斯(贝叶斯(Bayes)判别法)判别法一一 Bayes判别的基本思想判别的基本思想 二二 Bayes判别的基本方法判别的基本方法*三三 Bayes判别与距离判别的联系判别与距离判别的联系 12n从上节看距离判别法虽然简单、便于使用,但是该从上节看距离判别法虽然简单、便于使用,但是该方法也有它明显的不足之处。方法也有它明显的不

10、足之处。第一,把总体等同看待,没有考虑到总体会以不同第一,把总体等同看待,没有考虑到总体会以不同的概率(先验概率)出现,也即判别方法与总体各的概率(先验概率)出现,也即判别方法与总体各自出现的概率的大小无关。自出现的概率的大小无关。第二,判别方法与错判之后所造成的损失无关,没第二,判别方法与错判之后所造成的损失无关,没有考虑误判之后所造成的损失的差异。有考虑误判之后所造成的损失的差异。Bayes判别法就是为了解决这些问题而提出的一种判判别法就是为了解决这些问题而提出的一种判别方法,其判别效果更加理想,应用也更广泛。别方法,其判别效果更加理想,应用也更广泛。一、一、Bayes判别的基本思想判别的

11、基本思想13一、一、Bayes判别的基本思想判别的基本思想n 14 例例4.3:办公室新来了一个雇员小王,小王是好人还是坏人大:办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为均为0.5。坏人总是要做坏事,偶尔会办件好事;好人总是做。坏人总是要做坏事,偶尔会办件好事;好人总是做好事,偶尔也会做件坏事:一般好人做好事的概率为好事,偶尔也会做件坏事:一般好人做好事的概率为0.9,坏,坏人做好事的概率为人做好事的概率为0.2。一天,小王做了一件好事,请问小王。一天,小王做了一件好事,请问小王是好

12、人的概率有多大是好人的概率有多大?你现在把小王判为何种人你现在把小王判为何种人?1、最大后验概率准则、最大后验概率准则15例例4.3n同理:同理:n 16n n 用数学的语言归纳:用数学的语言归纳:17n 用数学的语言归纳:用数学的语言归纳:18n 贝叶斯判别与距离判别的联系贝叶斯判别与距离判别的联系19n在正态总体的假设下,贝叶斯判别所构建的判别函数,其实在正态总体的假设下,贝叶斯判别所构建的判别函数,其实就是(马氏)距离判别在考虑先验概率和协方差矩阵是否相就是(马氏)距离判别在考虑先验概率和协方差矩阵是否相等情况下的一个推广。等情况下的一个推广。n所以,贝叶斯判别,在有的统计软件中(例如所

13、以,贝叶斯判别,在有的统计软件中(例如SAS)又被称)又被称为广义平方距离判别法。为广义平方距离判别法。贝叶斯判别与距离判别的联系贝叶斯判别与距离判别的联系20第四节第四节 费歇(费歇(Fisher)判别法)判别法一一 Fisher判别的基本思想判别的基本思想 二二 Fisher判别函数的构造判别函数的构造 三三 线性判别函数的求法线性判别函数的求法 21nFisher判别法是判别法是1936年提出来的,该方法的主要思想是通过年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的放开,然后再选择合适

14、的判别规则,将新的样之间尽可能的放开,然后再选择合适的判别规则,将新的样品进行分类判别。品进行分类判别。n右图中有右图中有A、B两个总体。在原两个总体。在原始变量(指标)始变量(指标)X1、X2的方向的方向上,上,A、B都有很大的重叠,难都有很大的重叠,难以区分清楚。但是,如果以以区分清楚。但是,如果以X1、X2为横、纵坐标轴构建一个平为横、纵坐标轴构建一个平面,若能设法找到一个面,若能设法找到一个y轴,轴,使得当使得当X1X2平面上的散点投射平面上的散点投射到到y轴上时,两组观察值的重轴上时,两组观察值的重叠程度最小,则综合指标叠程度最小,则综合指标y的的区分能力显然大于原先的区分能力显然大

15、于原先的X1、X2。yx2x1一、一、Fisher判别的基本思想判别的基本思想22一、一、Fisher判别的基本思想判别的基本思想n n 23例题例题4.5n经典案例:费希尔于经典案例:费希尔于1936年年发表的鸢尾花(发表的鸢尾花(Iris)数据,)数据,被广泛用为判别分析的例子。被广泛用为判别分析的例子。数据是对数据是对3种鸢尾花:刚毛种鸢尾花:刚毛鸢尾花(第一组)、变色鸢鸢尾花(第一组)、变色鸢尾花(第二组)和弗吉尼亚尾花(第二组)和弗吉尼亚鸢尾花(第三组),各自抽鸢尾花(第三组),各自抽取一个容量为取一个容量为50的样本,测的样本,测量其花萼长度量其花萼长度x1、花萼宽度、花萼宽度x2

16、、花瓣长度、花瓣长度x3、花瓣宽度、花瓣宽度x4,单位为,单位为mm。2425本例题本例题SPSS的几个关键输出结果的几个关键输出结果n特征值特征值26n中心化的中心化的Fisher判别函数判别函数U1(X)和)和U2(X)的取值:)的取值:27n各判别函数的组均值为:各判别函数的组均值为:2829几种判别方法的关系几种判别方法的关系*nFisher判别与距离判别对判别变量的分布并无要求,而贝叶判别与距离判别对判别变量的分布并无要求,而贝叶斯判别要求了解判别变量的先验分布,因此,斯判别要求了解判别变量的先验分布,因此,Fisher判别和判别和距离判别相对于贝叶斯判别,较为简单实用;当然,后者更

17、距离判别相对于贝叶斯判别,较为简单实用;当然,后者更加精确。加精确。n当当k2且两个总体协差阵相等时,且两个总体协差阵相等时,Fisher判别与距离判别是判别与距离判别是等价的。当判别变量服从正态分布,且不考虑误判代价时,等价的。当判别变量服从正态分布,且不考虑误判代价时,它们与贝叶斯判别也是相同的。它们与贝叶斯判别也是相同的。30第五节第五节 实例分析与计算机实现实例分析与计算机实现n这一节我们利用这一节我们利用SPSS对对Fisher判别法和判别法和Bayes判别法进行计判别法进行计算机实现。算机实现。n例题例题4.6:为研究某地区人口死亡状况,已按某种方法将:为研究某地区人口死亡状况,已

18、按某种方法将15个个已知地区样品分为已知地区样品分为3类,指标含义及原始数据如下。试建立类,指标含义及原始数据如下。试建立判别函数,并判定另外判别函数,并判定另外4个待判地区属于哪类?个待判地区属于哪类?X1 :0岁组死亡概率岁组死亡概率 X 4:55岁组死亡概率岁组死亡概率 X 2:1岁组死亡概率岁组死亡概率 X5 :80岁组死亡概率岁组死亡概率 X 3:10岁组死亡概率岁组死亡概率 X6 :平均预期寿命平均预期寿命 31表表4.1 各地区死亡概率表各地区死亡概率表32分类变量分类变量Group取值的设置取值的设置33开始判别分析开始判别分析34(一一)操作步骤操作步骤1.在在SPSS窗口中

19、选择窗口中选择AnalyzeClassifyDiscriminate,调,调出判别分析主界面,将左边的变量列表中的出判别分析主界面,将左边的变量列表中的“group”变量变量选入分组变量中,将选入分组变量中,将X1至至X6变量选入自变量中,并选择变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进单选按钮,即使用所有自变量进行判别分析。行判别分析。352.点击点击Define Range按钮,定义分组变量的取值范围。本例按钮,定义分组变量的取值范围。本例中分类变量的范围为中分类变量的范围为1到到3,所以在最小值和最大值中分别输,所以在最小值

20、和最大值中分别输入入1和和3。单击。单击Continue按钮,返回主界面。按钮,返回主界面。363.单击单击Statistics按钮,指定输出的描述统计量和判别函数按钮,指定输出的描述统计量和判别函数系数。选中系数。选中Function Coefficients栏中的栏中的Fishers和和Unstandardized。然后,单击。然后,单击Continue按钮,返回主界面。按钮,返回主界面。37这两个选项的含义如下:这两个选项的含义如下:Fishers:给出:给出Bayes判别函数的系数。(注意:判别函数的系数。(注意:这个选项不是要给出这个选项不是要给出Fisher判别函数的系数。这判别函

21、数的系数。这个复选框的名字之所以为个复选框的名字之所以为Fishers,是因为按判别,是因为按判别函数值最大的一组进行归类这种思想是由函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请同学注意。)提出来的。这里极易混淆,请同学注意。)Unstandardized:给出:给出未标准化未标准化的的Fisher判别函判别函数(即数(即典型典型判别函数,也即我们前面讲过的判别函数,也即我们前面讲过的“中中心化心化的的Fisher判别函数判别函数”)的系数()的系数(SPSS默认给默认给出标准化的出标准化的Fisher判别函数系数)。判别函数系数)。38设置均值、协差阵检验设置均

22、值、协差阵检验nBoxx M是对各总体协差阵是否相等进行齐性检验是对各总体协差阵是否相等进行齐性检验nMeans可给出各总体均值是否相等的可给出各总体均值是否相等的Wilks统计量。统计量。最后点击最后点击“Continue”回到上一级菜单。回到上一级菜单。394.再单击再单击Classify按钮,定义判别分组参数和选择输出结按钮,定义判别分组参数和选择输出结果。选择果。选择Display栏中的栏中的Casewise results,输出一个判别结果,输出一个判别结果表,包括每个样品的判别分数、后验概率、实际组和预测组表,包括每个样品的判别分数、后验概率、实际组和预测组编号等。编号等。Plot

23、s栏中选中栏中选中“Combined-Groups”,在同一幅图,在同一幅图中输出各组的中输出各组的Fisher判别函数(投影)值。其余的均保留系判别函数(投影)值。其余的均保留系统默认选项。单击统默认选项。单击Continue按钮。按钮。405.单击单击Save按钮,指定在数据文件中生成代表判别分组结果按钮,指定在数据文件中生成代表判别分组结果和判别得分的新变量,生成的新变量的含义分别为:和判别得分的新变量,生成的新变量的含义分别为:Predicted group membership:存放判别样品所属组别的值;:存放判别样品所属组别的值;Discriminant scores:存放:存放F

24、isher判别得分的值,有几个典型判别得分的值,有几个典型判别函数就有几个判别得分变量;判别函数就有几个判别得分变量;Probabilities of group membership:存放样品属于各组的:存放样品属于各组的Bayes后验概率值。后验概率值。n将对话框中的三个复选框均选中,单击将对话框中的三个复选框均选中,单击Continue按钮返回。按钮返回。416.返回判别分析主界面,单击返回判别分析主界面,单击OK按钮,运行判别分析过程。按钮,运行判别分析过程。Save子对话框子对话框42(二)(二)主要运行结果解释主要运行结果解释各总体均值是否相等的检验结果各总体均值是否相等的检验结果

25、n可见,第可见,第1、2、6个指标在各总体间的差异并不大个指标在各总体间的差异并不大43n各组均值和离差的描述性统计:各组均值和离差的描述性统计:n确实发现三个总体在第确实发现三个总体在第1、2、6指标的均值比较接近,以第指标的均值比较接近,以第一个指标一个指标“0岁组死亡率岁组死亡率”为例:为例:44协差阵齐性检验结果:协差阵齐性检验结果:n由于样本资料矩阵的由于样本资料矩阵的秩小于秩小于5(p-1)(原)(原因?),不是非奇异因?),不是非奇异矩阵,无法给出矩阵,无法给出Boxs检验结果。检验结果。n可见,第可见,第1、2、6个个指标的同均值,确实指标的同均值,确实对检验产生了影响对检验产

26、生了影响(二)(二)主要运行结果解释主要运行结果解释45n因此,应该剔除第因此,应该剔除第1、2、6个指标,重新进行分析:个指标,重新进行分析:(二)(二)主要运行结果解释主要运行结果解释46n各组均值和离差的描述性统计:各组均值和离差的描述性统计:(二)(二)主要运行结果解释主要运行结果解释47n剔除第剔除第1、2、6个指标后重新进行分析,得到的均值检验结个指标后重新进行分析,得到的均值检验结果为:果为:(二)(二)主要运行结果解释主要运行结果解释48n剔除第剔除第1、2、6个指标后重新进行分析,得到的协差阵齐性个指标后重新进行分析,得到的协差阵齐性检验结果为:检验结果为:(二)(二)主要运

27、行结果解释主要运行结果解释49n可见,判别分析开始前,有必要对各个总体的均值是否相等可见,判别分析开始前,有必要对各个总体的均值是否相等进行假设检验。进行假设检验。n接下来,接下来,处于课堂演示的需要处于课堂演示的需要,我们继续使用原有全部六个,我们继续使用原有全部六个指标,进行后续的判别分析指标,进行后续的判别分析(二)(二)主要运行结果解释主要运行结果解释50特征值:特征值:Wilkss Lambda,是对,是对Fisher判别函数的显著性进行检验。判别函数的显著性进行检验。(二)(二)主要运行结果解释主要运行结果解释51(二)(二)主要运行结果解释主要运行结果解释1.Standardiz

28、ed Canonical Discriminant Function Coefficients(给出标准化的典型判别函数系数)(给出标准化的典型判别函数系数)标准化的典型判别函数是由标准化的自变量通过标准化的典型判别函数是由标准化的自变量通过Fisher判别法判别法得到的,所以要得到标准化的典型判别得分,代入该函数的自得到的,所以要得到标准化的典型判别得分,代入该函数的自变量必须是经过标准化的。变量必须是经过标准化的。52(二)(二)主要运行结果解释主要运行结果解释2.Canonical Discriminant Function Coefficients(给出未标(给出未标准化的典型判别函数

29、系数)准化的典型判别函数系数)未标准化的典型判别函数系数由于可以将实测的样品观测值直未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。方便一些。53由此表可知,两个由此表可知,两个Fisher判别函数分别为:判别函数分别为:实际上两个函数式计算的是各观测值在各个维度上的坐标,这实际上两个函数式计算的是各观测值在各个维度上的坐标,这样就可以通过这两个函数式计算出各样品观测值的具体空间位样就可以通过这两个函数式计算出各样品观测值的具体空间位置。置。(二)(二)主要运行结果解释主

30、要运行结果解释543.Functions at Group Centroids(给出组重心处的(给出组重心处的Fisher判判别函数值)别函数值)如下图如下图 所示,实际上为各类别重心在空间中的坐标位置。这样,所示,实际上为各类别重心在空间中的坐标位置。这样,只要在前面计算出各观测值的具体坐标位置后,再计算出它们只要在前面计算出各观测值的具体坐标位置后,再计算出它们分别离各重心的距离,就可以得知它们的分类了。分别离各重心的距离,就可以得知它们的分类了。组重心处的组重心处的Fisher判别函数值判别函数值(二)(二)主要运行结果解释主要运行结果解释55 4.Classification Func

31、tion Coefficients(给出(给出Bayes判别函数判别函数系数)系数)(二)(二)主要运行结果解释主要运行结果解释56n注意,在输出结果注意,在输出结果“Classification Function Coefficients”表的下方注明是表的下方注明是“Fishers linear discriminant functions”,但是经验证实为一般教课书中的贝叶斯线性判别函数但是经验证实为一般教课书中的贝叶斯线性判别函数!命名命名出现不一致的原因是按判别函数值最大的一组进行归类这种出现不一致的原因是按判别函数值最大的一组进行归类这种思想,是思想,是Fisher提出来的,因此提

32、出来的,因此SPSS用用“Fisher”对对“贝叶贝叶斯斯”方法进行了命名。方法进行了命名。n并且因为贝叶斯判别函数只有在各个总体的样本的协方差阵并且因为贝叶斯判别函数只有在各个总体的样本的协方差阵相同时才是线性的(为什么?)因此在得到该判别函数的系相同时才是线性的(为什么?)因此在得到该判别函数的系数时,对样本的协方差的估计必须是在总体协方差相等情况数时,对样本的协方差的估计必须是在总体协方差相等情况下的估计!下的估计!SPSS提供了提供了BoxM组间协方差矩阵的齐性检验。组间协方差矩阵的齐性检验。(二)(二)主要运行结果解释主要运行结果解释57 4.Classification Funct

33、ion Coefficients(给出(给出Bayes判别函数判别函数系数)系数)如上图所示,如上图所示,GROUP栏中的每一列表示样品判入相应列的栏中的每一列表示样品判入相应列的Bayes判别函数系数。在本例中,各类的判别函数系数。在本例中,各类的Bayes判别函数如下:判别函数如下:第一组:第一组:第二组:第二组:第三组:第三组:(二)(二)主要运行结果解释主要运行结果解释58将各样品的自变量值代入上述三个将各样品的自变量值代入上述三个Bayes判别函数,得到三个判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该函数值。比较这三个函数值,哪个函数值比较大就可以判断该样

34、品判入哪一类。例如,将第一个待判样品的自变量值分别代样品判入哪一类。例如,将第一个待判样品的自变量值分别代入函数,得到:入函数,得到:F1=3793.77,F2=3528.32,F3=3882.48比较三个值,可以看出最大,据此得出第一个待判样品应该属比较三个值,可以看出最大,据此得出第一个待判样品应该属于第三组。于第三组。(二)(二)主要运行结果解释主要运行结果解释595.Casewise Statistics(给出个案观察结果)(给出个案观察结果)在在Casewise Statistics输出表针对每个样品给出了了大部分的判输出表针对每个样品给出了了大部分的判别结果,其中包括:实际类(别结

35、果,其中包括:实际类(Actual Group)、预测类)、预测类(Predicted Group)、)、Bayes判别法的后验概率、与组重心的判别法的后验概率、与组重心的马氏距离(马氏距离(Squared Mahalanobis Distance to Centroid)以及)以及Fisher判别法的每个典型判别函数的判别得分(判别法的每个典型判别函数的判别得分(Discriminant Scores)。下表经过加工隐藏了其中的一些项目。从表中可以)。下表经过加工隐藏了其中的一些项目。从表中可以看出四个待判样本依次被判别为第三组、第一组、第二组和第看出四个待判样本依次被判别为第三组、第一组、

36、第二组和第三组。三组。(二)(二)主要运行结果解释主要运行结果解释60表表4.4 个案观察结果表个案观察结果表(二)(二)主要运行结果解释主要运行结果解释61n原始输出结果原始输出结果(二)(二)主要运行结果解释主要运行结果解释626.由于我们在由于我们在Save子对话框中选择了生成表示判别结果的新子对话框中选择了生成表示判别结果的新变量,所以在数据编辑窗口中,可以观察到产生的新变量。变量,所以在数据编辑窗口中,可以观察到产生的新变量。其中,变量其中,变量dis-1存放判别样品所属组别的值,变量存放判别样品所属组别的值,变量dis1-1和和dis2-1分别代表将样品各变量值代入第一个和第二个非

37、标准分别代表将样品各变量值代入第一个和第二个非标准化化Fisher判别函数所得的判别分数,变量判别函数所得的判别分数,变量dis1-2、dis2-2和和dis3-2分别代表样品分别属于第分别代表样品分别属于第1组、第组、第2组和第组和第3组的组的Bayes后验概率值。后验概率值。(二)(二)主要运行结果解释主要运行结果解释63(二)(二)主要运行结果解释主要运行结果解释6465再多说一句:再多说一句:SPSS操作中的辅助检验操作中的辅助检验n无论是哪种判别分析方法,都需要对各个总体均值是否相等无论是哪种判别分析方法,都需要对各个总体均值是否相等进行检验。如果无法拒绝进行检验。如果无法拒绝“均值

38、相等均值相等”的原假设,就应该将的原假设,就应该将相关样本合并,再进行后续的判别相关样本合并,再进行后续的判别nFisher判别,无需对总体协差阵进行齐性检验;判别,无需对总体协差阵进行齐性检验;n贝叶斯判别,正常情况下我们需要得到线性判别函数,此时,贝叶斯判别,正常情况下我们需要得到线性判别函数,此时,需要对总体协差阵进行齐性检验需要对总体协差阵进行齐性检验nFisher判别无需对总体的分布特征进行检验;贝叶斯判别理判别无需对总体的分布特征进行检验;贝叶斯判别理论上需要对总体的正态性进行检验,不过,在实际操作中要论上需要对总体的正态性进行检验,不过,在实际操作中要求并不严格。求并不严格。66

39、n有时,一些变量对于判别并没有用处,为了得到对判别最合有时,一些变量对于判别并没有用处,为了得到对判别最合适的变量,可以使用逐步判别。适的变量,可以使用逐步判别。n即:先用少数变量进行判别,然后一边判别,一边引进判别即:先用少数变量进行判别,然后一边判别,一边引进判别能力最强的变量,又要逐步淘汰判别能力不强的变量,这个能力最强的变量,又要逐步淘汰判别能力不强的变量,这个过程可以有进有出。过程可以有进有出。n判别一个变量判别能力的方法有很多种,主要利用各种检验,判别一个变量判别能力的方法有很多种,主要利用各种检验,例如例如Wilks Lambda、Raos V、马氏距离、马氏距离、Smalles

40、t F ratio或或the sum of Unexplained Variation等检验等检验n筛选好变量后,接下来的判别方法与前面相同筛选好变量后,接下来的判别方法与前面相同(三)逐步判别分析功能(三)逐步判别分析功能*67(三)逐步判别分析功能(三)逐步判别分析功能*n调入判别分析主菜单(方法同前),然后选择调入判别分析主菜单(方法同前),然后选择“Use stepwise method”68n再点击再点击“Method.”,选择筛选变量的检验方法:,选择筛选变量的检验方法:n选择默认方法选择默认方法Wilks Lambda检验检验(三)逐步判别分析功能(三)逐步判别分析功能*69n最终只保留了一个变量:最终只保留了一个变量:(三)逐步判别分析功能(三)逐步判别分析功能*70n非中心化的非中心化的Fisher判别函数及组重心:判别函数及组重心:(三)逐步判别分析功能(三)逐步判别分析功能*71n贝叶斯判别函数贝叶斯判别函数(三)逐步判别分析功能(三)逐步判别分析功能*72本章结束本章结束73

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 考试专区 > 中考

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服