1、第十八章第十八章判别分析(discriminantanalysis)目的目的:作出以多个判别指标判别个体分类的:作出以多个判别指标判别个体分类的判别函数或概率公式。判别函数或概率公式。资料资料:个体分两类或多类,判别指标全部为:个体分两类或多类,判别指标全部为数值变量或全部为分类变量。数值变量或全部为分类变量。用途用途:解释和预报(主要用于计量诊断)。:解释和预报(主要用于计量诊断)。分类分类(经典):(经典):Fisher判别和判别和Bayes判别。判别。讲述内容第一节第一节 FisherFisher判别判别第二节第二节 最大似然判别法最大似然判别法第三节第三节 BayesBayes公式判别
2、法公式判别法第四节第四节 BayesBayes判别判别第五节第五节 逐步判别逐步判别第六节第六节 判别分析中应注意的问题判别分析中应注意的问题1.计量资料判别分析。目的是作出以定量指标判别个体属性分类或等级的判别函数。按资料类型分:2.计数资料判别分析。目的是作出以定性或等级指标判别个体属性分类或等级的概率公式概率公式。按方法名分1.Fisher判别2.最大似然判别法3.Bayes公式判别法4.Bayes判别5.逐步判别第一节Fisher判别适用于指标为定量指标的两类判别1.Fisher判别的原理一、两类判别例18-1收集了22例某病患者的三个指标(X1,X2,X3)的资料列于表18-1,其中
3、前期患者(A)类12例,晚期患者(B)类10例。试作判别分析。表表18-1 22例患者三项指标观察结果(例患者三项指标观察结果(Zc=-0.147)表18-2变量的均数及类间均值差(1)计算变量的类均数及类间均值差Dj,计算结果列于表18-2。(2)计算合并协方差矩阵:按公式(18-4),例如:代入公式(18-3)得得到合并协方差阵二、判别效果的评价用误判概率P衡量回顾性误判概率估计往往夸大判别效果。回顾性误判概率估计往往夸大判别效果。第二节最大似然判别法(优度法)适用于指标为定性指标的两类判别或多类判别。资料:个体分两类或多类,判别指标全部为定性或等级 资料。原理:用独立事件的概率乘法定理得
4、到判别对象归属某 类的概率。2.判别规则 3.最大似然判别法的应用例18-2有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表18-3。表表18-3 5668例不同型阑尾炎病例的症状发生频率(例不同型阑尾炎病例的症状发生频率(%)如某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6,白细胞23.7109/L。根据表18-3得第三节第三节 Bayes公式判别法公式判别法适用于指标为定性指标的两类判别或多类判别。资料:资料:个体分两类或多类,判别指标全部为定性个体分两类或多类,判别指标全部为定性
5、 或等级资料。或等级资料。原理:原理:条件概率条件概率+事前概率(各病型或病种的总事前概率(各病型或病种的总 体构成比)体构成比)判别规则:判别规则:举例说明:举例说明:例例18-3注意:第四节第四节 Bayes判别判别适用于指标为定量指标的多类判别(也可用于两类判别)适用于指标为定量指标的多类判别(也可用于两类判别)先验概率确定先验概率确定:1.等概率(有选择性偏倚);等概率(有选择性偏倚);2.频率估计。频率估计。判别规则:归属最大判别规则:归属最大Yg 类类。应用:应用:快速、正确。快速、正确。资料:资料:个体分个体分G类,判别指标定量。类,判别指标定量。原理:原理:Bayes准则。准则
6、。结果:结果:G 个个判别函数判别函数例18-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表18-4。试建立判别Bayes函数。Bayes判别函数判别函数判别效果评价:误判概率 (回顾性估计,见表18-6)。误判概率的刀切法估计为 。第五节第五节 逐步判别逐步判别目的:目的:选取具有判别效果的指标建立判别函数。选取具有判别效果的指标建立判别函数。应用:应用:只适用于只适用于Bayes判别。判别。原理原理:Wilks统计量统计量 ,F 检验。检验。例18-5利用表18-4的数据作逐步Bayes判别。Bayes判别函数:判别效果评价,误判概率为1/17=5.88%(回顾性估计,见表18-8)。误判概率的刀切法估计17.6%。与例18-4比较,变量筛选后,尽管判别指标由4个减为2个,判别效能却提高了。由此可见,判别指标并不是越多越好。第六节 判别分析中应注意的问题