1、1LogitLogit模型的原理及模型的原理及应用用20172017年年3 3月月3 3日日1-21.问题的提出的提出p如果回如果回归模型的模型的解解释变量量中含有定性中含有定性变量,量,则可可以用虚以用虚拟变量来量来处理。理。p在在实际经济问题中,中,被解被解释变量量也可能是定性也可能是定性变量。量。p因因变量取量取值是离散的,是离散的,这类回回归模型称模型称为离散离散选择模型或模型或“定性反定性反应模型模型”。p例如通例如通过一系列解一系列解释变量的量的观测值观察人察人们对某某项提提议的的态度,某件事情的成功和失度,某件事情的成功和失败等。等。p这类模型被称模型被称为“离散离散选择模型模型
2、”:二:二值选择模模型、多型、多值选择模型、模型、计数模型。数模型。2-32.线性概率模型(性概率模型(Tobit)3-42.线性概率模型(性概率模型(Tobit)4-52.线性概率模型(性概率模型(Tobit)5-6 Pobit Pobit模型模型模型模型LogitLogit模型模型模型模型2.线性概率模型(性概率模型(Tobit)6-73.Logit 模型模型-提出提出7-83.Logit 模型模型-提出提出ln8-93.Logit 模型模型-分分类9-103.Logit 模型模型-二分二分类10-113.Logit 模型模型-二分二分类若将若将 看成是因看成是因变量,量,则logit线性
3、回性回归模型与多元模型与多元线性回性回归模型的形式是一致的,且有很多共性。不同的是:模型的形式是一致的,且有很多共性。不同的是:1、logistic回回归模型中因模型中因变量是二分量是二分类的,而且非的,而且非连续,其其误差的分布不再是正差的分布不再是正态分布,而是二分布,而是二项分布,且所有的分分布,且所有的分析均建立在二析均建立在二项分布的基分布的基础上。上。2、由于上述原因,、由于上述原因,logit回回归系数的估系数的估计不能再用最小二不能再用最小二乘法,而要用极大似然估乘法,而要用极大似然估计法。回法。回归模型和回模型和回归系数的系数的检验也不是也不是F检验和和t检验,而要用,而要用
4、Wald检验、似然比、似然比检验等。等。11-123.Logit 模型模型-二分二分类p例:例:讨论某特定人群(例如糖尿病患者)中患某特定人群(例如糖尿病患者)中患动脉硬化的概率与年脉硬化的概率与年龄、婚姻状况的关系。、婚姻状况的关系。试建立死亡率关于建立死亡率关于年年龄和婚姻状况的和婚姻状况的logit模型。模型。p其中,其中,A表示年表示年龄(取中取中值),M1、M2、M3表示婚姻状况表示婚姻状况p其中其中12-133.Logit 模型模型-多分多分类类p前面前面讨论的的logit模型模型为二分数据的情况,有二分数据的情况,有时候候响响应变量有可能取三个或更多量有可能取三个或更多值,即多,
5、即多类别的属性的属性变量。量。p根据响根据响应变量量类型的不同,分两种情况:型的不同,分两种情况:n响响应变量量为定性名定性名义变量;量;n响响应变量量为定性有序定性有序变量;量;p当名当名义响响应变量有多个量有多个类别(即名(即名义、无序)、无序)时,多多项logit模型模型应采取把每个采取把每个类别与一个与一个基基线类别配成配成对,通常取最后一,通常取最后一类为参照,称参照,称为基基线-类别logit.13-143.Logit 模型模型-多分多分类类p有些有些协变量量为定量数据,定量数据,logistic回回归模型的模型的协变量量可以是定性名可以是定性名义数据。数据。这就需要就需要对名名义
6、数据数据进行行赋值。p通常某个名通常某个名义数据有数据有k个状个状态,则定定义变量量 代表前面的代表前面的k-1状状态,最后令,最后令k-1变量均量均为0或-1来来代表第代表第k个状个状态。p如婚姻状况有四种状如婚姻状况有四种状态:未婚、有配偶、:未婚、有配偶、丧偶和离偶和离婚,婚,则可以定可以定义三个指示三个指示变量量M1、M2、M3,用(1,0,0)、(0,1,0)、(0,0,1)、(0,0,0)或(-1,-1,-1)来来对以上四种状以上四种状态赋值。14-153.Logit 模型模型-多分多分类类15-16【例例】研究三个学校、两个研究三个学校、两个课程程计划划对学生偏好何种学生偏好何种
7、学学习方式的影响。方式的影响。调查数据数据见表表:p其中,三个学校其中,三个学校对应两个两个哑变量量x1和x2(学校一(1.0)学校二(0.1)学校三(0.0),两个两个课程程计划划为常常规(M=1)和附加和附加(M=0),学,学习方式分方式分为:自修自修(y=1)、小、小组(y=2)、上、上课(y=3)p从从题目可以看出,响目可以看出,响应变量是学量是学习方式有三方式有三类,属,属于多于多项逻辑斯蒂回斯蒂回归问题。于是,建模。于是,建模为:3.Logit 模型模型-多分多分类类(名(名义义)16-173.Logit 模型模型-多分多分类类(有序)(有序)p对有序数据的有序数据的赋值可以按可以按顺序用数序用数0,1,2,3,4分分别表示表示p 17-183.Logit 模型模型-多分多分类类(有序)(有序)p p 18-193.Logit 模型模型-多分多分类类(有序)(有序)19-