1、多元离散选择模型多元离散选择模型胡胡 枫枫北京科技大学经济管理学院北京科技大学经济管理学院二二一一年十月一一年十月北京科技大学经济管理学院 胡 枫2本讲内容本讲内容多元离散选择模型多元离散选择模型定序选择模型定序选择模型一、多元离散选择模型北京科技大学经济管理学院 胡 枫4问题:农村异地转移劳动力的迁移目的地问题:农村异地转移劳动力的迁移目的地被解释变量:被解释变量:迁移目的地,即小城镇、县级市、地级市、迁移目的地,即小城镇、县级市、地级市、省级城市和超大城市,依次取值省级城市和超大城市,依次取值1、2、3、4、5。解释变量:解释变量:个人特征、家庭特征和目前所在地属性个人特征、家庭特征和目前
2、所在地属性。连续连续变量变量包括受教育程度、家庭规模、家庭内其他劳动力人数、包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。产量、中学生在校人数、小学生在校人数等。离散变量离散变量包包括性别、婚姻状况、收入稳定与否,目前所在地所属级别括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。与家乡所在地所属级别等。与上次讲的有何不同?北京科技
3、大学经济管理学院 胡 枫5Multinomial Logistic ModelMultinomial logistic regression involves nominal response variables more than two categories Multinomial logit models are multi-equation modelsA response variable with j+1 categories will generate j equationsEach of these j equations is a binary logistic regres
4、sion comparing a group with the reference group Multinomial logistic regression simultaneously estimates the j logits北京科技大学经济管理学院 胡 枫6多元离散选择多元离散选择Logit模型模型如果决策者如果决策者i在(在(J+1)项可供选择方案中选择了第)项可供选择方案中选择了第j项,那项,那么其效用模型为:么其效用模型为:如果(J+1)个随机误差项互不相关,并且服从类极值分布 选择j的概率北京科技大学经济管理学院 胡 枫7多元离散选择多元离散选择Logit模型模型北京科技大学
5、经济管理学院 胡 枫8多元离散选择多元离散选择Logit模型模型X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。令B0=0,j=1,2,J北京科技大学经济管理学院 胡 枫9Multinomial Logistic ModelTherefore,we can obtain the following probabilities relative to the reference group:The coefficients,represent the log odds of being in the target groups relative to t
6、he reference group北京科技大学经济管理学院 胡 枫10参数估计参数估计北京科技大学经济管理学院 胡 枫11Ex1.Binary Logistic Model ResultDependent variable:honcomp北京科技大学经济管理学院 胡 枫12Stata Output北京科技大学经济管理学院 胡 枫13Multinomial Logistic Model ResultDependent variable:prog北京科技大学经济管理学院 胡 枫14Stata Output北京科技大学经济管理学院 胡 枫15例例2 2 农村异地转移劳动力的迁移目标研究农村异地转移
7、劳动力的迁移目标研究被解释变量:被解释变量:迁移目标,即小城镇、县级市、地级市、省迁移目标,即小城镇、县级市、地级市、省级城市和超大城市,依次取值级城市和超大城市,依次取值1、2、3、4、5。解释变量:解释变量:个人特征和目前所在地属性个人特征和目前所在地属性。连续变量连续变量包括受包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校
8、人数、小学生在校人数等。生在校人数、小学生在校人数等。离散变量离散变量包括性别、婚包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。地所属级别等。虽然作为被解释变量的城市规模本身是有序的,但是对于虽然作为被解释变量的城市规模本身是有序的,但是对于农村劳动力来说,选择进入哪一个级别的城市,本身是无农村劳动力来说,选择进入哪一个级别的城市,本身是无序的,因此对于城市化迁移目标构造序的,因此对于城市化迁移目标构造多元名义多元名义logit离散选离散选择模型择模型。北京科技大学经济管理学院 胡 枫16调查样本:有效样本调查样本
9、:有效样本303份。份。用统计软件进行估计与分析(用统计软件进行估计与分析(SAS、Stata、SPSS均可)均可)。首先将定义的全部变量放进模型中进行估计,并首先将定义的全部变量放进模型中进行估计,并通过比通过比较各个变量的较各个变量的P值来考虑具体剔除哪些变量以及对哪些值来考虑具体剔除哪些变量以及对哪些变量考虑将其交互影响的效应放进模型中去变量考虑将其交互影响的效应放进模型中去。小城镇、县级市、地级市、省级城市和超大城市依次取小城镇、县级市、地级市、省级城市和超大城市依次取值值1、2、3、4、5。北京科技大学经济管理学院 胡 枫17最终模型的估计结果(部分)最终模型的估计结果(部分)*代表
10、的是90的显著性水平,*代表的是95的显著性水平,*代表的是99的显著性水平。变量 模型序号 系数估计 标准差 P值 1 1.2137 1.4518 0.4032 2*2.7685 1.0998 0.0118 3*2.3962 0.9351 0.0104 常数项 4*3.6742 1.0665 0.0006 1*-0.2475 0.1050 0.0184 2*-0.2800 0.0727 0.0001 3*-0.1136 0.0660 0.0852 教育程度 4-0.0856 0.0696 0.2184 1-0.1299 0.1084 0.2310 2*-0.0943 0.0552 0.087
11、7 3-0.0337 0.0452 0.4556 家庭情况 4*-0.1578 0.0586 0.0071 北京科技大学经济管理学院 胡 枫18教育程度、家庭情况及现有收入对迁移目标的影响教育程度、家庭情况及现有收入对迁移目标的影响:Log(小城镇/超大城市)Log(县级市/超大城市)Log(地级市/超大城市)Log(省级市/超大城市)北京科技大学经济管理学院 胡 枫19从教育程度来看从教育程度来看,所有系数都是负值,教育程度越高的农村,所有系数都是负值,教育程度越高的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,
12、县级市被选择的可能性最小,其次是小对于超大城市来说,县级市被选择的可能性最小,其次是小城镇,然后是地级城市,而教育程度相似的农村劳动力在省城镇,然后是地级城市,而教育程度相似的农村劳动力在省级城市与超大城市之间的选择没有明显的差异级城市与超大城市之间的选择没有明显的差异从家庭情况来看从家庭情况来看,所有系数都是负值,也就是说家庭情况越,所有系数都是负值,也就是说家庭情况越好的农村劳动力越愿意进入规模较大的城市;从显著性水平好的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,省级城市最不容易被选中,其来看,相对于超大城市来说,省级城市最不容易被选中,其次是县级市,而小城
13、镇与地级市之间没有明显区别次是县级市,而小城镇与地级市之间没有明显区别从现有收入来看从现有收入来看,所有系数都是负值,也就是说目前收入越,所有系数都是负值,也就是说目前收入越高的农村劳动力越愿意进入规模较大的城市;再从显著性水高的农村劳动力越愿意进入规模较大的城市;再从显著性水平来看,所有系数都是显著的,这说明相对于任何级别的城平来看,所有系数都是显著的,这说明相对于任何级别的城市而言,农村劳动力都更倾向于超大城市市而言,农村劳动力都更倾向于超大城市结果解释结果解释北京科技大学经济管理学院 胡 枫20Other Models for Nominal OutcomesConditional Lo
14、gitAttributes of choices can be used as predictorsExample:way of transportation(car,bus,bike)time,wealth,and ageNested LogitTreats a set of choices as a hierarchyIIA assumption can be relaxedExample:migration current(permanent,or temporary),or return?北京科技大学经济管理学院 胡 枫21一是研究选择某种方案的概率与决策者的特征变量之间的一是研究选择
15、某种方案的概率与决策者的特征变量之间的关系;关系;二是研究选择某种方案的概率与决策者的特征变量以及方二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。三是考虑到不同方案之间的相关性的情况。Multinomial Logit Model多项式Logit模型名义Logit模型Conditional Logit Model 条件Logit模型 Nested Logit模型嵌套模型 Three Types of Multiple Response Models二、定序选择模型北京科技大学经济管理学院 胡 枫231 1
16、、问题的提出、问题的提出作为被解释变量的(作为被解释变量的(J+1)个选择结果本身是排序)个选择结果本身是排序的,的,J优于(优于(J1),),2优于优于1,1优于优于0。决策者选择不同的方案所得到的效用也是排序的。决策者选择不同的方案所得到的效用也是排序的。一般多元离散选择模型中的效用关系不再适用。一般多元离散选择模型中的效用关系不再适用。北京科技大学经济管理学院 胡 枫24ExampleA study looks at factors that influence the decision of whether to apply to graduate school.College jun
17、iors are asked if they are unlikely,somewhat likely,or very likely to apply to graduate school.Hence,our outcome variable has three categories.Data on parental educational status,whether the undergraduate institution is public or private,and current GPA is also collected.北京科技大学经济管理学院 胡 枫252 2、效用关系、效
18、用关系选择不同方案的效用关系:选择不同方案的效用关系:北京科技大学经济管理学院 胡 枫263 3、模型、模型为了保证所有的概率都是正的,必须有为了保证所有的概率都是正的,必须有:假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率 为正态分布的概率函数ML estimation北京科技大学经济管理学院 胡 枫27Ex3.CeilphoneObjective:Consumer preference for different ceilphoneData SourceThe EDP students from GSMA total of 1451 obse
19、rvations北京科技大学经济管理学院 胡 枫28Variables北京科技大学经济管理学院 胡 枫29Linear Regression?One common/convenient way,but北京科技大学经济管理学院 胡 枫30A Latent Variable Model北京科技大学经济管理学院 胡 枫31The Ordinal Regression Model北京科技大学经济管理学院 胡 枫32Two Popular Models北京科技大学经济管理学院 胡 枫33Another Formulation北京科技大学经济管理学院 胡 枫34The Log Likelihood北京科技
20、大学经济管理学院 胡 枫35The Z-Test北京科技大学经济管理学院 胡 枫36Likelihood Ratio TestWe have seen this before!北京科技大学经济管理学院 胡 枫37Ordered Probit Model北京科技大学经济管理学院 胡 枫38SPSS Results北京科技大学经济管理学院 胡 枫39SPSS Results北京科技大学经济管理学院 胡 枫40STATA Results北京科技大学经济管理学院 胡 枫41Ex4.Parents Long-Distance Migration,Remittances,and Educational Performance of Left-Behind ChildrenContribution北京科技大学经济管理学院 胡 枫42Literature review北京科技大学经济管理学院 胡 枫43Data北京科技大学经济管理学院 胡 枫44Empirical Model北京科技大学经济管理学院 胡 枫45Empirical Model北京科技大学经济管理学院 胡 枫46Results北京科技大学经济管理学院 胡 枫47Results北京科技大学经济管理学院 胡 枫48Results北京科技大学经济管理学院 胡 枫49Conclusions