收藏 分销(赏)

第九章 二元选择模型.ppt

上传人:xrp****65 文档编号:13047452 上传时间:2026-01-10 格式:PPT 页数:47 大小:472.50KB 下载积分:10 金币
下载 相关 举报
第九章 二元选择模型.ppt_第1页
第1页 / 共47页
第九章 二元选择模型.ppt_第2页
第2页 / 共47页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第九章 离散被解释变量数据计量经济学模型,二元选择模型,Models with Discrete Dependent VariablesBinary Choice Model,一、二元离散选择模型的经济背景,二、二元,LPM,、,Probit,和,Logit,离散选择模型及其参数估计,三、二元离散选择模型的变量显著性检验,说明,在经典计量经济学模型中,被解释变量通常被假定为连续变量。,离散被解释变量数据计量经济学模型(,Models with Discrete Dependent Variables,)和离散选择模型,(DCM,Discrete Choice Model),。,二元选择模型,(Binary Choice Model),和多元选择模型,(Multiple Choice Model),。,本节只介绍二元选择模型。,离散选择模型起源于,Fechner,于,1860,年进行的动物条件二元反射研究。,1962,年,,Warner,首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。,70,、,80,年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。,模型的估计方法主要发展于,80,年代初期。,一、二元离散选择模型的经济背景,实际经济生活中的二元选择问题,研究选择结果与影响因素之间的关系。,影响因素包括两部分:,决策者的属性,和,备选方案的属性,。,对于单个方案的取舍。例如,购买者对某种商品的购买决策问题,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由,决策者的属性决定。,对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由,决策者的属性,和,备选方案的属性共同决定。,二、二元离散选择模型,1.,线性概率,(LPM),模型,假设有以下二元选择模型:,(9.1),其中,,Xi,是包含常数项的,k,元解释变量,,假设在给定,Xi,的时候,,Yi=1,的概率为,p,,即 ,则在给定,Xi,的时候,,Yi=0,的概率为,1-p,,即 。,当,(9.1),式满足 时 ,,(9.2),另外,因为,Yi,只取,1,和,0,两个值,其条件期望为,(9.3),综合,(9.2),式和,(9.3),式得:,(9.4),因此,,(9.1),式拟合的是当给定解释变量,Xi,的值时,某事件发生(即,Yi,取值为,1,)的平均概率。在,(9.4),式中,这一概率体现为线性的形式 ,因此,(9.1),式称为线性概率模型(,Linear Probability Model,,,LPM,)。,对于线性概率模型,可以采用普通最小二乘法进行估计,但是会存在一些问题。常见的问题和相应的解决方法如下:,(1),对,(9.1),式的拟合的结果是对某一事件发生的平均概率的预测,即,但是,的值并不能保证在,0,和,1,之间,完全有可能出现大于,1,和小于,0,的情形。实际应用中,当出现的预测值大于,1,或小于,0,的情况不是太多时,如果预测值大于,1,,就把它看作是等于,1,,如果预测值小于,0,,就把它看作是等于,0.,(2),由于,Y,是二元变量,因此扰动项,也应该是二元变量,它应该服从二项分布,而不是我们通常假定的正态分布。但是,当样本足够多时,二项分布收敛于正态分布。,(3),在,LPM,中,扰动项的方差为:,因此,扰动项是异方差的。为了克服异方差,可以采用处理异方差的方法去估计模型。,(4),由于因变量是二元选择的结果,因此按传统线性回归模型所计算的判定系数,R2,不再有实际的意义。可以定义,当,Y,的实际预测的值大于,0.5,时,我们视其预测值为,1,;当小于,0.5,时,视其预测值为,0,。然后比较预测值与实际值是否存在差异,如果不存在差异,则认为是正确的预测。然后将正确的预测的个数与总预测个数比较,得到一个新的拟合优度的指标。,(5),边际效应的分析,对,LPM,进行边际效应分析得:,因此,当解释变量是非虚拟变量时,表示的是解释变量变动一个单位时对,Y,取值为,1,的平均概率的影响。如果解释变量是虚拟变量,则 表示的是虚拟解释变量取值为,1,和取值为,0,时,,Y,的取值为,1,的概率的差异。因此,,LPM,的边际效应是一个常数,,它与解释变量取值的大小无关。,在,LPM,中,假设,Yi=1,的概率是线性的,也就是假设,中的函数,F,为恒等函数,即,但是,不能保证概率的取值在,0,和,1,之间。,标准正态分布的概率分布函数,逻辑分布的概率分布函数,如果将函数,F,定义为标准正态分布函数 ,即,会把概率的取值限定在,0,和,1,之间,,这时的概率模型称为,Probit,模型。,如果将函数,F,定义为,Logistic,分布函数 ,,则产生的概率模型为,Logit,模型,:,同样,也将概率的取值限定在,0,和,1,之间。,2.Probit,模型,考察以下模型,(9.6),其中,,Y,i*,是潜变量或隐变量,(Latent Variable),,它无法获得实际观测值,但是却可以观测到它的性状,如,Y,i*0,或,Y,i*0,。因此,我们实际上观测到的变量是,Y,i,而不是,Y,i*,。,(9.6),式称为潜变量反应函数(,Latent Response Function,)或指示函数,(Index Function),。,一般假设:,A1,:;,A2,:是,i.i.d,.,的正态或,Logistic,分布;,A3,:。,在,A1A3,的假定之下,考察,(9.6),式中,Yi,的概率特征:,(9.7),当 为标准正态分布的概率密度函数,时,,(9.7),式可以写成:,(9.8),这样,,(9.8),式正是,Probit,模型。,3.Logit,模型,当,(9.7),式中的 是,Logistic,的概率密度函数时,,(9.7),式可以进一步表达为,(9.9),(9.9),式正是,Logit,模型。,边际效应分析,对于,Probit,模型来说,其边际效应为:,(9.10),对于,Logit,模型,其边际效应为:,(9.11),其中,。,从,(9.10),式和,(9.11),式中可以看到,,Probit,和,Logit,模型中解释变量对,Yi,取值为,1,的概率的边际影响不是常数,它会随着解释变量取值的变化而变化。对于非虚拟的解释变量,一般是用其样本均值代入到,(9.10),式和,(9.11),式中,估计出平均的边际影响。,但是,对于虚拟解释变量而言,则需要先分别计算其取值为,1,和,0,时的值,二者的差即为虚拟解释变量的边际影响。,最大似然估计(,MLE,),Probit,和,Logit,模型都是非线性模型,不能用,OLS,法估计。对于非线性模型的估计方法之一是最大似然法。,对于,Probit,或,Logit,模型来说,,所以似然函数为,对数似然函数为,(9.12),最大化,logL,的一阶条件为,(9.13),由于,(9.13),式不存在封闭解,所以要用非线性求解的迭代法求解。常用的迭代方法之一是建立在泰勒级数展开基础上的,Newton-,Raphson,迭代法或二次攀峰算法(,Quadratic Hill Climbing,)。,似然比检验和拟合优度,似然比检验类似于检验模型整体显著性的,F,检验,原假设为全部解释变量的系数都为,0,,检验的统计量,LR,为:,(9.14),其中,,lnL,为对概率模型进行,MLE,估计的对数似然函数值,,lnL0,为估计只有截距项的模型的对数似然函数值。当原假设成立时,,LR,的渐近分布是自由度为,k-1,(即除截距项外的解释变量的个数)的 分布。,对于,Probit,和,Logit,模型,同样可以计算,(9.5),式中,的以反映模型的拟合优度。此外,还可以计算类似于传统,R,2,的,McFadden,似然比指数,(McFaddens Likelihood Ratio Index),来度量拟合优度。似然比指数的定义为,(9.15),McFadden R,2,总是介于,0,和,1,之间。当所有的斜率系数都为,0,时,,McFadden R,2,=0,,但是,,McFadden R,2,不会恰好等于,1,。,McFadden R,2,越大,表明拟合得越好。,例,贷款决策模型,分析与建模:,某商业银行从历史贷款客户中随机抽取,78,个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(,CC,)和“市场竞争地位等级”(,CM,),对它们贷款的结果(,JG,)采用二元离散变量,,1,表示贷款成功,,0,表示贷款失败。目的是研究,JG,与,CC,、,CM,之间的关系,并为正确贷款决策提供支持。,样本观测值,CC=XY,CM=SC,该方程表示,,当,CC,和,CM,已知时,代入方程,可以计算贷款成功的概率,JGF,。例如,将表中第,19,个样本观测值,CC=15,、,CM=,1,代入方程右边,计算括号内的值为,0.1326552,;查标准正态分布表,对应于,0.1326552,的累积正态分布为,0.5517,;于是,,JG,的预测值,JGF=1,0.5517=0.4483,,即对应于该客户,贷款成功的概率为,0.4483,。,输出的估计结果,模拟预测,预测:,如果有一个新客户,根据客户资料,计算的“商业信用支持度”(,XY,)和“市场竞争地位等级”(,SC,),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。,3,、重复观测值可以得到情况下二元,Probit,离散选择模型的参数估计,对每个决策者有多个重复(例如,10,次左右)观测值。,对第,i,个决策者重复观测,n,i,次,选择,y,i,=1,的次数比例为,p,i,,那么可以将,p,i,作为真实概率,P,i,的一个估计量。,建立“概率单位模型”,采用广义最小二乘法估计。,实际中并不常用。,Brsch-Supan,于,1987,年指出,:,如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用,Logit,模型。,Probit,0.999999,1.000000,0.447233,0.000000,3,、重复观测值可以得到情况下二元,logit,离散选择模型的参数估计,对每个决策者有多个重复(例如,10,次左右)观测值。,对第,i,个决策者重复观测,n,i,次,选择,y,i,=1,的次数比例为,p,i,,那么可以将,p,i,作为真实概率,P,i,的一个估计量。,建立“对数成败比例模型”,采用广义最小二乘法估计。,实际中并不常用。,详见教科书。,三、二元离散选择模型的变量显著性检验,1,、检验假设,经典模型中采用的变量显著性,t,检验仍然是有效的。,如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种省略是否恰当。,2,、统计量,如果,X2,中的变量省略后对参数估计量没有影响,那么,H1,和,H0,情况下的对数最大似然函数值应该相差不大,此时,LR,统计量的值很小,自然会小于临界值,不拒绝,H0,。,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 行业资料 > 医学/心理学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服