资源描述
第六章 受限因变量模型
Chapter 6 受限因变量模型
本章讨论的一类模型是因变量的取值受到限制,有时候这种限制不需要特别的处理,但有时候这种限制却另有含义。特别,取有限个离散值,如(表示赞成),(表示反对)。于是,用线性回归模型来表示就不合适了,我们将依据受不同限制的情况处理几类不同的非线性模型,并只给非线性模型的估计检验方法——极大似然方法
一、离散响应模型
有时,我们只观察到处于某种状态,用1表示;用0表示不出于该状态,如,(就业),(失业),或仅有几种很少的状态可供选择,我们把仅取有限的离散值情况称为离散响应模型。
同样,影响的状态的因素称为解释变量或相关变量,可能包括有关个体的各种情况,如表示教育程度,年龄,性别……他们都有可能影响的状态。
关心的问题:多大程度上影响了的状态。
设
那么对连续变量
对二元变量(取0,1)
以上两式,如果已知,就近的反映了对于的状态的影响,
如何确定?
(一)二元响应的线性概率模型
最简单,将改写成
∵,则
∴
且
∴,且
这说明,如果用线性投影来拟合,存在条件异方差(与样本有关)
注意:1、当取连续值:
2、当取离散值,
如果参数未知,由可知,利用,给定样本,,1,,可得的一致估计。又由存在条件异方差,故不是有效的,再改用加权最小二乘(WLS)加以修正,做法是,对所有满足条件的样本,定义标准差,然后对,做回归,得,可增加有效性。
关于检验,所有关于的检验,检验的以及部分参数为0的检验,单用稳健的异方差标准差,都是有效的,但是线性概率模型在理论上是有欠缺的,因为拟合值有可能不在区间内,即使都在中,但预测值随差其解释变量不断增加而减少,终将导致不在区间内,这与概率的意义是不符合的。
尽管如此,如果主要目的是估计中每个解释变量对的影响平均概率,那么一些预测值不在中影响不大,线性概率模型不必对取极端值给出一个好的估计。
(二) 二元响应的指数模型(probit logit)
二元响应的概率有
这里,
,特别就是线性概率模型,因为先把看成一个指数,函数再把指数映射成一个响应函数,故称模型为指数模型,在实践中一般取形分布函数的形式。
如果是某一随机变量的分布函数,那么二元响应的指数模型可以从如下的潜在变量模型推出。
∵,
∴不可观测,这里是关于原点对称的连续型随机变量,如果是的分布函数,那么,是关于原点对称,即
因此,
注:没有特别的理由要求是关于原点对称的,为了方便对二元响应模型已作为一种习惯限制,没有此限制的二元响应模型就不能完成,特殊的潜在变量模型,不采用潜在变量的说法是因为没有准确的定义。有替代变量的含义或测量单位,从而的大小也没有特定的定义。
一般对的要求也不需要非是分布函数,只要满足在区间即可,但在实际应用时,,有两个常用的选择,一个是服从标准正态分布,称probit模型;另一个,服从标准的logistic分布,成为logit模型。
1、当服从标准正态分布,则的分布函数形式为
2、当服从logistic的分布,则,
有性质,
于是,在指数模型中,的含义就不如线性概率模型那样有定量的意义:
,因为当连续时,,
∴如果是分布函数,则,,故的符号给出了对的正影响和负影响,的大小则没有太大的增量意义。
另外,当的密度关于原点对称时,时,取得最大值,从而在
时对有最大影响。
其次当是二元解释变量,那么当改变到1,其他变量不变,对产生的偏效应就是
该值是依赖于其他解释变量取值,不过的符号同样能决定对产生的偏效应是正还是负。
由
有时也常用表示改变百分之一对产生的偏效应。
(三)二元响应的极大似然估计和检验
给定观测值;,即要求
∵
∴
求极限,得一阶条件,,
得,
这是一个非线性方程组,采用非线性方程算法可求得的极大似然估计量。
注:一般情况下,要求上述方程有解,要求样本容量是,自变量个数和的均值满足条件。含义是,取1的个数和取0的个数都必须大于,例如都取1,则方程无解。
∴当取标准正态公布时,
∴一阶条件就是表示成
注:二元响应也有存在有解释变量有内生性的问题,以及类似的二阶段极大似然估计,也可以扩到面板模型上
二、.截取回归模型简介
因变量还可能要到客观条件的限制,使其在某一范围外的数据无法得到,或有意不曲,由于结果的数据获得收到限制,且解释变量是在结果受限条件下获得的数据,意味着样本和不再是独立同时获取而在条件下获取的数据,本质上会导致参数对样本依赖的非线性,统一称为截取回归模型。
因变量受限的模型主要归为二类:一是截断,即“掐头”或“去尾”。例如,调查个人收入只能有一定范围内得到;另一类是归并,例如调查寿命大于80岁以上的一般用80岁代替。
截断或归并导致ols不再是一个好估计,改用极大似然方法,保证大样本下估计的一致性。问题的关键是,确定截取或归并后的条件分布函数,以使求得它的极大似然函数。
(一)截取回归模型
考虑,不可观测时正确设定,但或,可观测且在给定、条件下,。
特别,则表示非负观测限制。
(二)归并模型
考虑,或且
截取回归模型也同样有中变量存在内生性的问题,以及面板数据截面模型中不可观测下的异质性问题
5
展开阅读全文