第六章_受限因变量模型__颜莹.doc

资源描述

第六章受限因变量模型 Chapter 6 受限因变量模型本章讨论的一类模型是因变量的取值受到限制，有时候这种限制不需要特别的处理，但有时候这种限制却另有含义。特别，取有限个离散值，如（表示赞成），（表示反对）。于是，用线性回归模型来表示就不合适了，我们将依据受不同限制的情况处理几类不同的非线性模型，并只给非线性模型的估计检验方法——极大似然方法一、离散响应模型有时，我们只观察到处于某种状态，用1表示；用0表示不出于该状态，如，（就业），（失业），或仅有几种很少的状态可供选择，我们把仅取有限的离散值情况称为离散响应模型。同样，影响的状态的因素称为解释变量或相关变量，可能包括有关个体的各种情况，如表示教育程度，年龄，性别……他们都有可能影响的状态。关心的问题：多大程度上影响了的状态。设那么对连续变量对二元变量（取0，1）以上两式，如果已知，就近的反映了对于的状态的影响，如何确定？（一）二元响应的线性概率模型最简单，将改写成 ∵，则 ∴ 且 ∴，且这说明，如果用线性投影来拟合，存在条件异方差（与样本有关）注意：1、当取连续值： 2、当取离散值，如果参数未知，由可知，利用，给定样本，，1，，可得的一致估计。又由存在条件异方差，故不是有效的，再改用加权最小二乘（WLS）加以修正，做法是，对所有满足条件的样本，定义标准差，然后对，做回归，得，可增加有效性。关于检验，所有关于的检验，检验的以及部分参数为0的检验，单用稳健的异方差标准差，都是有效的，但是线性概率模型在理论上是有欠缺的，因为拟合值有可能不在区间内，即使都在中，但预测值随差其解释变量不断增加而减少，终将导致不在区间内，这与概率的意义是不符合的。尽管如此，如果主要目的是估计中每个解释变量对的影响平均概率，那么一些预测值不在中影响不大，线性概率模型不必对取极端值给出一个好的估计。（二）二元响应的指数模型（probit logit）二元响应的概率有这里，，特别就是线性概率模型，因为先把看成一个指数，函数再把指数映射成一个响应函数，故称模型为指数模型，在实践中一般取形分布函数的形式。如果是某一随机变量的分布函数，那么二元响应的指数模型可以从如下的潜在变量模型推出。 ∵， ∴不可观测，这里是关于原点对称的连续型随机变量，如果是的分布函数，那么，是关于原点对称，即因此，注：没有特别的理由要求是关于原点对称的，为了方便对二元响应模型已作为一种习惯限制，没有此限制的二元响应模型就不能完成，特殊的潜在变量模型，不采用潜在变量的说法是因为没有准确的定义。有替代变量的含义或测量单位，从而的大小也没有特定的定义。一般对的要求也不需要非是分布函数，只要满足在区间即可，但在实际应用时，，有两个常用的选择，一个是服从标准正态分布，称probit模型；另一个，服从标准的logistic分布，成为logit模型。 1、当服从标准正态分布，则的分布函数形式为 2、当服从logistic的分布，则，有性质，于是，在指数模型中，的含义就不如线性概率模型那样有定量的意义：，因为当连续时，， ∴如果是分布函数，则，，故的符号给出了对的正影响和负影响，的大小则没有太大的增量意义。另外，当的密度关于原点对称时，时，取得最大值，从而在时对有最大影响。其次当是二元解释变量，那么当改变到1，其他变量不变，对产生的偏效应就是该值是依赖于其他解释变量取值，不过的符号同样能决定对产生的偏效应是正还是负。由有时也常用表示改变百分之一对产生的偏效应。（三）二元响应的极大似然估计和检验给定观测值；，即要求 ∵ ∴ 求极限，得一阶条件，，得，这是一个非线性方程组，采用非线性方程算法可求得的极大似然估计量。注：一般情况下，要求上述方程有解，要求样本容量是，自变量个数和的均值满足条件。含义是，取1的个数和取0的个数都必须大于，例如都取1，则方程无解。 ∴当取标准正态公布时， ∴一阶条件就是表示成注：二元响应也有存在有解释变量有内生性的问题，以及类似的二阶段极大似然估计，也可以扩到面板模型上二、.截取回归模型简介因变量还可能要到客观条件的限制，使其在某一范围外的数据无法得到，或有意不曲，由于结果的数据获得收到限制，且解释变量是在结果受限条件下获得的数据，意味着样本和不再是独立同时获取而在条件下获取的数据，本质上会导致参数对样本依赖的非线性，统一称为截取回归模型。因变量受限的模型主要归为二类：一是截断，即“掐头”或“去尾”。例如，调查个人收入只能有一定范围内得到；另一类是归并，例如调查寿命大于80岁以上的一般用80岁代替。截断或归并导致ols不再是一个好估计，改用极大似然方法，保证大样本下估计的一致性。问题的关键是，确定截取或归并后的条件分布函数，以使求得它的极大似然函数。（一）截取回归模型考虑，不可观测时正确设定，但或，可观测且在给定、条件下，。特别，则表示非负观测限制。（二）归并模型考虑，或且截取回归模型也同样有中变量存在内生性的问题，以及面板数据截面模型中不可观测下的异质性问题 5

展开阅读全文