资源描述
(完整word)权函数估计
权函数估计
权函数方法的系统研究始于Stone(1977),最常用的权函数方法是核估计和近邻估计。使用无参数平滑技术时应该意识到关于被估回归曲线的最终确定存在一定的主观性,因为即使是渐近最优平滑也含有相当部分的噪音,留给人们主观选择的余地。
1. 权函数估计
给定样本,权函数估计就是条件回归函数的估计,可表示成下述形式:
(6.3)
其中权函数,,满足,。 在给定样本时,权函数实际上是一矩阵。用下式来理解可能更直观:
, (6.4)
从(6.3)可看出,条件回归函数的估计是的线性组合,对应所得到的被解释变量的估计是的加权平均,权数利用了解释变量的信息,且由解释变量的数值来确定每个的权数的大小。(6。4)说明,每个被解释变量样本的估计值都是所有Y样本的加权平均,但的权数和对应的解释变量有关,此处为维向量(X的全部样本是阶矩阵)。
2。 核估计
核估计是权函数估计的一种方法,在于找到核权函数作为(6。3)中的权函数.核权函数是最重要的一种权函数,由此产生的估计,即核估计已有广泛的应用.
(1) Nadaraya-Watson核估计
Nadaraya(1964)及Watson (1964)提出了一种既适合解释变量是确定性变量,也适合解释变量是随机变量的核估计,其思路如下:选定概率密度
(6.5)
为核函数及窗宽,定义核权函数为:
(6.6)
其中也是一个概率密度。于是Nadaraya—Watson 核估计为:
(6.7)
当时,有
,
, (6.8)
可见,太小的窗宽得到除了数据点外其它点的函数值都为0的函数。
当时,,所以
(6。9)
可见,太大的窗宽得到过分光滑的曲线,接近于直线.
由上述可见,窗宽是控制核估计精度的重要参数。
3、常用核函数
核估计的核心问题就是核权函数的选择和窗宽的选择。核权函数在核估计中起光滑的作用,即消除扰动的随机因素,使所得曲线反映变量之间的实际经济关系。常用的核权函数有高斯(Gaussian) 和Epanechnikov核权函数。
a) 高斯核函数(Gaussian Kernel )
(6。10)
当X是一元时, 写成。高斯核为 ;
(6.12)
(6.13)
当X是一元时,.
定义高斯核权函数为:
b) Epanechnikov 核
Epanechnikov核为:
(6.14)
其中。 括号外的+表示括号内的值大于0时取函数值,括号内的值小于0时取0。为解释变量个数,当时,有
解释变量为多个时:
(6。15)
Epanechnikov核权函数为:
多元的核函数也可由一元的核函数来构造:
(6.16)
其中为一元的核函数。
(6。17)
其中为窗宽向量。实际应用常以上式来处理。
多元核权函数为
(6。18)
窗宽甚至可以为窗宽矩阵,设为多元核函数,
(6。19)
其中是正定矩阵,称之为窗宽矩阵。
多元核权函数为
(6。20)
展开阅读全文