收藏 分销(赏)

空间计量与stata命令分解.ppt

上传人:a199****6536 文档编号:1713648 上传时间:2024-05-08 格式:PPT 页数:60 大小:1.52MB
下载 相关 举报
空间计量与stata命令分解.ppt_第1页
第1页 / 共60页
空间计量与stata命令分解.ppt_第2页
第2页 / 共60页
空间计量与stata命令分解.ppt_第3页
第3页 / 共60页
空间计量与stata命令分解.ppt_第4页
第4页 / 共60页
空间计量与stata命令分解.ppt_第5页
第5页 / 共60页
点击查看更多>>
资源描述

1、1 1第讲第讲 空间计量经济学初步空间计量经济学初步2 2地理学第一定律地理学第一定律 世界上万千事物的状态都可以由一个三维的空间坐标世界上万千事物的状态都可以由一个三维的空间坐标系与一个一维的时间坐标系来唯一刻画。时间或空间上系与一个一维的时间坐标系来唯一刻画。时间或空间上距离相近的两个事物的状态是相互关联的,即不能被认距离相近的两个事物的状态是相互关联的,即不能被认为是相互独立的,且两事物越是接近,它们状态的相关为是相互独立的,且两事物越是接近,它们状态的相关性越强。当两点距离为零性越强。当两点距离为零(实则是同一个体实则是同一个体),它们将完全,它们将完全相关。越是相距遥远的事物相关性越

2、弱,当两事物之间相关。越是相距遥远的事物相关性越弱,当两事物之间距离为无穷远,可近似地认为两者完全不相关。距离为无穷远,可近似地认为两者完全不相关。概述概述3 3空间计量经济学空间计量经济学(spatial econometrics)空间计量经济学作为现代微观计量经济学空间计量经济学作为现代微观计量经济学(micro-econometrics)的一个分支,是旨在为的一个分支,是旨在为处理截面数据或面板数据中的空间效应处理截面数据或面板数据中的空间效应(spatial effect),空间相关性,空间相关性(spatial dependence)与与空间异质性空间异质性(spatial hete

3、rogeneity)发展专门的发展专门的建模、估计与统计检验方法。建模、估计与统计检验方法。一、概述一、概述4 4概述概述 在时间序列分析中,时间自回归过程将在时间序列分析中,时间自回归过程将时刻时刻t的反应变量与过去时刻的变量相联系,的反应变量与过去时刻的变量相联系,表示一时刻所发生的事件受过去时间发生表示一时刻所发生的事件受过去时间发生事件结果的影响。如:事件结果的影响。如:5 5概述概述空间相关性是指一地所发生的事件,行为空间相关性是指一地所发生的事件,行为与现象,会直接或间接影响到另一地发生与现象,会直接或间接影响到另一地发生的事件行为和现象。因此某一处的观测与的事件行为和现象。因此某

4、一处的观测与其他各地观测之间存在着函数关系。其一其他各地观测之间存在着函数关系。其一般表达为般表达为6 6空间相关性的根源空间相关性的根源 1.观测数据地理位置接近(geographical proximity)由于地理位置的接近而导致的空间相关性是空间相关性最初始的定义,与地理学第一定律吻合。这种相关性是环境,地质等学科中的普遍现象。空间相关来源空间相关来源7 7 空间相关来源空间相关来源2.截面上个体间互相竞争(competition)和合作 最典型的例子是在一个寡头竞争的市场中,厂商对自己产品定价时将同时对市场上其他厂商的价格作出反应,最后决定的价格将是博弈的均衡点。8 83.模仿行为(

5、copy cat)在一群体中,个体会重复或模仿一个或几个特定个体的行为。例如在班级中中游成绩的学生会以成绩优秀的学生为榜样,竞争性体育比赛中,选手会以领先选手为心中目标,在以上这些情况下,如果不考虑空间相关性,所建立的模型会和真实模型相差甚远。空间相关来源空间相关来源9 94.溢出效应(spillover effect)溢出效应是指经济活动和过程中的外部性对未参与经济活动和过程其中的周围个体的影响。散发有毒气体的植物会对周围的植物产生有害的影响,屋主拥有一座漂亮花园也显然对周围邻居有正效应。同样不断加强的贸易往来所带来的经济利益对地区性国家多边联盟的形成具有正的溢出效应。空间相关来源空间相关来

6、源10105.测量误差 A,B,C三处的观测本来是相互独立的,但是研究者由于无法准确识别A,B和B,C相邻的边界,而将整个区域分成两个部分I和II,在图中用两中颜色表示。显然,由于I和II共享B,所以有理由相信,I和II上的观测是空间相关的。空间相关来源空间相关来源1111 假设随机变量 ,和 互相独立,当 时,可以证明 不为零。我们把这种空间相关性的来源称为测量性误差。这一来源说明,当我们处理带有空间特性的数据时,无论经济理论是否明确显示空间相关性,我们都应该在设定模型形式时候对空间相关性给予足够重视和相应考虑。测量误差测量误差1212空间统计学VS空间计量经济学 首先首先,空间统计学的理论

7、是空间计量经济学发展的基,空间统计学的理论是空间计量经济学发展的基础。正如计量经济学其他分支的发展都广泛借助统计学础。正如计量经济学其他分支的发展都广泛借助统计学的理论,空间计量经济学也尽可能吸收一切可以利用的的理论,空间计量经济学也尽可能吸收一切可以利用的现存有关空间统计的理论。现存有关空间统计的理论。其次,统计学的应用范围不仅限于经济学一门学科。统计学的应用范围不仅限于经济学一门学科。某一空间统计学理论最初就是为处理经济学中的空间效某一空间统计学理论最初就是为处理经济学中的空间效应而提出,之后完全可能被应用到除经济学外的其他学应而提出,之后完全可能被应用到除经济学外的其他学科。空间计量经济

8、学补充和扩展了空间统计学。科。空间计量经济学补充和扩展了空间统计学。概述概述1313 最后最后,正如,正如Anselin(1988)所认为,空间统计所认为,空间统计学是以数据为出发点的学是以数据为出发点的(data-driven),而空间计,而空间计量经济学是以模型为出发点的量经济学是以模型为出发点的(model-driven)。这说明,由经济学问题建立合适的刻画相关性的这说明,由经济学问题建立合适的刻画相关性的计量模型,并发展相关的估计,假设检验,预测计量模型,并发展相关的估计,假设检验,预测方法才是空间计量经济学的主要任务。方法才是空间计量经济学的主要任务。概述概述1414空间权重矩阵空间

9、权重矩阵 计量经济学经常用线性模型来近似非线性模型,即可将 近似写成记 矩阵 的元素为 ,它的对角元素都为零。二、空间自相关二、空间自相关1515 一般我们无法利用容量为 的样本去估计 个参数。为了确保模型参数可识别,我们需要对 的形式加以限制。最常用的限制方式之一就是假设 其中 称为空间权重矩阵(spatial weighting matrix),它刻画的是截面上个体之间空间相关的结构,是一个无量纲的矩阵。称为是空间自回归系数,表示了空间相关性在给定空间结构下的方向和强弱。空间自相关空间自相关1616二元相关(0-1相关)例例1.1.1.在地图上的在地图上的 个子区域中,如果个子区域中,如果

10、 和和 具有相具有相邻的边界邻的边界(boundary),则定义,则定义 ,否则,否则 。空间自相关空间自相关1717 以上定义的空间权重矩阵有如下两大缺点以上定义的空间权重矩阵有如下两大缺点:(1)按以上定义,空间权按以上定义,空间权重矩阵总是一个对称阵,这显然是不符合有些情况的,例如现实中重矩阵总是一个对称阵,这显然是不符合有些情况的,例如现实中存在作用是单向或非对称双向的情形存在作用是单向或非对称双向的情形(模仿效应模仿效应),(2)0-1元素的设置元素的设置无法区分各邻居空间作用的强弱。无法区分各邻居空间作用的强弱。空间权重矩阵空间权重矩阵1818 克服以上两个缺点的办法之一是,定义克

11、服以上两个缺点的办法之一是,定义 其中其中 分子可以理解成是分子可以理解成是 和和 的边界相同部分的的边界相同部分的长度,分母是长度,分母是 与其他相邻接的个体边界的总长。与其他相邻接的个体边界的总长。根据这一定义所得的权重矩阵如下所示:根据这一定义所得的权重矩阵如下所示:空间权重矩阵空间权重矩阵1919 以以上上定定义义的的权权重重矩矩阵阵的的合合理理性性在在于于,如如果果j和和i同同时时和和k相相邻邻,则则由由于于j与与k和和i与与k相相邻邻的的边边界界长长度度不不同同,j和和k对对i的的空空间间作作用用分分别别不不同同,正正比比于于它它们们与与i相相接接的的边边界界的的长长度。度。空间权

12、重矩阵空间权重矩阵2020注意:n 对于模型而言,权重矩阵W的元素是非随机的、外生的。基于一个距离衰减函数、社会网络结构、经济距离、k个最邻近、经验流量矩阵等也可以确定空间权重,尽管这些选择可能间接表明空间权重的确定是相当任意的。2121附附1.1.基于距离的空间权值矩阵基于距离的空间权值矩阵 n根据距离标准,根据距离标准,为:为:n基于距离的空间权值矩阵(基于距离的空间权值矩阵(Distance Based Spatial Weights)方法是假定空间相互作用的强度是决定于地区)方法是假定空间相互作用的强度是决定于地区间的质心距离或者区域行政中心所在地之间的距离,是一间的质心距离或者区域行

13、政中心所在地之间的距离,是一种在实践应用中常用的空间权值矩阵。种在实践应用中常用的空间权值矩阵。2222n在这种情况下,不同的权值指标随距离在这种情况下,不同的权值指标随距离dij的定义而变化,的定义而变化,其取值取决于选定的函数形式(如距离的倒数或倒数的平其取值取决于选定的函数形式(如距离的倒数或倒数的平方,以及欧氏距离等)。方,以及欧氏距离等)。n当然,还需要定义一个门槛距离,超过了某给定的门槛距当然,还需要定义一个门槛距离,超过了某给定的门槛距离则区域间的相互作用可以忽略不计。离则区域间的相互作用可以忽略不计。2323附附2.2.经济社会流量空间权值矩阵经济社会流量空间权值矩阵 n除了使

14、用真实的地理坐标计算地理距离外,还除了使用真实的地理坐标计算地理距离外,还有包括经济和社会因素的更加复杂的权值矩阵有包括经济和社会因素的更加复杂的权值矩阵设定方法。设定方法。n比如,根据区域间交通运输流、通讯量、比如,根据区域间交通运输流、通讯量、GDP总额、贸易流动、资本流动、人口迁移、劳动总额、贸易流动、资本流动、人口迁移、劳动力流等确定空间权值,计算各个地区任何两个力流等确定空间权值,计算各个地区任何两个变量之间的距离。变量之间的距离。2424空间权值矩阵的选择空间权值矩阵的选择n尽尽管管二二进进制制的的空空间间邻邻近近权权值值矩矩阵阵并并非非适适用用于于所所有有的的空空间间计计量量经经

15、济济模模型型,但但是是,处处于于某某些些情情况况下下的的实实用用性性,空空间间统统计计学学家家在在构构建建空空间间计计量量模模型型时时的的首首选选就就是是从从二二进进制制的的邻邻近近矩矩阵开始的。阵开始的。n一一般般是是先先从从空空间间邻邻近近的的最最基基本本二二进进制制矩矩阵阵开开始始,逐逐步步选选择择确定空间权值矩阵。确定空间权值矩阵。n关关于于各各种种权权值值矩矩阵阵的的选选择择,没没有有现现成成的的理理论论根根据据,一一般般可可考考虑虑空空间间计计量量模模型型对对各各种种空空间间权权值值矩矩阵阵的的适适用用程程度度,检检验验估估计计结结果果对对权权值值矩矩阵阵的的敏敏感感性性,最最终终

16、的的依依据据实实际际上上就就是是结结果的客观性和科学性。果的客观性和科学性。n Anselin(1999,2003)研研制制开开发发的的空空间间统统计计分分析析软软件件GeoDa095i可可以以直直接接生生成成邻邻近近矩矩阵阵来来测测算算并并确确定定地地区区之之间的空间效应。间的空间效应。2525空间滞后算子 定义定义 的空间滞后的空间滞后 (列向量)为(列向量)为 的第的第i行是行是 ,这正是,这正是i所有邻居所有邻居的加权平均的加权平均,赋予邻居的权为赋予邻居的权为 。有时为了更加突有时为了更加突出加权平均的含义,我们可以令的每一行权数之和为出加权平均的含义,我们可以令的每一行权数之和为1

17、。空间滞后算子空间滞后算子2626地区YWAWBWcWDWEWF空间滞后算子A1200.50.30.50022.3B150.300.300023.5C350.30.5000.30.518.8D170.30000.3020E28000.30.500.524F20000.300.3031.52727为什么进行归一化处理?归归一一化化处处理理(行行和和单单位位化化)将将原原来来空空间间矩矩阵阵的的每每一一个个元元素素分分别别除除以以所所在在行行的的元元素素之之和和,这这使使得得 变变得得不不再再具具有有量量纲纲。由由于于 将将变变得得与与 具具有有相相同同的的量量纲纲,空空间间自自回回归归系系数数因

18、因此此具具有有更更加加清清晰晰准准确确的的含含义义,它它可可以以被被解解释释成成空空间间相相关关的的方方向向与与大大小小,且且不不同同模模型型之之间间还还可可以以进进行行直直接接的的比比较较。想一想想一想2828数据的空间自相关n在统计学中,我们用样本相关系数说明两个变量之间的相关:2929全局空间自相关指标n1.Moran指数(Morans I)n W是二进制权数。3030nMorans I的取值一般为-1,+1,解释同相关系数。n正空间自相关:相似的观测值在空间集聚;n负空间自相关:相似的观测值在空间分散;n无空间自相关:观测值在空间分布上没有规律(完全随机)。3131地区YWAWBWcW

19、DWEWFA12-9.101110082.3B15-6.110100036.8C3513.9110011194D17-4.110001016.6E286.9300110148F20-1.10010101.143232地区地区A A-108.84-108.84 55.05 55.05-126.35-126.35 36.91 36.91-62.86-62.86 9.70 9.70 B B-136.05-136.05 36.84 36.84-84.56-84.56 24.70 24.70-42.07-42.07 6.49 6.49 C C-317.45-317.45-84.56-84.56 194.

20、04 194.04-56.70-56.70 96.53 96.53-14.91-14.91 D D-154.19-154.19 24.70 24.70-56.70-56.70 16.56 16.56-28.21-28.21 4.35 4.35 E E-253.96-253.96-42.07-42.07 96.53 96.53-28.21-28.21 48.02 48.02-7.42-7.42 F F-181.40-181.40 6.49 6.49-14.91-14.91 4.35 4.35-7.42-7.42 1.14 1.14 3333地区地区A A055.1-12636.9100B B-1

21、360-85000C C-317-850096.5-14.91D D-154000-280E E0096.5-28.210-7.42F F00-150-7.40合计合计-608-30-1298.760.9-22.3334343535n2.Geary指数CnGearyC相当于时间序列中的DW统计量,I相当于一阶自相关系数。n DW2(1-)3636n全局G统计量3737局部空间自相关n空间联系的局部指标(Local indications of spatial association:LISA)描述该区域单元变量与周围区域单元的相似程度(即变量的集聚程度),与全局空间相关指标成比例。n包括局部M

22、orans I、局部Gearys C和Moran散点图。38381.Local Morans I2.Local G统计量39393.Moran散点图4040n横坐标是变量数据z,纵坐标是变量空间滞后wz。全局Morans I相当于回归系数(z、WZ标准化后,就是相关系数)。n四个象限:nHHnLHnLLnHL4141回归方程误差项的空间自相关诊断n对于回归模型4242检验误差项是否存在空间自相关的Moran统计量:4343Moran I统计量的零分布在一定的正则性假定下,当空间自相关不存在时,。证明从略。Moran I统计量统计量4444n如果如果Morans I的正态统计量的的正态统计量的Z

23、值绝对值大于值绝对值大于正态分布函数在正态分布函数在0.05(0.01)水平下的临界值)水平下的临界值1.65(1.96),表明在误差项空间分布上具有),表明在误差项空间分布上具有明显的相关关系。明显的相关关系。n正(负)的空间相关代表相邻地区的类似特征正(负)的空间相关代表相邻地区的类似特征值出现集群(或分散)趋势。值出现集群(或分散)趋势。n这时如果不考虑空间自相关问题,回归模型的这时如果不考虑空间自相关问题,回归模型的系数将是有偏的。系数将是有偏的。45454646地区XY预测 Y残差ee2A2129.592.415.81B51518.65-3.6513.32C93530.734.271

24、8.23D41715.631.371.88E82827.710.290.08F72024.69-4.6922合计61.324747地区地区残差残差e eWAWBWcWDWEWFA A2.41 2.41 0 01 11 11 10 00 0B B-3.65-3.65 1 10 01 10 00 00 0C C4.27 4.27 1 11 10 00 01 11 1D D1.37 1.37 1 10 00 00 01 10 0E E0.29 0.29 0 00 01 11 10 01 1F F-4.69-4.69 0 00 01 10 01 10 04848地区eAeeBeeCeeDeeEeeFe

25、A A5.78 5.78-8.80-8.80 10.29 10.29 3.30 3.30 0.70 0.70-11.30-11.30 B B-8.76-8.76 13.32 13.32-15.59-15.59-5.00-5.00-1.06-1.06 17.12 17.12 C C10.25 10.25-15.59-15.59 18.23 18.23 5.85 5.85 1.24 1.24-20.03-20.03 D D3.29 3.29-5.00-5.00 5.85 5.85 1.88 1.88 0.40 0.40-6.43-6.43 E E0.70 0.70-1.06-1.06 1.24 1

26、.24 0.40 0.40 0.08 0.08-1.36-1.36 F F-11.26-11.26 17.12 17.12-20.03-20.03-6.43-6.43-1.36-1.36 22.00 22.00 4949地区WAeAeWBeBeWCeCeWDeDeWEeEeWFeFeA0.00 0.00-8.80-8.80 10.29 10.29 3.30 3.30 0.00 0.00 0.00 0.00 B-8.76-8.76 0.00 0.00-15.59-15.59 0.00 0.00 0.00 0.00 0.00 0.00 C10.25 10.25-15.59-15.59 0.00 0

27、.00 0.00 0.00 1.24 1.24-20.03-20.03 D3.29 3.29 0.00 0.00 0.00 0.00 0.00 0.00 0.40 0.40 0.00 0.00 E0.00 0.00 0.00 0.00 1.24 1.24 0.40 0.40 0.00 0.00-1.36-1.36 F0.00 0.00 0.00 0.00-20.03-20.03 0.00 0.00-1.36-1.36 0.00 0.00 合计4.78 4.78-24.38-24.38-24.08-24.08 3.70 3.70 0.28 0.28-21.39-21.39 5050n其Z值为1.

28、55,不能拒绝0假设(即误差项存在空间自相关的证据不足)5151 也也可可以以采采用用Gearys C的的值值进进行行检检验验。可可以以证证明明,C总总是是取取正正值值,取取值值范范围围一一般般介介于于0-2之之间间。当当Gearys C的的值值接接近近1时时,表表示示不不存存在在空空间间自自相相关关,观观测测值值或或扰扰动动项项在在空空间间上上呈呈现现随随机机分分布布;当当Gearys C的的值值接接近近0时时,表表示示存存在在正正的的空空间间自自相相关关,相相似似的的观观测测值值或或扰扰动动项项在在空空间间上上呈呈现现集集聚聚;当当Gearys C的的值值接接近近2时时,表表示示存存在在负

29、负的的空空间间自自相相关关,相相异异的的观观测测值值或或扰扰动动项项在空间上呈现集聚。在空间上呈现集聚。Gearys C1-MoranIGearys C5252Stata算例某城市某城市49个街区:个街区:Id-地区编号;地区编号;hoval房屋价值(千万);房屋价值(千万);income-家庭收入(千家庭收入(千/户);户);crime盗窃案件(件盗窃案件(件/千户);千户);X、y街区重心的横、纵坐标。数据如下:街区重心的横、纵坐标。数据如下:idhovalincomecrimexy144.56721.23218.801758.3113.996233.24.47732.387768.444

30、13.724337.12511.33738.425868.41713.3724758.4380.1782698.1313.292580.46719.53115.725988.8314.3694876.118.32416.530536.42411.2144944.33325.87316.491897.07711.29453531.数据n打开Stata11columbusdata.dta(坐标);Stata11columbusswm.dta(是否相邻);Stata11columbusdata.dta(变量数据)(变量数据)n查看数据。54542.计算权重(spatial weight matrix

31、:spatwmat)n计算权重矩阵:常用命令:n.spatwmat using ColumbusSWM.dta,name(W)n spatwmat:空间权重命令nusing ColumbusSWM.dta:数据来源nname(W):空间权重命名为W。n spatwmat using ColumbusSWM.dta,name(WW)standardizen行标准化。5555n spatwmat,name(WWW)xcoord(x)ycoord(y)band(0 3)binaryn距离小于3为1,反之为0.n spatwmat using ColumbusSWM.dta,name(WW)stand

32、ardize eigenval(E)n计算特征根矩阵(列向量)E.n第二步:查看W:菜单模式或命令:n.matrix list 矩阵名称矩阵名称56563.度量全局空间相关统计量(Measures of global spatial autocorrelation:spatgsa)nspatgsa hoval income crime,weights(W)moran gearyn计算各变量Morans I,Gearys c及其单侧检验概率n.spatgsa hoval income crime,weights(W)moran geary twotailn计算各变量Morans I,Gearys

33、 c及其双侧检验概率57574.度量局部空间相关统计量(Measures of local spatial autocorrelation:spatlsa)n.spatlsa crime,weights(W)moran go2n各区域与其它区域的moranI和Gn.spatlsa crime,weights(WW)moran graph(moran)symbol(n)n画出图形。WW是行标准化的权重矩阵。nspatlsa crime,w(W)go2 graph(go2)map(ColumbusBoundary.dta)x(x)y(y)nG的地图。58585.根据距离计算空间自相关(Spatia

34、l correlogram:Spatcor)n.spatcorr crime,bands(0(1)5)xcoord(x)ycoord(y)n距离从0到5,每一个单位分段,分别计算MoranI。n.spatcorr crime,bands(0(1)5)xcoord(x)ycoord(y)cumulativen距离从0到5,每一个单位分段,累计计算MoranIn.spatcorr crime,bands(0(1)5)xcoord(x)ycoord(y)graphn作图。59596.回归方程存在空间自相关诊断(Diagnostic tests for spatial dependence in OLS regression:spatdiag)n先进行OLS,然后诊断。n第一步:nregress crime hoval incomen第二步:nspatdiag,weights(W)6060空间回归命令n.spatreg crime hoval income,weights(W)eigenval(E)model(lag)n.spatreg crime hoval income,weights(W)eigenval(E)model(error)

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服