资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第5章-区间估计及假设检验,这样的区间称为置信区间,(confidence interval),;称为置信系数,(confidence coefficient),;而 称为显著性水平,(level of significance),。,置信区间的端点称置信限(confidence limits)也称临界值(critical values)。,为置信下限(lower confidence limit),为置信上限(upper confidence limit),(5.2.1)式表示的是:随机区间包含真实,的概率为 。区间估计量给出了一个真实 会落入其中的数值范围。,点估计与区间估计:,单一的点估计量可能不同于总体真值,即存在估计误差。点估计既不能给出误差范围的大小,也没有给出估计的可靠程度。区间估计则可以显示 和 是怎样的接近总体真值 和 ,以及这种接近的可靠性。,5.3 回归系数 和 的置信区间,一、的置信区间,OLS估计量 和 服从正态分布,因此,若令,(5.3.1),则,Z为一个标准化正态变量,。,如果总体方差 已知,就可以用正态分布对 作出概率上的表述。在正态曲线下,,之间的面积为68.26%,之间的面积为95%,之间的面积为95.45%,之间的面积为99.73%,从而 的区间估计就容易了。选定 为95%,则,但是,在许多实际问题中,总体方差 都是未知的,只能用其无偏估计量 来替代。(5.3.1)式便为:,(5.3.2),为估计量 的标准误的估计值(,estimated standard error,)。,这里定义的,t,变量服从自由度为,n,-2的,t,分布,证明:令,(1),(2),如果 已知,(1)式就是对 进行标准化,所以,Z,1,服从标准正态分布,。,Z,2,服从(,n,-2)个自由度的 分布(证明参见有关的数理统计教程),而且,可以证明,Z,2,的分布独立于,Z,1,。运用P,160,定理5.5(附录),,变量 服从自由度为,n,-2的,t,分布。,把(1)式和(2)式代入上式,即可得到(5.3.2)式。,用,t,分布构造的 的置信区间为:,(5.3.3),上式中,t,值由(5.3.2)式给出。为 显著水平上的临界值,查表;显著水平 ,自由度,n,-2可得 的值。,于是有:,(5.3.4),整理得:,(5.3.5),即 的 水平的置信区间为:,例子:P,123,两个游戏:,掷硬币,套圈,请问:区间估计更象哪一个?,置信区间的两个特点:,位置的随机性,长度的随机性,二、的置信区间:,利用 和 进行类似的推导,可得:,(5.3.7),也就是说,的 水平的置信区间为:,(5.3.8),在区间估计中,置信区间的宽度与估计量的标准误 或,成正比例。这说明,标准误越大,置信区间越宽,对总体真值进行估计的接近程度越差。因此,估计量的标准误被看作是估计量的精度(precision),它反映了估计量的精确程度。,5.4 的置信区间,在正态性假定下,变量:,(5.4.1),服从自由度为,n,-2的 分布。因此,可以用 分布构造,的置信区间:,(5.4.2),其中的 值由(5.4.1)式给出,和 可以查表得,到,自由度为,n,-2,见P,125,Figure,5.1。,把(5.4.1)式中的 代入(5.4.2)式,整理得:,(5.4.3),该式给出了 的置信系数为 的置信区间。,5.5 假设检验(Hypothesis Testing):概述,参数估计与假设检验都是在样本分布基础上作出概率性判断,两者既有联系又有区别,但其基本原理则是一致的。,参数的区间估计主要解答某一总体参数真值落在什么区间内的问题;,而假设检验就是要对一个已知估计值或已得出的数据进行检验,判断它是否与某一个指定的假设(stated hypothesis)相容或一致(compatible)。所谓相容或一致,是指某一已知估计值充分地接近其假设的数值,从而导致接受新指定的假设。,用统计上的话说,这个指定的(声称的)假设叫做虚拟假设(null hypothesis),或维持假设(maintained hypothesis),用H,0,来表示。通俗地说,是一个,靶子,。,另外,还需要一个备择假设(对立假设)(alternative hypothesis),用,H,1,表示。,H,0,和H,1,构成一个完备事件。,备择假设可以是简单的(simple)或复合的(composite)。例如,是一个简单假设,而 则是一个复合假设。,进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设(原假设)。一般来说,有两种相互联系、相互补充的方式:置信区间(confidence interval)和显著性检验(test of significance)。,5.6假设检验:置信区间的方法,双侧或双尾检验,(Two-sided or Two-Tail Test),利用P,88,页Table 3.2的数据,估计出MPC(边际消费倾向 )是0.5091。可以造构如下的检验假设:,在虚拟假设下,MPC是0.3,在对立假设下MPC大于或小于0.3。虚拟假设是一个简单假设,而对立假设则是一个复合假设;实际上就是我们所说的双侧假设(two-sided hypothesis)。,那么,我们估计的 是否与上述 相容?,可以用置信区间来加以判断。,P,123,页的(5.3.9)式给出的置信区间:(0.4268,0.5914)。也就是说,从长远来看,像(0.4268,0.5914)这样的很多个区间将会有95%的概率包含真实的 。因而,置信区间给出了可信的(plausible)虚拟假设的一个集合。如果虚拟假设的,落入这个 置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可以拒绝虚拟假设。,图5.2 的一个 置信区间,在假设 下,落入此区间的 值有 的可信性。因此,若 果真落入此区域,就不拒绝,决策规则:构造一个 的 置信区间。如果 在假设,H,0,下落入此区间,就不要拒绝,H,0,。但如果它落在此区间之外,就要拒绝,H,0,。,在上例中,很明显地落在(0.4268,0.5914)这个置信区间之外,因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。,在统计上,当虚拟假设被我们拒绝时,就称我们的发现是统计上显著的(statistically significant)。反之,当我们不拒绝虚拟假设时,我们说,我们的发现不是统计上显著的。,当选择的显著性水平又比较低,比如 ,从而置信系数,比较高,如99%时,仍然达到了统计上是显著的,我们就称它是统计上高度显著(highly statistically significant)。,单侧或单尾检验,One-Sided or One-Tail Test,当我们有着很强的理论支撑或者先验性预期时,可以把备择假设,H,1,取为单侧的或单向的。如:和,对于这种单尾检验,最好的方法是显著性检验方法。,5.7 假设检验:显著性检验法,检验回归系数的显著性:,t,检验,显著性检验法(test-of-significance approach)是由R.A.Fisher(费希尔),Negman(尼曼)和Pearson(皮尔逊)合作发明的,它是利用样本结果,来证实一个虚拟假设的真伪的一种检验程序。,t分布的来历:student,显著性检验的关键在于构造出一个检验统计量(test statistic)(作为估计量),在虚拟假设下这个统计量会服从一定的抽样分布(如t分布,F分布,正态分布,分布等)。构造出统计量以后,就可以利用样本数据计算出这个统计量的样本值,再把这个样本值与给定某一显著水平的临界值进行比较,看它与临界值是否有显著差别,从而作出判断,决定拒绝还是接受所作的假设。,在正态性假设下的变量:,(5.3.2),服从自由度为,n,-2的,t,分布。,在虚拟假设下 的真值被设定,就可以利用样本数据算出(5.3.2)式,即这个,t,统计量是可以算出来的,从而可以作出如下的置信区间:,(5.7.1),其中,是在,H,0,下的 值。和 是从,t,分布表中查得的数据,为显著水平,,n,-2为自由度,这些值就是所谓的临界值。,将(5.7.1)式整理得:,(5.7.2),上式中建立的 置信区间叫做虚拟假设的接受域(region of acceptance),而置信区间以外的区域叫做,H,0,的拒绝域(region(s)of rejection)或临界域(critical region(s))。置信限,即置信区间的端点,又叫做临界值(critical values)。,在实践中,并不需要估计(5.7.2)式,而可利用(5.7.1)式计算,t,值,看它是落在两个,t,临界值之间还是落在它们之外。在上例中,有:,(5.7.4),这个,t,值显然落在P,131,图5.4中的临界域内。结论和前面的一样:拒绝H。,越大,它越是可能落在临界域内,因而,它越是与虚拟假设相左。,这种利用,t,分布进行的检验叫,t,检验(t test),。一个统计量是,统计上显著的,,如果这个统计量的值落在临界域上。这时我们将拒绝虚拟假设。同样地,一个检验是,统计上不显著的,,如果这个统计量的值落在接受域中。这时我们不拒绝虚拟假设。,如果把两个尾端当作拒绝域,则虚拟假设值落入任一尾端,就拒绝该假设,这种检验程序是双侧或双尾显著性检验。这样做的虚拟假设 H,0,必须是一个双侧的复合假设。,如果先前的经验或理论告诉我们,MPC预期要比0.3大,我们就可以这样设定:和 。,这里,H,1,虽然是一个复合假设,但它却是单侧的。这样的检验就是单尾检验(右尾部检验)。,二、检验 的显著性:检验,考虑下面的变量:,(5.4.1),遵循自由度为,n,-2的 分布。在P,88,页的例子中,,。如果假设:,对 。把数据代入(5.4.1)得:,取 的 的两个临界值为2.1797和17.5346。,落在两个临界值的中间,我们不拒绝,H,0,。这个检验叫做 显著性检验。,见P,121,,Table 5.2。,5.9 回归分析与方差分析,已经推导出下面的恒等式:,(3.5.2),这就是:TSSESSRSS,总平方和TSS可以分解为两部分:解释平方和ESS和残差平方和RSS。对TSS的这些构成部分进行研究就叫做从回归的观点做方差分析(analysis of variance,简记ANOVA)。,方差分析的主要功能在于,分析和检验某种或多种因素(或自变量)的变化对试验结果(或因变量)的观测数据是否有显著的影响。,每一个平方和都是和它的自由度数相联系的,亦即与它所依据的独立观测值的变量数目有关。就一元回归而言:(1)TSS的自由度数为,n,-1,因为在计算 的离差和 时,失去了一个自由度;,(2)ESS的自由度为1,因为对1个自变量回归来说,回归平方和具有1个自由度数;(3)RSS的自由度数为,n,-2,因为计算参数,和 而失去两个自由度。,在数理统计中,可以证明TSS,ESS和RSS分别服从自由度为,n,-1,1和,n,-2的 分布。,把各项平方和及其相应的,df,引入表5.3,成为AOV表的标准型式,有时又称ANOVA表。,看P,127,Table 5.3,MSS均方和 SS平方和,现在考虑以下变量:,(5.9.1),如果假定干扰,u,i,是正态分布的,且 ,就可以证明(5.9.1)的,F,满足定理4.6的条件,从而它服从自由度为1和,n,-2的,F,分布。,证明:令 ,则 。,由定理4.3,分布。,再令 ,则 。,同时,,Z,1,的分布独立于,Z,2,的分布。,由定理4.6得:,服从自由度分别为1和 的F分布。在 :下,上述F比率简化为方程(5.9.1)式,#。),为了直观地说明方差比F的用途,列举两个有关的方程式如下:,(5.9.2),(5.9.3),求证:(5.9.2),左边,代入上式,左边,右边#,容易看出,如果 ,则(5.9.2)式和(5.9.3)式对真实方差 提供等同的估计量。在这种情况下,解释变量X对被解释变量Y毫无线性影响,Y的总变异就由随机扰动项 作出解释。,反之,如果 ,则上述两个方程将得出不同的结果,从而Y的变异中有一部分将归因于解释变量X。,因此,方差比F是适宜作为检验原假设(虚拟假设),的统计量。,判断虚拟假设 是否可信,需要有一个判断标准,这个标准就是与选定的显著水平 和自由度 ,相对应的临界值,如果由样本数据计算的 ,则拒绝 ,表示在显著性水平之下,该一元回归模型是统计上显著的;,反之,如果 ,就接受 ,认为该模型并无显著意义。,F检验与t检验:,在原假设 下,二者是密切联系的。在相同的显著性水平下,统计量F与t之间具有以下关系:,t检验和F检验是检验 的两个互为补充的备选方法。其实,在双变量模型中,F检验是多余的,二者的结论总是一致的。,但是,在多元回归分析中,F检验与t检验各有不同的功用。,F检验:模型的显著性;t检验:系数的显著性。,实质:X的贡献是否显著地大于U的贡献,5.10 回归分析的应用:预测问题,有两种预测:,一、均值预测,:对应于给定的X,比如 ,预测Y的条件均值,或者说是预测总体归线本身上的点。,比如 时,,给出了这一均值预测的点估计为:,谁能预测未来,谁就能发财致富。,中国的投资者和富人们十分关心的问题是:,中国长期增长的拐点在哪里?-讨论,一般地,如果总体回归模型为,根据样本数据可以求得样本回归模型为,从而求出样本回归直线为,经过 t 检验,如果 是可以接受的,就可以运用上述样本回归直线估计式进行预测。,给定 ,真实的均值的预测 由下式给出:,(1),我们用 (2),来估计(1)式。,给定 ,对(2)式取数学期望得,,因此,,这说明,是 的一个无偏误的预测元(unbiased predictor)。,由于 是一个估计式,它是由样本资料计算而得出的,所得出的预测估计值可能不同于真值 。这就涉及到预测的精确度问题。,就是说,由于抽样波动,预测估计值与真值之间存在差异,预测具有误差。为了评定这种误差,需要查明 的抽样分布。,也是服从正态分布的,其均值为,,方差为:,把 (3.3.1)式,(3.3.3)式,和 (3.3.9)式代入上式,整理得:,由于 是不可知的,可以用无偏估计式 代替 ,则,为了得出 的置信区间,对 构造其,t,统计量,(5.10.3),例子:P,143,如果对表3.3中的每一个X值,求类似于P,143,(5.10.5)的95%置信区间,把这些区间的端点连结起来,我们就得到P,144,图5.6所展示的一个关于总体回归函数的置信带(域)(confidence band)。,二、个值预测,如果我们的兴趣在于预测对应于给定,X,值(比如说,X,0,)的单个Y值(,Y,0,),也就是要得到:,(5),我们把,Y,0,预测为:,(6),预测误差 是:,(7),因此,对(7)式两边平方再求期望,得:,直观地看,个值预测和均值预测,哪个方差大?,遵循自由度为n-2的t分布。,个值 的置信区间为:,例:P,131,比较(5.10.7)和(5.10.5)可见,的置信区间要比 的均值的置信区间要宽。,P,130,Figure 5.6中置信带(confidence bands)有一个重要特征:当 时,带的宽度最小。为什么?这可以从方差公式中看出。这说明,当 远离 时,人们利用回归线进行“外推”来预测 或 时,必须保持高度警觉。,5.11 报告回归结果,见P,131,(5.11.1),一个忠告:不要把Eviews等软件计算结果直接复制到作业或论文中。,5.12 正态性检验,Story:Bera&Beda,:,signature,第五章结束,谢谢!,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,
展开阅读全文