第5章-区间估计及假设检验讲课讲稿.ppt

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第5章-区间估计及假设检验,这样的区间称为置信区间,（confidence interval）,；称为置信系数,（confidence coefficient）,；而称为显著性水平,（level of significance）,。,置信区间的端点称置信限（confidence limits）也称临界值（critical values）。,为置信下限（lower confidence limit）,为置信上限（upper confidence limit）,（5.2.1）式表示的是：随机区间包含真实,的概率为。区间估计量给出了一个真实会落入其中的数值范围。,点估计与区间估计：,单一的点估计量可能不同于总体真值，即存在估计误差。点估计既不能给出误差范围的大小，也没有给出估计的可靠程度。区间估计则可以显示和是怎样的接近总体真值和，以及这种接近的可靠性。,5.3 回归系数和的置信区间,一、的置信区间,OLS估计量和服从正态分布，因此，若令,（5.3.1）,则，Z为一个标准化正态变量，。,如果总体方差已知，就可以用正态分布对作出概率上的表述。在正态曲线下，,之间的面积为68.26%,之间的面积为95%,之间的面积为95.45%,之间的面积为99.73%,从而的区间估计就容易了。选定为95%，则,但是，在许多实际问题中，总体方差都是未知的，只能用其无偏估计量来替代。（5.3.1）式便为：,（5.3.2）,为估计量的标准误的估计值（,estimated standard error,）。,这里定义的,t,变量服从自由度为,n,-2的,t,分布,证明：令,（1）,（2）,如果已知，（1）式就是对进行标准化，所以,Z,1,服从标准正态分布，。,Z,2,服从（,n,-2）个自由度的分布（证明参见有关的数理统计教程），而且，可以证明,Z,2,的分布独立于,Z,1,。运用P,160,定理5.5(附录)，,变量服从自由度为,n,-2的,t,分布。,把（1）式和（2）式代入上式，即可得到（5.3.2）式。,用,t,分布构造的的置信区间为：,（5.3.3）,上式中,t,值由（5.3.2）式给出。为显著水平上的临界值，查表；显著水平，自由度,n,-2可得的值。,于是有：,（5.3.4）,整理得：,（5.3.5）,即的水平的置信区间为：,例子：P,123,两个游戏:,掷硬币,套圈,请问:区间估计更象哪一个?,置信区间的两个特点:,位置的随机性,长度的随机性,二、的置信区间：,利用和进行类似的推导，可得：,（5.3.7）,也就是说，的水平的置信区间为：,（5.3.8）,在区间估计中，置信区间的宽度与估计量的标准误或,成正比例。这说明，标准误越大，置信区间越宽，对总体真值进行估计的接近程度越差。因此，估计量的标准误被看作是估计量的精度（precision），它反映了估计量的精确程度。,5.4 的置信区间,在正态性假定下，变量：,（5.4.1）,服从自由度为,n,-2的分布。因此，可以用分布构造,的置信区间：,（5.4.2）,其中的值由（5.4.1）式给出，和可以查表得,到，自由度为,n,-2，见P,125,Figure,5.1。,把（5.4.1）式中的代入（5.4.2）式,整理得：,（5.4.3）,该式给出了的置信系数为的置信区间。,5.5 假设检验（Hypothesis Testing）：概述,参数估计与假设检验都是在样本分布基础上作出概率性判断，两者既有联系又有区别，但其基本原理则是一致的。,参数的区间估计主要解答某一总体参数真值落在什么区间内的问题；,而假设检验就是要对一个已知估计值或已得出的数据进行检验，判断它是否与某一个指定的假设（stated hypothesis）相容或一致（compatible）。所谓相容或一致，是指某一已知估计值充分地接近其假设的数值，从而导致接受新指定的假设。,用统计上的话说，这个指定的（声称的）假设叫做虚拟假设（null hypothesis），或维持假设（maintained hypothesis），用H,0,来表示。通俗地说，是一个,靶子,。,另外，还需要一个备择假设（对立假设）（alternative hypothesis），用,H,1,表示。,H,0,和H,1,构成一个完备事件。,备择假设可以是简单的（simple）或复合的（composite）。例如，是一个简单假设，而则是一个复合假设。,进行统计假设检验，就是要制定一套步骤和规则，以使决定接受或拒绝一个虚拟假设（原假设）。一般来说，有两种相互联系、相互补充的方式：置信区间（confidence interval）和显著性检验（test of significance）。,5.6假设检验：置信区间的方法,双侧或双尾检验,（Two-sided or Two-Tail Test）,利用P,88,页Table 3.2的数据，估计出MPC（边际消费倾向）是0.5091。可以造构如下的检验假设：,在虚拟假设下，MPC是0.3，在对立假设下MPC大于或小于0.3。虚拟假设是一个简单假设，而对立假设则是一个复合假设；实际上就是我们所说的双侧假设（two-sided hypothesis）。,那么，我们估计的是否与上述相容？,可以用置信区间来加以判断。,P,123,页的（5.3.9）式给出的置信区间：(0.4268，0.5914）。也就是说，从长远来看，像（0.4268，0.5914）这样的很多个区间将会有95%的概率包含真实的。因而，置信区间给出了可信的（plausible）虚拟假设的一个集合。如果虚拟假设的,落入这个置信区间，我们就不拒绝虚拟假设；如果它落在区间之外，我们就可以拒绝虚拟假设。,图5.2 的一个置信区间,在假设下，落入此区间的值有的可信性。因此，若果真落入此区域，就不拒绝,决策规则：构造一个的置信区间。如果在假设,H,0,下落入此区间，就不要拒绝,H,0,。但如果它落在此区间之外，就要拒绝,H,0,。,在上例中，很明显地落在（0.4268，0.5914）这个置信区间之外，因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。,在统计上，当虚拟假设被我们拒绝时，就称我们的发现是统计上显著的（statistically significant）。反之，当我们不拒绝虚拟假设时，我们说，我们的发现不是统计上显著的。,当选择的显著性水平又比较低，比如，从而置信系数,比较高，如99%时，仍然达到了统计上是显著的，我们就称它是统计上高度显著（highly statistically significant）。,单侧或单尾检验,One-Sided or One-Tail Test,当我们有着很强的理论支撑或者先验性预期时，可以把备择假设,H,1,取为单侧的或单向的。如：和,对于这种单尾检验，最好的方法是显著性检验方法。,5.7 假设检验：显著性检验法,检验回归系数的显著性：,t,检验,显著性检验法（test-of-significance approach）是由R.A.Fisher（费希尔），Negman（尼曼）和Pearson（皮尔逊）合作发明的，它是利用样本结果，来证实一个虚拟假设的真伪的一种检验程序。,t分布的来历:student,显著性检验的关键在于构造出一个检验统计量（test statistic）（作为估计量），在虚拟假设下这个统计量会服从一定的抽样分布（如t分布，F分布，正态分布，分布等）。构造出统计量以后，就可以利用样本数据计算出这个统计量的样本值，再把这个样本值与给定某一显著水平的临界值进行比较，看它与临界值是否有显著差别，从而作出判断，决定拒绝还是接受所作的假设。,在正态性假设下的变量：,（5.3.2）,服从自由度为,n,-2的,t,分布。,在虚拟假设下的真值被设定，就可以利用样本数据算出（5.3.2）式，即这个,t,统计量是可以算出来的，从而可以作出如下的置信区间：,（5.7.1）,其中，是在,H,0,下的值。和是从,t,分布表中查得的数据，为显著水平，,n,-2为自由度，这些值就是所谓的临界值。,将（5.7.1）式整理得：,（5.7.2）,上式中建立的置信区间叫做虚拟假设的接受域（region of acceptance），而置信区间以外的区域叫做,H,0,的拒绝域（region(s)of rejection）或临界域（critical region(s)）。置信限，即置信区间的端点，又叫做临界值（critical values）。,在实践中，并不需要估计（5.7.2）式，而可利用（5.7.1）式计算,t,值，看它是落在两个,t,临界值之间还是落在它们之外。在上例中，有:,（5.7.4）,这个,t,值显然落在P,131,图5.4中的临界域内。结论和前面的一样：拒绝H。,越大，它越是可能落在临界域内，因而，它越是与虚拟假设相左。,这种利用,t,分布进行的检验叫,t,检验（t test）,。一个统计量是,统计上显著的,，如果这个统计量的值落在临界域上。这时我们将拒绝虚拟假设。同样地，一个检验是,统计上不显著的,，如果这个统计量的值落在接受域中。这时我们不拒绝虚拟假设。,如果把两个尾端当作拒绝域，则虚拟假设值落入任一尾端，就拒绝该假设，这种检验程序是双侧或双尾显著性检验。这样做的虚拟假设 H,0,必须是一个双侧的复合假设。,如果先前的经验或理论告诉我们，MPC预期要比0.3大，我们就可以这样设定：和。,这里,H,1,虽然是一个复合假设，但它却是单侧的。这样的检验就是单尾检验（右尾部检验）。,二、检验的显著性：检验,考虑下面的变量：,（5.4.1）,遵循自由度为,n,-2的分布。在P,88,页的例子中，,。如果假设：,对。把数据代入（5.4.1）得：,取的的两个临界值为2.1797和17.5346。,落在两个临界值的中间，我们不拒绝,H,0,。这个检验叫做显著性检验。,见P,121,，Table 5.2。,5.9 回归分析与方差分析,已经推导出下面的恒等式：,（3.5.2）,这就是：TSSESSRSS，总平方和TSS可以分解为两部分：解释平方和ESS和残差平方和RSS。对TSS的这些构成部分进行研究就叫做从回归的观点做方差分析（analysis of variance，简记ANOVA）。,方差分析的主要功能在于，分析和检验某种或多种因素（或自变量）的变化对试验结果（或因变量）的观测数据是否有显著的影响。,每一个平方和都是和它的自由度数相联系的，亦即与它所依据的独立观测值的变量数目有关。就一元回归而言：（1）TSS的自由度数为,n,-1，因为在计算的离差和时，失去了一个自由度；,（2）ESS的自由度为1，因为对1个自变量回归来说，回归平方和具有1个自由度数；（3）RSS的自由度数为,n,-2，因为计算参数,和而失去两个自由度。,在数理统计中，可以证明TSS，ESS和RSS分别服从自由度为,n,-1，1和,n,-2的分布。,把各项平方和及其相应的,df,引入表5.3，成为AOV表的标准型式，有时又称ANOVA表。,看P,127,Table 5.3,MSS均方和 SS平方和,现在考虑以下变量：,（5.9.1）,如果假定干扰,u,i,是正态分布的，且，就可以证明（5.9.1）的,F,满足定理4.6的条件，从而它服从自由度为1和,n,-2的,F,分布。,证明：令，则。,由定理4.3，分布。,再令，则。,同时，,Z,1,的分布独立于,Z,2,的分布。,由定理4.6得：,服从自由度分别为1和的F分布。在：下，上述F比率简化为方程（5.9.1）式，#。）,为了直观地说明方差比F的用途，列举两个有关的方程式如下：,（5.9.2）,(5.9.3),求证：（5.9.2）,左边,代入上式,左边,右边#,容易看出，如果，则（5.9.2）式和（5.9.3）式对真实方差提供等同的估计量。在这种情况下，解释变量X对被解释变量Y毫无线性影响，Y的总变异就由随机扰动项作出解释。,反之，如果，则上述两个方程将得出不同的结果，从而Y的变异中有一部分将归因于解释变量X。,因此，方差比F是适宜作为检验原假设（虚拟假设）,的统计量。,判断虚拟假设是否可信，需要有一个判断标准，这个标准就是与选定的显著水平和自由度，相对应的临界值,如果由样本数据计算的，则拒绝，表示在显著性水平之下，该一元回归模型是统计上显著的；,反之，如果，就接受，认为该模型并无显著意义。,F检验与t检验：,在原假设下，二者是密切联系的。在相同的显著性水平下，统计量F与t之间具有以下关系：,t检验和F检验是检验的两个互为补充的备选方法。其实，在双变量模型中，F检验是多余的，二者的结论总是一致的。,但是,在多元回归分析中，F检验与t检验各有不同的功用。,F检验：模型的显著性；t检验：系数的显著性。,实质：X的贡献是否显著地大于U的贡献,5.10 回归分析的应用：预测问题,有两种预测：,一、均值预测,：对应于给定的X，比如，预测Y的条件均值，或者说是预测总体归线本身上的点。,比如时，,给出了这一均值预测的点估计为：,谁能预测未来,谁就能发财致富。,中国的投资者和富人们十分关心的问题是：,中国长期增长的拐点在哪里？-讨论,一般地，如果总体回归模型为,根据样本数据可以求得样本回归模型为,从而求出样本回归直线为,经过 t 检验，如果是可以接受的，就可以运用上述样本回归直线估计式进行预测。,给定，真实的均值的预测由下式给出：,（1）,我们用（2）,来估计（1）式。,给定，对（2）式取数学期望得，,因此，,这说明，是的一个无偏误的预测元（unbiased predictor）。,由于是一个估计式，它是由样本资料计算而得出的，所得出的预测估计值可能不同于真值。这就涉及到预测的精确度问题。,就是说，由于抽样波动，预测估计值与真值之间存在差异，预测具有误差。为了评定这种误差，需要查明的抽样分布。，也是服从正态分布的，其均值为,，方差为：,把（3.3.1）式,（3.3.3）式,和（3.3.9）式代入上式，整理得：,由于是不可知的，可以用无偏估计式代替，则,为了得出的置信区间，对构造其,t,统计量,（5.10.3）,例子：P,143,如果对表3.3中的每一个X值，求类似于P,143,（5.10.5）的95%置信区间，把这些区间的端点连结起来，我们就得到P,144,图5.6所展示的一个关于总体回归函数的置信带（域）（confidence band）。,二、个值预测,如果我们的兴趣在于预测对应于给定,X,值（比如说,X,0,）的单个Y值（,Y,0,），也就是要得到：,（5）,我们把,Y,0,预测为：,（6）,预测误差是：,（7）,因此，对（7）式两边平方再求期望，得：,直观地看,个值预测和均值预测,哪个方差大?,遵循自由度为n-2的t分布。,个值的置信区间为：,例：P,131,比较（5.10.7）和（5.10.5）可见，的置信区间要比的均值的置信区间要宽。,P,130,Figure 5.6中置信带（confidence bands）有一个重要特征：当时，带的宽度最小。为什么？这可以从方差公式中看出。这说明，当远离时，人们利用回归线进行“外推”来预测或时，必须保持高度警觉。,5.11 报告回归结果,见P,131,（5.11.1）,一个忠告:不要把Eviews等软件计算结果直接复制到作业或论文中。,5.12 正态性检验,Story:Bera&Beda,:,signature,第五章结束，谢谢！,此课件下载可自行编辑修改，仅供参考！感谢您的支持，我们努力做得更好！谢谢,

展开阅读全文