1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计学,从数据到结论,第五章 总体参数的预计,预计就是根据你拥有的信息来对现实世界进行某种判断。,你能够根据一种人的衣着、言谈和举止判断其身份,你能够根据一种人的脸色,猜出其心情和身体状况,统计中的预计也不例外,它是完全根据数据做出的。,如果我们想懂得桂林人承认某饮料的比例,人们只有在桂林人中进行抽样调查以得到样本,并用样本中承认该饮料的比例来预计真实的比例。,从不同的样本得到的结论也不会完全同样。即使真实的比例在这种抽样过程中永远也不懂得;但能够懂得预计出来的比例和真实的比例大致差多少。,从数据得到有关现
2、实世界的结论的过程就叫做统计推断(statistical inference)。,上面调查例子是预计总体参数(某种意见的比例)的一种过程。,预计(estimation)和假设检查(hypothesis testing)是统计推断的两个重要内容之一。,5.1 用预计量预计总体参数,人们往往先假定某数据来自一种特定的总体族(例如正态分布族)。,而要拟定是总体族的哪个组员则需要懂得总体参数值(例如总体均值和总体方差)。,人们于是能够用对应的样本统计量(例如样本均值和样本方差)来预计对应的总体参数,5.1 用预计量预计总体参数,某些常见的涉及总体的参数涉及总体均值(m)、总体原则差(s)或方差(s2)
3、和(Bernoulli实验中)成功概率p等(总体中含有某种特性的个体之比例)。,正态分布族中的组员被(总体)均值和原则差完全拟定;,Bernoulli分布族的组员被概率(或比例)p完全决定。,因此如果能够对这些参数进行预计,总体分布也就预计出来了。,5.1 用预计量预计总体参数,预计的根据为总体抽取的样本。,样本的(不含未知总体参数的)函数称为统计量;而用于预计的统计量称为预计量(estimator)。,由于一种统计量对于不同的样本取值不同,因此,预计量也是随机变量,并有其分布。,如果样本已经得到,把数据带入之后,预计量就有了一种数值,称为该预计量的一种实现(realization)或取值,也
4、称为一种预计值(estimate)。,5.1 用预计量预计总体参数,点预计(point estimation),即用预计量的实现值来近似对应的总体参数。,区间预计(interval estimation);它是涉及预计量在内(有时是以预计量为中心)的一种区间;该区间被认为很可能包含总体参数。,点预计给出一种数字,用起来很方便;而区间预计给出一种区间,说起来留有余地;不像点预计那么绝对。,5.2 点预计,用什么样的预计量来预计参数呢?,事实上没有硬性限制。任何统计量,只要人们觉得适宜就能够当成预计量。,固然,统计学家想出了许多原则来衡量一种预计量的好坏。每个原则普通都仅反映预计量的某个方面。,这
5、样就出现了多个名录的预计量(如无偏预计量等)。,另某些预计量则是由它们的计算方式来命名的(如最大似然预计和矩预计等)。,5.2 点预计,最惯用的预计量就是我们熟悉的样本均值、样本原则差(s)和(Bernoulli实验的)成功比例(x/n);,人们用它们来分别预计总体均值(m)、总体原则差(s)和成功概率(或总体中的比例)p。,5.2 点预计,那么,什么是好预计量的原则呢?,一种统计量称为无偏预计量(unbiased estimator)。,所谓的无偏性(unbiasedness)就是:即使每个样本产生的预计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的预计量的均值会靠近真正要预计的
6、参数。,5.2 点预计,由于普通仅仅抽取一种样本,并且用该样本的这个预计量的实现来预计对应的参数,人们并不懂得这个预计值和要预计的参数差多少。,因此,无偏性仅仅是非常多次重复抽样时的一种渐近概念。,随机样本产生的样本均值、样本原则差和Bernoulli实验的成功比例分别都是对应的总体均值、总体原则差和总体比例的无偏预计。,5.2 点预计,在无偏预计量的类中,人们还但愿寻找方差最小的预计量,称为最小方差无偏预计量。,此由于方差小阐明重复抽样产生的许多预计量差别不大,因此更加精确。,评价一种统计量好坏的原则诸多;并且许多都涉及某些大样本的极限性质。我们不想在这里涉及太多此方面的细节。,5.3 区间
7、预计,当描述一种人的体重时,你普通可能不会说这个人是76.35公斤,你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范畴就是区间预计的例子。,5.3 区间预计,在抽样调查例子中也惯用点预计加区间预计的说法。,例如,为了预计某电视节目在观众中的支持率(即总体比例p),某调查成果会显示,该节目的“收视率为90%,误差是3%,置信度为95%”云云。这种说法意味着下面三点,5.3 区间预计,1.样本中的支持率为90%,即用样本比例作为对总体比例的点预计,2.预计范畴为90%3%(3%的误差),即区间(93%,87%)。,3.如用类似的方式,重复抽取大量(样本量相似的)样本时,产生的大量类
8、似区间中有些会覆盖真正的p,而有些不会;但其中大概有95%会覆盖真正的总体比例。,5.3 区间预计,这样得到的区间被称为总体比例p的置信度(confidence level)为95%的置信区间(confidence interval)。这里的置信度又称置信水平或置信系数。,显然置信度的概念又是大量重复抽样时的一种渐近概念。,5.3 区间预计,因此说“我们现在得到的区间(例如上面的90%3%)以概率0.95覆盖真正的比例p”是个错误的说法。,这里的区间(93%,87%)是固定的,而总体比例p也是固定的值。因此只有两种可能:或者该区间包含总体比例,或者不包含;,在固定数值之间没有任何概率可言。,5
9、3 区间预计,例5.1(noodle.txt)某厂家生产的挂面包装上写明“净含量450克”。在用天平称量了商场中的48包挂面之后,得到样本量为48的有关挂面重量(单位:克)的一种样本:,用计算机能够很容易地得到挂面重量的样本均值、总体均值的置信区间等等。下面是SPSS的输出:,该输出给出了许多第三章引进的描述统计量。和预计有关的是作为总体均点预计的样本均值,它等于449.01;而总体均值的95%置信区间为(447.41,450.61),5.3 区间预计,我们还能够构造两个总体的均值(或比例)之差的置信区间。,如想懂得两个地区学生成绩的差别,能够建造两个地区成绩均值之差m1-m2的置信区间。,
10、如想比较一种候选人在不同阶段支持率的差别,那就可构造比例之差p1-p2的置信区间。,5.3 区间预计,例5.2有两个地区大学生的高度数据(height2.txt),(a)我们想要分别得到这两个总体均值和原则差的点预计(即样本均值和样本原则差)和各总体均值的95%置信区间。,(b)求两个均值差m1-m2的点预计和95%置信区间。运用软件很容易得到下面成果:,5.3 区间预计,两个总体均值预计量的样本均值分别为170.56和165.60,样本原则差分别为6.97857和7.55659;还得到均值的置信区间分别是(168.5767,172.5433),(163.4524,167.7476)。,能够得
11、到两个样本均值的差(4.9600),另外还给出了两总体均值差的95%置信区间(2.073,7.847)。,5.4 有关置信区间的注意点,前面提到,不要认为由某同样本数据得到总体参数的某一种95%置信区间,就觉得该区间以0.95的概率覆盖总体参数。,置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率;,也就是说,无穷次重复抽样所得到的全部区间中有95%包含参数。,5.4 有关置信区间的注意点,但是把一种样本数据带入统计量的公式所得到的一种区间,只是这些区间中的一种。,这个非随机的区间与否包含那个非随机的总体参数,谁也不可能懂得。非随机的数目之间没有概率可言。,5.4
12、有关置信区间的注意点,置信区间的叙述是由区间和置信度两部分构成。,有些新闻媒体报道某些调查成果只给出比例和误差(即置信区间),并不阐明置信度,也不给出被调查的人数,这是不负责的体现。,由于减少置信度能够使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查成果时给出被调查人数是负责任的体现。这样则能够由此推算出置信度(由背面给出的公式),反之亦然。,5.4 有关置信区间的注意点,一种描述性例子:有10000个人回答的调查显示,同意某观点人的比例为70%(有7000人同意),可算出总体中同意该观点的比例的95%置信区间为(0.691,0.709);,另一种调查声称有70%的比例反对该种观点,还说总体中反对该观点的置信区间也是(0.691,0.709)。,终究相信谁呢?事实上,第二个调查隐瞒了置信度。如果第二个调查仅仅调查了50个人,有35个人反对该观点。则其置信区间的置信度仅有11%。,






