1、第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1 1页页第六章 参数预计 6.1 点预计几个方法6.2 点预计评价标准6.3 最小方差无偏预计6.4 贝叶斯预计6.5 区间预计 1/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2 2页页普通惯用 表示参数,参数 全部可能取值组成集合称为参数空间,惯用表示。参数预计问题就是依据样本对上述各种未知参数作出预计。参数预计形式有两种:点预计与区间预计。2/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2
2、024第第3 3页页设 x1,x2,xn 是来自总体 X 一个样本,我们用一个统计量 取值作为 预计值,称为 点预计(量),简称预计。在这里怎样结构统计量 并没有明确要求,只要它满足一定合理性即可。这就包括到两个问题:其一 是怎样给出预计,即预计方法问题;其二 是怎样对不一样预计进行评价,即估 计好坏判断标准。3/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4 4页页6.1 点预计几个方法 6.1.1 替换原理和矩法预计 一、矩法预计 替换原理是指用样本矩及其函数去替换对应总体矩及其函数,譬如:o用样本均值预计总体均值E(X),即 ;o
3、用样本方差预计总体方差Var(X),即o用样本 p 分位数预计总体 p 分位数,o用样本中位数预计总体中位数。4/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5 5页页例6.1.1 对某型号20辆汽车统计其每加仑汽油行驶里程(km),观察数据以下:29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9 经计算有 由此给出总体均值、方差和中位数预计分别为:28.695,0.9185 和 28.6。
4、矩法预计实质是用经验分布函数去替换总体分布,其理论基础是格里纹科定理。5/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6 6页页二、概率函数二、概率函数P P(x x,)已知时未知参数矩法预计已知时未知参数矩法预计 设总体含有已知概率函数 P(x,1,k),x1,x2,xn 是样本,假定总体k阶原点矩k存在,若 1,k 能够表示成 1,k 函数 j=j(1,k),则可给出诸 j 矩法预计为 其中6/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7 7页页例6.1.2 设总体服从指数
5、分布,因为EX=1/,即=1/EX,故 矩法预计为 另外,因为Var(X)=1/2,其反函数为 所以,从替换原理来看,矩法预计也可取为 s 为样本标准差。这说明矩预计可能是不唯一,这是矩法预计一个缺点,此时通常应该尽可能采取低阶矩给出未知参数预计。7/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8 8页页例6.1.3 x1,x2,xn是来自(a,b)上均匀分布U(a,b)样本,a与b均是未知参数,这里k=2,因为 不难推出 由此即可得到a,b矩预计:8/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411
6、/8/2024第第9 9页页6.1.2 极(最)大似然预计 定义6.1.1 设总体概率函数为P(x;),是参数 可能取值参数空间,x1,x2,xn 是样本,将样本联合概率函数看成 函数,用L(;x1,x2,xn)表示,简记为L(),称为样本似然函数。9/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1010页页 假如某统计量 满足 则称 是 极(最)大似然预计,简记为MLE(Maximum Likelihood Estimate)。人们通常更习惯于由对数似然函数lnL()出发寻找 极大似然预计。当L()是可微函数时,求导是求极大似然预计最
7、惯用方法,对lnL()求导愈加简单些。10/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1111页页例6.1.6 设一个试验有三种可能结果,其发生概率分别为 现做了n次试验,观察到三种结果发生次数分别为 n1,n2 ,n3(n1+n2+n3=n),则似然函数为 其对数似然函数为11/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1212页页将之关于 求导,并令其为0得到似然方程解之,得因为所以 是极大值点。12/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8
8、/202411/8/2024第第1313页页例6.1.7 对正态总体N(,2),=(,2)是二维参数,设有样本 x1,x2,xn,则似然函数及其对数分别为 13/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1414页页 将 lnL(,2)分别关于两个分量求偏导并令其为0,即得到似然方程组 (6.1.9)(6.1.10)14/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1515页页 解此方程组,由(6.1.9)可得 极大似然预计为 将之代入(6.1.10),得出 2极大似然预计 利
9、用二阶导函数矩阵非正定性能够说明上述预计使得似然函数取极大值。15/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1616页页 即使求导函数是求极大似然预计最惯用方法,但并不是在全部场所求导都是有效。例6.1.8 设 x1,x2,xn 是来自均匀总体 U(0,)样本,试求 极大似然预计。16/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1717页页 解 似然函数 要使L()到达最大,首先一点是示性函数取值应该为1,其次是1/n尽可能大。因为1/n是 单调减函数,所以 取值应尽可能小
10、,但示性函数为1决定了 不能小于x(n),由此给出 极大似然预计:。17/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1818页页 极大似然预计有一个简单而有用性质:假如 是 极大似然预计,则对任一函数 g(),其极大似然预计为 。该性质称为极大似然预计不变性,从而使一些复杂结构参数极大似然预计取得变得轻易了。18/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第1919页页 例6.1.9 设 x1,x2 ,xn是来自正态总体N(,2)样本,则和 2极大似然预计为 ,于是由不变性可得
11、以下参数极大似然预计,它们是:标准差 MLE是 ;19/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2020页页概率 MLE是 ;o总体0.90分位数 x0.90=+u0.90 MLE是 ,其中u0.90为标准正态分布0.90分位数。20/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2121页页6.2 点预计评价标准 6.2.1 相合性 我们知道,点预计是一个统计量,所以它是一个随机变量,在样本量一定条件下,我们不可能要求它完全等同于参数真实取值。但假如我们有足够观察值,依据格里
12、纹科定理,伴随样本量不停增大,经验分布函数迫近真实分布函数,所以完全能够要求预计量伴随样本量不停增大而迫近参数真值,这就是相合性,严格定义以下。21/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2222页页定义6.2.1 设 为未知参数,是 一个预计量,n 是样本容量,若对任何一个0,有 (6.2.1)则称 为 参数相合预计。22/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2323页页 相合性被认为是对预计一个最基本要求,假如一个预计量,在样本量不停增大时,它都不能把被估参数预
13、计到任意指定精度,那么这个预计是很值得怀疑。通常,不满足相合性要求预计普通不予考虑。证实预计相合性普通可应用大数定律或直接由定义来证.23/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2424页页 若把依赖于样本量n预计量 看作一个随机变量序列,相合性就是 依概率收敛于,所以证实预计相合性可应用依概率收敛性质及各种大数定律。24/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2525页页在判断预计相合性时下述两个定理是很有用。定理6.2.1 设 是 一个预计量,若 则 是 相合预计
14、,定理6.2.2 若 分别是 1,k 相合估 计,=g(1,k)是 1,k 连续函数,则 是 相合预计。25/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第2626页页例6.2.2 设 x1,x2,xn 是来自均匀总体U(0,)样本,证实 极大似然预计是相合预计。证实:在例6.1.7中我们已经给出 极大似然预计是 x(n)。由次序统计量分布,我们知道 x(n)分布密度函数为 p(y)=nyn-1/n,y 1,比 有效。这表明用全部数据平均预计总体均值要比只使用部分数据更有效。32/105第六章第六章 参数估计参数估计 华东师范大学华东师范
15、大学11/8/202411/8/2024第第3333页页例6.2.7 均匀总体U(0,)中 极大似然预计是x(n),因为 ,所以x(n)不是 无偏预计,而是 渐近无偏预计。经过修偏后能够得到 一个无偏预计:。且 另首先,由矩法我们能够得到 另一个无偏预计 ,且 由此,当n1时,比 有效。33/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3434页页6.2.4 均方误差 无偏预计不一定比有偏预计更优。评价一个点预计好坏普通能够用:点预计值 与参数真值 距离平方期望,这就是下式给出均方误差 均方误差是评价点预计最普通标准。我们希望预计均方误
16、差越小越好。34/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3535页页 注意到 ,所以(1)若 是 无偏预计,则 ,这说明用方差考查无偏预计有效性是合理。(2)当 不是 无偏预计时,就要看其均方 误差 。下面例子说明:在均方误差含义下有些有偏 预计优于无偏预计。35/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3636页页例6.2.8 对均匀总体U(0,),由 极大似然预计得到无偏预计是 ,它均方误差 现我们考虑形如 预计,其均方差为 用求导方法不难求出当 时上述均方误差到达
17、最小,且其均方误差 所以在均方误差标准下,有偏预计 优于无偏预计 。36/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3737页页6.3 最小方差无偏预计 6.3.1 Rao-Blackwell定理 以下定理说明:好无偏预计都是充分统计量函数。定理6.3.2 设总体概率函数是 p(x,),x1,x2,xn 是其样本,T=T(x1,x2,xn)是 充分统计量,则 对 任一无偏预计 ,令 ,则 也是 无偏预计,且 37/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3838页页 定理6
18、.3.2说明:假如无偏预计不是充分统计 量函数,则将之对充分统计量求条件期 望能够得到一个新无偏预计,该预计 方差比原来预计方差要小,从而降低 了无偏预计方差。换言之,考虑 估 计问题只需要在基于充分统计量函数中 进行即可,该说法对全部统计推断问题 都是正确,这便是所谓充分性标准。38/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第3939页页例6.3.1 设 x1,x2,xn 是来自b(1,p)样本,则 是p 充分统计量。为预计 =p2,可令 因为 ,所以 是 无偏预计。这个只使用了两个观察值预计并不好.下面我们用Rao-Blackwe
19、ll定理对之加以改进:求 关于充分统计量 条件期望,得39/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4040页页6.3.2 最小方差无偏预计 定义6.3.1 对参数预计问题,设 是 一个无 偏预计,假如对另外任意一个 无偏预计,在参数空间上都有 则称 是 一致最小方差无偏预计,简记为 UMVUE。假如UMVUE存在,则它一定是充分 统计量函数。40/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4141页页 定理6.3.3 设 x=(x1,x2,xn)是来自某总体一个样本,是
20、一个无偏预计,假如对任意一个满足E(x)=0(x),都有 则 是 UMVUE。关于UMVUE,有以下一个判断准则。41/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4242页页 例6.3.2 设 x1,x2,xn 是来自指数分布Exp(1/)样本,则T=x1+xn 是 充分统计量,而 是 无偏预计。设=(x1,x2 ,xn)是0任一无偏预计,则 两端对 求导得 这说明 ,从而 ,由定理6.3.3,它是 UMVUE。42/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4343页页6.
21、3.3 Cramer-Rao不等式 定义6.3.2 设总体概率函数 P(x,),满足以下条件:(1)参数空间是直线上一个开区间;(2)支撑 S=x:P(x,)0与 无关;(3)导数 对一切 都存在;(4)对P(x,),积分与微分运算可交换次序;(5)期望 存在;则称 为总体分布费希尔(Fisher)信息量。43/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4444页页 费希尔信息量是数理统计学中一个基本概念,很多统计结果都与费希尔信息量相关。如极大似然预计渐近方差,无偏预计方差下界等都与费希尔信息量I()相关。I()种种性质显示,“I(
22、)越大”可被解释为总体分布中包含未知参数 信息越多。44/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4545页页例6.3.3 设总体为泊松分布P()分布,则 于是45/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4646页页例6.3.4 设总体为指数分布,其密度函数为 能够验证定义6.3.2条件满足,且 于是46/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4747页页定理6.3.4(Cramer-Rao不等式)设定义6
23、.3.2条件满足,x1,x2,xn 是来自该总体样本,T=T(x1,x2,xn)是g()任 一个无偏预计,存在,且对 中一切 ,微分可在积分号下进行,则有 47/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第4848页页 上式称为克拉美-罗(C-R)不等式;g()2/(nI()称为g()无偏预计方差 C-R下界,简称g()C-R下界。o 尤其,对 无偏预计 ,有 ;假如等号成立,则称 T=T(x1,xn)是 g()有效预计,有效预计一定是UMVUE。48/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411
24、/8/2024第第4949页页例6.3.5 设总体分布列为p(x,)=x(1-)1-x,x=0,1,它满足定义6.3.2全部条件,能够算得该分布费希尔信息量为 ,若 x1,x2,xn 是该总体样本,则 C-R下界为(nI()-1=(1-)/n。因为 是 无偏预计,且其方差等于 (1-)/n,到达C-R 下界,所以 是 有效预计,它也是 UMVUE。49/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5050页页例6.3.6 设总体为指数分布Exp(1/),它满足定义6.3.2全部条件,例6.3.4中已经算出该分布费希尔信息量为I()=-2
25、,若x1,x2,xn 是样本,则 C-R下界为(nI()-1=2/n。而 是 无偏预计,且其方差等于 2/n,到达了C-R下界,所以,是 有效预计,它也是 UMVUE。50/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5151页页能到达C-R下界无偏预计不多:例6.3.7 设总体为N(0,2),满足定义6.3.2条件,且费希尔信息量为 ,令 ,则 C-R下界为 ,而 UMVUE为 其方差大于C-R下界。这表明全部 无偏预计方差都大于其C-R下界。51/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/
26、8/2024第第5252页页费希尔信息量费希尔信息量主要作用主要作用表达在极大似然预计。表达在极大似然预计。定理6.3.5 设总体X有密度函数 p(x;),为非退化区间,假定 (1)对任意x,偏导数 ,和 对全部 都存在;(2),有 ,其中函数F1(x),F2(x),F3(x)可积.52/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5353页页 (3),若 x1,x2,xn 是来自该总体样本,则存在未知参数 极大似然预计 ,且 含有相合性和渐近正态性:53/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/2024
27、11/8/2024第第5454页页6.4 贝叶斯预计 6.4.1 统计推断基础 o经典学派观点:统计推断是依据样本信息对总体分布或总体特征数进行推断,这里用到两种信息:总体信息和样本信息;o贝叶斯学派观点:除了上述两种信息以外,统计推断还应该使用第三种信息:先验信息。54/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5555页页(1)总体信息:总体分布提供信息。(2)样本信息:抽取样本所得观察值提供信息。(3)先验信息:人们在试验之前对要做问题在经 验上和资料上总是有所了解,这些信息对 统计推断是有益。先验信息即是抽样(试 验)之前相关
28、统计问题一些信息。普通说 来,先验信息起源于经验和历史资料。先验 信息在日常生活和工作中是很主要。55/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5656页页 基于上述三种信息进行统计推断统计学称为贝叶斯统计学。它与经典统计学差异就在于是否利用先验信息。贝叶斯统计在重视使用总体信息和样本信息同时,还注意先验信息搜集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提升统计推断质量。忽略先验信息利用,有时是一个浪费,有时还会导出不合理结论。56/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/2024
29、11/8/2024第第5757页页 贝叶斯学派基本观点:任一未知量 都可看作随机变量,可用一个概率分布去描述,这个分布称为先验分布;在取得样本之后,总体分布、样本与先验分布经过贝叶斯公式结合起来得到一个关于未知量 新分布后验分布;任何关于 统计推断都应该基于 后验分布进行。57/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5858页页6.4.2 贝叶斯公式密度函数形式 总体依赖于参数 概率函数在贝叶斯统计中记为P(x|),它表示在随机变量取某个给定值时总体条件概率函数;依据参数 先验信息可确定先验分布();从贝叶斯观点看,样本 x1,x
30、2,xn 产生分两步进行:首先从先验分布()产生一个样本 0,然后从P(x|0)中产生一组样本。这时样本联合条件概率函数为 ,这个分布综合了总体信息和样本信息;58/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第5959页页 0 是未知,它是按先验分布()产生。为把先验信息综合进去,不能只考虑 0,对其它值发生可能性也要加以考虑,故要用()进行综合。这么一来,样本x1,xn和参数 联合分布为:h(x1,x2 ,xn,)=p(x1,x2 ,xn )(),这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;59/105第六章第
31、六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6060页页在没有样本信息时,人们只能依据先验分布对 作出推断。在有了样本观察值 x1,x2,xn 之后,则应依据 h(x1,x2,xn,)对 作出推断。因为 h(x1,x2,xn,)=(x1,x2,xn)m(x1,x2,xn),其中 是x1,x2,xn 边际概率函数,它与 无关,不含 任何信息。所以能用来对 作出推断仅是条件分布(x1,x2,xn),它计算公式是 60/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6161页页 这个条件分布称为 后验
32、分布后验分布,它集中了总体、样本和先验中相关 一切信息。后验分布(x1,x2,xn)计算公式就是用密度函数表示贝叶斯公式。它是用总体和样本对先验分布()作调整结果,贝叶斯统计一切推断都基于后验分布进行。61/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6262页页6.4.3 贝叶斯预计 基于后验分布(x1,x2,xn)对 所作贝叶斯预计有各种,惯用有以下三种:o使用后验分布密度函数最大值作为 点预计,称为最大后验预计;使用后验分布中位数作为 点预计,称为后验中位数预计;使用后验分布均值作为 点预计,称为后验期望预计。用得最多是后验期望预
33、计,它普通也简称为贝叶斯预计,记为 。62/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6363页页例6.4.2 设某事件A在一次试验中发生概率为 ,为预计 ,对试验进行了n次独立观察,其中事件A发生了X次,显然 X b(n,),即 假若我们在试验前对事件A没有什么了解,从而对其发生概率 也没有任何信息。在这种场所,贝叶斯本人提议采取“同等无知”标准使用区间(0,1)上均匀分布U(0,1)作为 先验分布,因为它取(0,1)上每一点机会均等。贝叶斯这个提议被后人称为贝叶斯假设。63/105第六章第六章 参数估计参数估计 华东师范大学华东师
34、范大学11/8/202411/8/2024第第6464页页 由此即可利用贝叶斯公式求出 后验分布。详细以下:先写出X和 联合分布 然后求X边际分布 最终求出 后验分布 最终结果说明 X Be(x+1,n-x+1),其后验期望预计为 (6.4.4)64/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6565页页一些场所,贝叶斯预计要比极大似然预计更合理一点。比如:“抽检3个全是合格品”与“抽检10个全是合格品”,后者质量比前者更信得过。这种差异在不合格品率极大似然预计中反应不出来(两者都为0),而用贝叶斯预计两者分别是 0.2 和 0.83
35、。由此能够看到,在这些极端情况下,贝叶斯预计比极大似然预计更符合人们理念。65/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6666页页例6.4.3 设x1,x2,xn是来自正态分布N(,02)一个样本,其中02已知,未知,假设 先验分布亦为正态分布N(,2),其中先验均值和先验方差 2均已知,试求 贝叶斯预计。解:样本x分布和 先验分布分别为66/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6767页页由此能够写出x与 联合分布其中 ,。若记则有67/105第六章第六章 参数估
36、计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6868页页 注意到A,B,C均与 无关,由此轻易算得样本边际密度函数 应用贝叶斯公式即可得到后验分布 这说明在样本给定后,后验分布为 N(B/A,1/A),即 68/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第6969页页 后验均值即为其贝叶斯预计:它是样本均值 与先验均值 加权平均。69/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7070页页6.4.4 共轭先验分布 若后验分布(x)与()属于同一个
37、分布族,则称该分布族是 共轭先验分布(族)。o二项分布b(n,)中成功概率 共轭先验分布是贝塔分布Be(a,b);泊松分布P()中均值 共轭先验分布是伽玛分布Ga(,);在方差已知时,正态均值 共轭先验分布是正态分布N(,2);在均值已知时,正态方差 2共轭先验分布是倒伽玛分布IGa(,)。70/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7171页页6.5 区间预计 6.5.1 区间预计概念 定义6.5.1 设 是总体一个参数,其参数空间为,x1,x2,xn是来自该总体样本,对给定一个(0 1),若有两个统计量 和 ,若对任意 ,有
38、(6.5.1)71/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7272页页 则称随机区间 为 置信水平为1-置信区间,或简称 是 1-置信区间.和 分别称为(双侧)置信下限和置信上限.这里置信水平1-含义是指在大量使用该置信区间时,最少有100(1-)%区间含有。72/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7373页页例6.5.1 设x1,x2,x10是来自N(,2)样本,则 置信水平为1-置信区间为 其中,,s 分别为样本均值和样本标准差。这个置信区间由来将在6.5.3
39、节中说明,这里用它来说明置信区间含义。若取=0.10,则t0.95(9)=1.8331,上式化为73/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7474页页 现假定=15,2=4,则我们能够用随机模拟方法由N(15,4)产生一个容量为10样本,以下即是这么一个样本:14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本能够算得 从而得到 一个区间预计为 该区间包含 真值-15。现重复这么方法 100次,能够得到100个样本,也就得到100个区 间,我们将这1
40、00个区间画在图6.5.1上。74/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7575页页 由图6.5.1能够看出,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。图6.5.1 置信水平为0.90置信区间 75/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7676页页 取=0.50,我们也能够给出100个这么区间,见图6.5.2。能够看出,这100个区间中有50个包含参数真值15,另外50个不包含参数真值。图6.5.2 置信水平为0.50置信区间 76/105
41、第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7777页页定义6.5.2 沿用定义6.5.1记号,如对给定(0 1),对任意,有 (6.5.2)称 为 1-同等置信区间。同等置信区间是把给定置信水平1-用足了。常在总体为连续分布场所下能够实现。77/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7878页页定义 若对给定(0 1)和任意,有 ,则称 为 置信水平为1-(单侧)置信下限。假如等号对一切成立,则称 为 1-同等置信下限。若对给定(0 1)和任意,有 ,则称 为 置信水平为1-(
42、单侧)置信上限。若等号对一切成立,则称 为1-同等置信上限。单侧置信限是置信区间特殊情形。所以,寻求置信区间方法能够用来寻找单侧置信限。78/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第7979页页6.5.2 枢轴量法 结构未知参数 置信区间最惯用方法是枢轴量法,其步骤能够概括为以下三步:1.设法结构一个样本和 函数 G=G(x1,x2,xn,)使得G分布不依赖于未知参数。普通称含有这种性质G为枢轴量。2.适当地选择两个常数c,d,使对给定(0 1)有P(cGd)=1-3.假如能将cG d 进行不等式等价变形化为 则 ,是 1-同等置信
43、区间。79/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8080页页关于置信区间结构有两点说明:o满足置信度要求c与d通常不唯一。若有可能,应选平均长度 到达最短c与d,这在G分布为对称分布场所通常轻易实现。o实际中,选平均长度 尽可能短c与d,这往往极难实现,所以,常这么选择 c与d,使得两个尾部概率各为/2,即P(Gd)=/2,这么置信区间称为等尾置信区间。这是在G分布为偏态分布场所常采取方法。80/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8181页页例6.5.2 设x1
44、,x2,xn是来自均匀总体U(0,)一个样本,试对给定(0 1)给出 1-同等置信区间。解:(1)取x(n)作为枢轴量,其密度函数为p(y;)=nyn,0y 1;(2)x(n)/分布函数为F(y)=yn,0y 1,故P(cx(n)/d)=d n-cn,所以我们能够适当地选择c和d满足d n-cn=1-81/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8282页页(3)利用不等式变形可轻易地给出 1-同等置信区间为x(n)/d,x(n)/c,该区间平均长度为 。不难看出,在0cd1及dn-cn=1-条件下,当d=1,c=时,取得最小值,这
45、说明 是 置信水平1-为最短置信区间。82/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8383页页6.5.3 单个正态总体参数置信区间 一、一、已知时已知时 置信区间置信区间 在这种情况下,枢轴量可选为 ,c和d应满足P(cGd)=(d)-(c)=1-,经过不等式变形可得 该区间长度为 。当d=-c=u1-/2时,d-c到达最小,由此给出了同等置信区间为 ,。(6.5.8)这是一个以 为中心,半径为 对称区间,常将之表示为 。83/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8
46、484页页例6.5.3 用天平秤某物体重量9次,得平均值为 (克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量0.95置信区间。解:此处1-=0.95,=0.05,查表知u0.975=1.96,于是该物体重量 0.95置信区间为 ,从而该物体重量0.95置信区间为 15.3347,15.4653。84/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8585页页例6.5.4 设总体为正态分布N(,1),为得到 置信水平为0.95置信区间长度不超出1.2,样本容量应为多大?解:由题设条件知 0.95置信区间为 其区间长度为
47、 ,它仅依赖于样本容量n而与样本详细取值无关。现要求 ,马上有n(2/1.2)2u21-/2.现1-=0.95,故u1-/2=1.96,从而n(5/3)2 1.962=10.6711。即样本容量最少为11时才能使得 置信水平为0.95置信区间长度不超出1.2。85/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8686页页二、2未知时 置信区间 这时可用t 统计量,因为 ,所以 t 能够用来作为枢轴量。完全类似于上一小节,可得到 1-置信区间为 此处 是 2无偏预计。86/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11
48、/8/202411/8/2024第第8787页页例6.5.5 假设轮胎寿命服从正态分布。为预计某种轮胎平均寿命,现随机地抽12只轮胎试用,测得它们寿命(单位:万公里)以下:4.68 4.85 4.32 4.85 4.61 5.025.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值置信区间。经计算有 =4.7092,s2=0.0615。取=0.05,查表知t0.975(11)=2.,于是平均寿命0.95置信区间为(单位:万公里)87/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8888页
49、页 在实际问题中,因为轮胎寿命越长越好,所以能够只求平均寿命置信下限,也即结构单边置信下限。因为 由不等式变形可知 1-置信下限为 将t0.95(11)=1.7959代入计算可得平均寿命 0.95置信下限为4.5806(万公里)。88/105第六章第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第8989页页三、2置信区间 取枢轴量 ,因为 2分布是偏态分布,寻找平均长度最短区间极难实现,普通都用等尾置信区间:采取 2两个分位数 2/2(n-1)和21-/2(n-1),在 2分布两侧各截面积为/2部分,使得 由此给出 21-置信区间为 89/105第六章
50、第六章 参数估计参数估计 华东师范大学华东师范大学11/8/202411/8/2024第第9090页页例6.5.6 某厂生产零件重量服从正态分布N(,2),现从该厂生产零件中抽取9个,测得其重量为(单位:克)45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.6 试求总体标准差 0.95置信区间。解:由数据可算得 s2=0.0325,(n-1)s2=80325=0.26.查表知 2 0.025(8)=2.1797,20.975(8)=17.5345,代入可得 20.95置信区间为 从而 0.95置信区间为:0.1218,0.3454。90/105第六章第六章