1、一、点估计问题的提法 设总体设总体 X 的分布函数形式已知的分布函数形式已知,但它的一个但它的一个或多个参数为未知或多个参数为未知,借助于总体借助于总体 X 的一个样本来的一个样本来估计总体未知参数的值的问题称为估计总体未知参数的值的问题称为点估计问题点估计问题.例例1解解用样本均值来估计总体的均值用样本均值来估计总体的均值 E(X).点估计问题的一般提法点估计问题的一般提法二、估计量的求法 由于估计量是样本的函数由于估计量是样本的函数,是随机变量是随机变量,故故对不同的样本值对不同的样本值,得到的参数值往往不同得到的参数值往往不同,如何如何求估计量是关键问题求估计量是关键问题.常用构造估计量
2、的方法常用构造估计量的方法:(两种两种)矩估计法和最大似然估计法矩估计法和最大似然估计法.由辛钦大数定律由辛钦大数定律,其中其中 为连续函数为连续函数.这表明这表明,当样本容量很大时当样本容量很大时,在统计上在统计上,可以用可以用 用样本矩去估计总体矩用样本矩去估计总体矩.这一事实导出矩估计法这一事实导出矩估计法.定义定义 用样本原点矩估计相应的总体原点矩用样本原点矩估计相应的总体原点矩,又又用样本原点矩的连续函数估计相应的总体原点矩的用样本原点矩的连续函数估计相应的总体原点矩的连续函数连续函数,这种参数点估计法称为这种参数点估计法称为矩估计法矩估计法.1.矩估计法矩估计法(X为连续型为连续型
3、)(X为离散型为离散型)矩估计法的具体做法矩估计法的具体做法:i=1,2,k从这从这 k 个方程中解出个方程中解出j=1,2,kj=1,2,k那么用诸那么用诸 的估计量的估计量 Ai 分别代替上式中的诸分别代替上式中的诸 ,即可得诸即可得诸 的的矩估计量矩估计量:矩估计量的观察值称为矩估计量的观察值称为矩估计值矩估计值.的函数的函数,记为:记为:设总体的分布函数中含有设总体的分布函数中含有k个未知参数个未知参数 ,那么它的前那么它的前k阶矩阶矩 都是这都是这 k 个参数个参数解解根据矩估计法根据矩估计法,例例2 例例3 设总体设总体 X 在在 a,b 上服从均匀分布上服从均匀分布,a,b 未知
4、未知.是来自是来自 X 的样本的样本,试求试求 a,b 的矩估计量的矩估计量.解解 即即 解得解得于是于是 a,b 的矩估计量为的矩估计量为 解解解方程组得到矩估计量分别为解方程组得到矩估计量分别为例例4上例表明上例表明:总体均值与方差的矩估计量的表达式不因不总体均值与方差的矩估计量的表达式不因不同的总体分布而异同的总体分布而异.一般地一般地,矩法的优点矩法的优点是简单易行是简单易行,并不需要事先知道总体并不需要事先知道总体是什么分布是什么分布.缺缺点点是是,当当总总体体类类型型已已知知时时,没没有有充充分分利利用用分分布提供的信息布提供的信息.一般场合下一般场合下,矩估计量不具有唯一性矩估计
5、量不具有唯一性.其主要原因在于建立矩法方程时,选取哪些总体其主要原因在于建立矩法方程时,选取哪些总体矩用相应样本矩代替带有一定的随意性矩用相应样本矩代替带有一定的随意性.2.最大似然估计法最大似然估计法似然函数的定义似然函数的定义最大似然估计法最大似然估计法似然函数的定义似然函数的定义求最大似然估计量的步骤求最大似然估计量的步骤:最大似然估计法也适用于分布中含有多个最大似然估计法也适用于分布中含有多个未知参数的情况未知参数的情况.此时只需令此时只需令对数似然方程组对数似然方程组对数似对数似然方程然方程解解似然函数似然函数例例5这一估计量与矩估计量是相同的这一估计量与矩估计量是相同的.解解例例6
6、这一估计量与矩估计量是相同的这一估计量与矩估计量是相同的.解解X 的的似然函数为似然函数为例例7它们与相应的矩它们与相应的矩估计量相同估计量相同.例例8 设设x1,x2,xn是取自总体是取自总体XU(0,)的一个样本的一个样本求求的最大似然估计和矩估计的最大似然估计和矩估计.故故的最大似然估计为的最大似然估计为另一方面另一方面,由于由于EX=/2,故故矩估计为矩估计为两者不同两者不同!用求导方法无法最终确定用求导方法无法最终确定用定义直接来求用定义直接来求.要使要使L()达到最大,达到最大,应最小,但它小不过应最小,但它小不过x(n),解解:当当x1,x2,xn为样本值时为样本值时,似然函数为
7、似然函数为 极大似然估计有一个简单而有用的性质:极大似然估计有一个简单而有用的性质:如果如果 是是 的极大似然估计,则对任一函的极大似然估计,则对任一函数数 g(),其极大似然估计为,其极大似然估计为 。该性。该性质称为极大似然估计的质称为极大似然估计的不变性不变性,从而使一,从而使一些复杂结构的参数的极大似然估计的获得些复杂结构的参数的极大似然估计的获得变得容易了变得容易了。第二节 基于截尾样本的最大似然估计一、基本概念一、基本概念二、二、基于截尾样本的最大似然估计基于截尾样本的最大似然估计一、基本概念1.寿命分布的定义寿命分布的定义产品寿命产品寿命T 是一个随机变量是一个随机变量,它的分布
8、称为寿它的分布称为寿命分布命分布.2.完全样本的定义完全样本的定义(一种典型的寿命试验一种典型的寿命试验)如果不能得到完全样本如果不能得到完全样本,就考虑截尾寿命试验就考虑截尾寿命试验.3.两种常见的截尾寿命试验两种常见的截尾寿命试验(1)定时截尾寿命试验定时截尾寿命试验(2)定数截尾寿命试验定数截尾寿命试验二、基于截尾样本的最大似然估计1.定数截尾样本的最大似然估计定数截尾样本的最大似然估计设产品的寿命分布是指数分布设产品的寿命分布是指数分布,其概率密度是其概率密度是设有设有n个产品投入定数截尾试验个产品投入定数截尾试验,截尾数为截尾数为m,得定数截尾样本得定数截尾样本为了确定似然函数为了确
9、定似然函数,观察上述结果出现的概率观察上述结果出现的概率.上述观察结果出现的概率近似地为上述观察结果出现的概率近似地为 取似然函数为取似然函数为对数似然函数为对数似然函数为2.定时截尾样本的最大似然估计定时截尾样本的最大似然估计设定时截尾样本设定时截尾样本与上面讨论类似与上面讨论类似,得似然函数为得似然函数为例例 设电池的寿命服从指数分布设电池的寿命服从指数分布,其概率密度为其概率密度为随机地取随机地取50只电池投入寿命试验只电池投入寿命试验,规定试验进规定试验进行到其中有行到其中有15只失效时结束试验只失效时结束试验,测得失效时测得失效时间间(小时小时)为为115,119,131,138,1
10、42,147,148,155,158,159,163,166,167,170,172.解解第三节 估计量的评选标准一、问题的提出一、问题的提出二、无偏性二、无偏性三、有效性三、有效性四、相合性四、相合性一、问题的提出 从前一节可以看到从前一节可以看到,对于同一个参数对于同一个参数,用不用不同的估计方法求出的估计量可能不相同同的估计方法求出的估计量可能不相同.而且而且,很明显很明显,原则上任何统计量都可以作为未知参数原则上任何统计量都可以作为未知参数的估计量的估计量.问题问题(1)对于同一个参数究竟采用哪一个估计量好对于同一个参数究竟采用哪一个估计量好?(2)评价估计量的标准是什么评价估计量的标
11、准是什么?下面介绍几个常用标准下面介绍几个常用标准.二、无偏性无偏估计的实际意义无偏估计的实际意义:无系统误差无系统误差.证证例例1特别的特别的:不论总体不论总体 X 服从什么分布服从什么分布,只要它的数学期望存在只要它的数学期望存在,证证例例2(这种方法称为这种方法称为纠偏纠偏).证证例例3证明证明例例4 由以上两例可知由以上两例可知,一个参数可以有不同的无一个参数可以有不同的无偏估计量偏估计量.三、有效性 由于方差是随机变量取值与其数学期望的由于方差是随机变量取值与其数学期望的偏离程度偏离程度,所以无偏估计以方差小者为好所以无偏估计以方差小者为好.证明证明例例5 (续例续例4)证明证明例例
12、6 (续例续例3)四、相合性例如例如证明证明 由大数定律知由大数定律知,例例7由大数定律知由大数定律知,第四节 区间估计一、区间估计的基本概念一、区间估计的基本概念二、典型例题二、典型例题一、区间估计的基本概念1.置信区间的定义置信区间的定义关于定义的说明关于定义的说明若反复抽样多次若反复抽样多次(各次得到的样本容量相等各次得到的样本容量相等,都是都是n)按按伯努利大数定理伯努利大数定理,在这样多的区间中在这样多的区间中,例如例如2.求置信区间的一般步骤求置信区间的一般步骤(共共3步步)单击图形播放单击图形播放/暂停暂停ESCESC键退出键退出单击图形播放单击图形播放/暂停暂停ESCESC键退
13、出键退出解:解:例例1二、典型例题这样的置信区间常写成这样的置信区间常写成其置信区间的长度为其置信区间的长度为由一个样本值算得样本均值的观察值由一个样本值算得样本均值的观察值则置信区间为则置信区间为其置信区间的长度为其置信区间的长度为比较两个置信区间的长度比较两个置信区间的长度置信区间短表示估计的精度高置信区间短表示估计的精度高.说明说明:对于概率密度的图形是单峰且关于纵坐标对于概率密度的图形是单峰且关于纵坐标轴对称的情况轴对称的情况,易证取易证取a和和b关于原点对称时关于原点对称时,能使能使置信区间长度最小置信区间长度最小.今抽今抽9件测量其长度件测量其长度,得数据如下得数据如下(单位单位:
14、mm):142,138,150,165,156,148,132,135,160.解解例例2例例:已知幼儿身高服从正态分布,现从已知幼儿身高服从正态分布,现从56岁的幼岁的幼儿中随机地抽查了儿中随机地抽查了9人,其高度分别为:人,其高度分别为:115,120,131,115,109,115,115,105,110cm;解解 第五节 正态总体均值与方差的区间估计一、单个总体的情况一、单个总体的情况二、两个总体的情况二、两个总体的情况一、单个总体 的情况由上节例由上节例2可知可知:1.包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称得质量称得质量(单单位位:克克)分别为分别为506,500,
15、495,488,504,486,505,506,500,495,488,504,486,505,513,521,520,512,485.513,521,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解例例1查表得查表得推导过程如下推导过程如下:解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得重称得重量量(克克)如下如下:设袋装糖果的重量服从正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值例例2就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为
16、95%.这个误差的可信度为这个误差的可信度为95%.推导过程如下推导过程如下:根据第六章第二节定理二知根据第六章第二节定理二知2.进一步可得进一步可得:注意注意:在密度函数不对称时在密度函数不对称时,习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解代入公式得标准差的置信区间代入公式得标准差的置信区间例例3二、两个总体 的情况讨论两个整体总体均值差和方差比的估计问题讨论两个整体总体均值差和方差比的估计问题.推导过程如下推导过程如下:1.例例4
17、4为比较为比较,两种型号步枪子弹的枪口速度两种型号步枪子弹的枪口速度,随机地取随机地取型子弹型子弹10发发,得到枪口速度的平均值为得到枪口速度的平均值为随机地取随机地取型子弹型子弹20发发,得枪口速度平均值为得枪口速度平均值为假设两总体都可认为近似假设两总体都可认为近似地服从正态分布地服从正态分布,且由生产过程可认为它们的方差且由生产过程可认为它们的方差相等相等,求两总体均值差求两总体均值差信区间信区间.解解 由题意由题意,两总体样本独立且方差相等两总体样本独立且方差相等(但未知但未知),推导过程如下推导过程如下:2.根据根据F分布的定义分布的定义,知知解解例例5 研究由机器研究由机器 A 和
18、机器和机器 B 生产的钢管内径生产的钢管内径,随随机抽取机器机抽取机器 A 生产的管子生产的管子 18 只只,测得样本方差为测得样本方差为均未知均未知,求方差比求方差比区间区间.设两样本相互独设两样本相互独抽取机器抽取机器B生产的管子生产的管子 13 只只,测测得样本方差为得样本方差为立立,且设由机器且设由机器 A 和机器和机器 B 生产的钢管内径分别服生产的钢管内径分别服从正态分布从正态分布信信第六节 分布参数的区间估计一、置信区间公式一、置信区间公式二、典型例题二、典型例题一、置信区间公式推导过程如下推导过程如下:因为因为(01)分布的均值和方差分别为分布的均值和方差分别为因为容量因为容量
19、n较大较大,由由中心极限定理中心极限定理知知二、典型例题 设从一大批产品的设从一大批产品的100个样品中个样品中,得一级品得一级品60个个,求这批产品的一级品率求这批产品的一级品率 p 的置信水平为的置信水平为0.95的的置信区间置信区间.解解一级品率一级品率 p 是是(0-1)分布的参数分布的参数,例例1p 的置信水平为的置信水平为0.95的置信区间为的置信区间为第七节 单侧置信区间二、基本概念二、基本概念三、典型例题三、典型例题一、问题的引入一、问题的引入四、小结四、小结一、问题的引入 但在某些实际问题中但在某些实际问题中,例如例如,对于设备、元对于设备、元件的寿命来说件的寿命来说,平均寿
20、命长是我们希望的平均寿命长是我们希望的,我们我们关心的是平均寿命关心的是平均寿命 的的“下限下限”;与之相反与之相反,在在考虑产品的废品率考虑产品的废品率 p时时,我们常关心参数我们常关心参数 p的的“上限上限”,这就引出了单侧置信区间的概念这就引出了单侧置信区间的概念.二、基本概念1.单侧置信区间的定义单侧置信区间的定义2.正态总体均值与方差的单侧置信区间正态总体均值与方差的单侧置信区间三、典型例题 设从一批灯泡中设从一批灯泡中,随机地取随机地取5只作寿命试验只作寿命试验,测得寿命测得寿命(以小时计以小时计)为为 1050,1100,1120,1250,1280,设灯泡寿命服从正态分布设灯泡寿命服从正态分布,求灯泡寿命平均求灯泡寿命平均值的置信水平为值的置信水平为 0.95 的单侧置信下限的单侧置信下限.解解例例1