资源描述
幻灯片1
抽样分布
总体
样本
统计推断
方 差 分 析
拟合优度检验
单个样本的统计假设检验
两个样本的差异显著性检验
回 归 分 析
统计假
设检验
总体参
数估计
统计
推断
幻灯片2
第六章 参数估计
Estimation of parameter
幻灯片3
l 参数估计(estimation of parameter):通过样本统计量对相应总体参数的估计。
l 估计量(estimator):估计总体参数的样本统计量。如:样本平均数、样本方差等。
幻灯片4
本 章 内 容
第一节 点估计
第二节 区间估计
1、区间估计的基本概念和一般原理
2、总体参数的置信区间估计及分析
μ和σ的置信区间、平均数差的置信区间、配对数据的置信区间、标准差比的置信区间、二项分布总体的置信区间估计及分析
幻灯片5
第一节 点估计
点估计(point estimate):直接用由样本数据计算出来的统计量的值,估计总体参数。
用来估计总体参数的样本统计量即估计量很多,一个最优的估计量应该满足无偏性、有效性、相容性三个条件。
幻灯片6
无偏估计量:如果一个统计量的理论平均数,即它的数学期望等于总体参数,这个统计量称为无偏估计量。
有效估计量:在样本含量相同的情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个统计量称为更有效估计量。
相容估计量:若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而趋于1,则该统计量称为参数的相容估计量。
幻灯片7
最优估计量:具有无偏性、有效性和相容性的统计量,称为总体参数的最优估计量。
经数学推证,样本算术平均数和样本方差分别是总体数学期望和总体方差的最优估计量。
幻灯片8
【例6.1】已知玉米单交种群单105的平均穗重μ0=300g。喷药后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。对喷药后玉米果穗重的总体平均数和总体方差做点估计。
解:
计算样本平均数:
计算样本方差:
喷药后玉米果穗重的总体平均数和总体方差的点估计值为308g、(9.62g)2。
幻灯片9
第二节 区 间 估 计
一、区间估计的基本概念和一般原理
1、问题的引出
【例6.2】已知动物总体体重标准差σ=0.40g,μ未知。从该总体中抽取样本含量n=10的样本,样本平均数y=10.23g。由以上数据估计推断该动物总体体重平均数μ是否为10.00g 。
l H0: μ=10.40g
l HA: μ≠10.40g α=0.05 uα/2=±1.96
l u=(y -μ) / (σ/√n)
l =-1.34
l uα/2 <u < uα/2
l u落在H0的接受域内,接受H0。
H0: μ=10.20g
HA: μ≠10.20g
α=0.05 uα/2=±1.96
u=(y -μ) / (σ/√n)
=0.24
- uα/2 <u < uα/2
u落在H0的接受域内,接受H0。
H0: μ=10.00g HA:μ≠10.00g
α=0.05 uα/2=±1.96
u=(y -μ) / (σ/√n)
=1.82
- uα/2 <u < uα/2
u落在H0的接受域内,接受H0。
幻灯片10
0
-1.96
+1.96
0.95
u
幻灯片11
2、区间估计的基本概念
⑴ 区间估计(interval estimate) :由样本统计量对总体参数所做的在某一概率水平下可能包含未知参数的一个范围值的估计。
⑵ 置信水平(confidence level):在一个范围值内(某一区间)包含未知参数的概率,就称为这一参数包含于这一区间的置信水平,也称为置信度。记为1-α。
幻灯片12
⑶ 置信区间(confidence interval):在一定置信水平下包含未知参数的区间。
置信区间一般由两个数值,即两个置信限(confidence limit,CL)组成:
较小的称为置信下限(lower limit,L),
较大的称为置信上限(upper limit,U)。
幻灯片13
3、区间估计的一般原理
l 在样本抽样分布的基础上,借助统计假设检验,只要标准化的样本统计量落在接受域,所有的零假设都将被接受,于是得到一个在一定置信水平下包含总体参数的区间,这个区间就是由样本统计量对总体参数所做的区间估计。
幻灯片14
二、μ的置信区间
1、σ已知时
总体均数μ的1-α置信区间由下式确定:
1-α
µ
μ的1-α置信区间:
幻灯片15
1.2 σ已知,总体均数μ单侧1-α置信区间为:
或
μ0.05/2=1.96
μ0.05=1.645
幻灯片16
2、σ未知时
总体均数μ的1-α置信区间由下式确定:
1-α
µ
μ的1-α置信区间:
t具n-1自由度
幻灯片17
2.2 σ未知,总体均数μ单侧1-α置信区间为:
或
t
s
t
s
X ~ t(df)
t
s
t
s
幻灯片18
【例6.3】已知玉米单交种群单105的平均穗重μ0=300g。喷药后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。对喷药后玉米果穗重做区间估计,并对估计结果进行分析。
解:
计算喷药后玉米穗重的μ的0.95置信区间:
把已知条件代入公式
喷药后玉米果穗重0.95的置信区间为(300.6,315.4)g。
分析:喷药后玉米果穗重有95%的可能在300.6~315.4g之间,由此推断喷药前后果穗重差异显著。
幻灯片19
例:6.3
【例】从某年某市12岁男孩中抽得121名样本, 求得身高的均数为143.05cm, 标准误为0.55cm, 试估计该市12岁男孩身高均数的95%置信区间。
把已知条件代入公式:
143.05±1.980×(0.55/√121)
=143.05±0.099
=142.951, 143.149
尽管总体标准差s未知,但样本含量较大,可采用正态分布进行近似计算:
u
143.05±1.960×(0.55/√121)
=143.05±0.098
=142.952, 143.148
幻灯片20
例5-2 从某年某市12岁男孩中抽得120名样本, 求得身高的均数为143.05cm, 标准误为0.55cm, 试估计该市12岁男孩身高均数的95%置信区间。
尽管总体方差s未知,但样本含量较大,可采用Z分布进行近似计算:
幻灯片21
3、如何得到一个较窄的置信区间?
由公式
知:
要得到一个较窄的置信区间,必须:
① 缩小σ或s ;
② 增加样本含量;
③ 放宽α。
幻灯片22
三、σ的置信区间
从方差为σ2的正态总体中,随机抽取含量为n的样本,计算出样本方差s2,将s2标准化后,服从n-1自由度的x2分布,据此建立σ的1-α置信区间:
幻灯片23
【例6.4】一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽出10株,它们的株高为:90、105、101、95、100、100、101、105、93、97cm。估计提纯后群体的标准差。
解:
计算经提纯后小麦株高标准差的0.99置信区间。
把已知条件代入公式:
得到σ的0.99置信区间:(3.04, 11.21)
分析:提纯后小麦株高标准差有99%的可能在3.04~11.21cm
之间。推断提纯后的株高比原株高高度整齐。
幻灯片24
三、置信区间的涵义
95%的置信区间表示:如果从同一总体中重复抽取100个独立样本,将可能有95个置信区间包括总体均数,有5个置信区间包括总体均数。
对于一次估计的置信区间,可能有95%的正确率,但仍有5%的置信区间估计错误。
幻灯片25
四、置信区间估计的优劣:
置信度大好,还是小好?
1. 置信度1-a(准确度,accuracy),愈接近1愈好,如99%的置信度比95%的置信度要好;
2. 区间的宽度(精密度, precision ),区间愈窄愈好。
当样本含量为定值时,上述两者互相矛盾。
在置信度确定的情况下,增加样本含量可减小区间宽度。
幻灯片26
五、总体均数置信区间与参考值范围的区别
幻灯片27
二、总体方差的置信区间
总体方差s2的100(1-a)%置信区间:
幻灯片28
四、平均数差的置信区间
1、标准差σi已知
标准差si已知时,两个样本平均数的和与差的分布服从正态分布
幻灯片29
得到:
μ1-μ2的1-α置信区间:
幻灯片30
2、标准差σi未知但相等
标准差si未知但相等时,两个样本平均数的和与差的分布服从df1+ df2即n1+ n2-2自由度的t分布。
当n1= n2= n时,
幻灯片31
得到μ1- μ2的1-α置信区间:
t具n1+ n2-2自由度
当n1= n2= n时
t具2n-2自由度
幻灯片32
【例6.5】研究两个小麦品种从播种到抽穗所需天数,n1=n2=10,y1=99.2,y2=98.9,σi未知,经F检验认为σ1=σ2,s21=0.84,s22=0.77。求μ1-μ2的0.95置信区间。
解:
把已知条件代入公式:
得到μ1-μ2的0.95置信区间:
分析:两个小麦品种从播种到抽穗所需天数的差值有95%的可能在-0.54~1.14之间。置信区间包含0,说明两个小麦品种从播种到抽穗所需天数差异不显著。
幻灯片33
【例6.6】研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:⑴n1=9,y1=27.92,s21=8.673。⑵n2=6,y2=25.11, s22=1.843。经F检验认为σ1=σ2。推估μ1-μ2的0.95置信区间。
解:
把已知条件代入公式:
得到μ1-μ2的0.95置信区间:
分析:两种激素类药物对肾组织切片氧消耗的影响的差值有95%的可能在0.01~5.61之间。置信区间不包含0,说明两种激素类药物对肾组织切片氧消耗的影响显著。
幻灯片34
3、标准差σi未知且不等
μ1-μ2的1-α置信区间:
自由度:
幻灯片35
五、配对数据的置信区间
μ的1-α置信区间:
幻灯片36
【例6.7】高粱雄性不育系西地迈罗和矬巴子,分别与12个父本杂交,测定杂种籽粒蛋白质含量。推估 的0.95置信区间。已知:
解:
把已知条件代入公式:
得到μ1-μ2的0.95置信区间:
分析:用两种不同母本所配成的高粱杂交种籽粒蛋白质含量的差值有95%的可能在-0.452~0.710之间。区间包含0,说明用两种不同母本所配成的高粱杂交种籽粒蛋白质含量差异不显著。
幻灯片37
六、标准差比的置信区间
得到:
幻灯片38
μ的1-α置信区间:
幻灯片39
七、二项分布总体的置信区间
在实际应用中,事件A发生的概率 的0.95及0.99置信区间,可以根据样本含量n和事件A出现的次数y,查附表8二项分布 的置信区间表得到。
幻灯片40
在做发芽实验时,50粒种子中有10粒发芽,估计总体发芽率的0.95置信区间。
例6.8
解:
查附表8得总体发芽率的0.95置信区间为(10%~34%)。
若观察分数y/n超过0.50,则以1-(y/n)作为观察分数,以1减去各置信区间上、下限。
在做发芽实验时,100粒种子中有80粒发芽,估计总体发芽率的0.95置信区间。
例6.9
解:
查观察分数1-0.80=0.20的置信区间,得(13%,29%);以1减去各置信区间上、下限,得0.80的置信区间,为(71%,87%),即总体发芽率的0.95置信区间为(71%~87%)。
幻灯片41
八、区间估计与统计假设检验的联系
1. 区间估计可回答统计假设检验的问题,并能提供更多信息。
l 置信区间如果包括参数零假设值或0或1时,则相当于假设检验在α检验水平上不拒绝H0。
l 如果置信区间不包括参数零假设值或0或1,则相当于假设检验在α检验水平上拒绝H0。
l 置信区间能提供1-α置信度下包括总体参数或0或1的一个区间范围。
幻灯片42
2. 区间估计不能取代统计假设检验
置信区间只能在预先规定的概率α前提下进行计算,而统计假设检验能够根据样本数据计算得到的统计量及样本的其他信息(如自由度)获得确切的概率P值。
3. 区间估计与统计假设检验各有长短,
在实际应用中应互相参照使用
幻灯片43
作业:
习题第1、2、4、7题。
展开阅读全文