资源描述
第七讲推论统计与区间估计第七讲推论统计与区间估计一、参数得区间估计一、参数得区间估计n由于真正得参数我们并不知道由于真正得参数我们并不知道,无法知道无法知道由样本所计算得点估计值到底距离真值由样本所计算得点估计值到底距离真值有多少有多少,也就就是说我们无法知道点估计也就就是说我们无法知道点估计值得精确度如何?值得精确度如何?n因此我们改用一个范围或一个区间来对因此我们改用一个范围或一个区间来对未知参数进行估计未知参数进行估计,如估计某城市居民得如估计某城市居民得平均月收入在平均月收入在8001000元之间。元之间。区间估计区间估计(intervalestimation)得实质得实质就是在一定得可信度就是在一定得可信度(置信度置信度/置信概置信概率率)下下,用样本统计值得某个范围用样本统计值得某个范围(置置信区间信区间)来来“框框”住总体得参数值住总体得参数值1、1概念辨析概念辨析有关区间估计得几个概念有关区间估计得几个概念:n置信区间置信区间(confidenceinterval)总体参数得估计范围总体参数得估计范围;n置信度置信度(confidencecoefficient)置信区间估计得可靠性置信区间估计得可靠性;n显著性水平显著性水平(significancelevel)置信区间估计得不可靠得概率。置信区间估计得不可靠得概率。1、2区间估计得一般表达式区间估计得一般表达式其中区间其中区间 称作置信区间称作置信区间;1 称作置信度称作置信度;称作显著性水平称作显著性水平;011、3置信区间与置信度得关系置信区间与置信度得关系n置信区间置信区间(范围范围)得大小反映得就是这种估计得精确得大小反映得就是这种估计得精确性问题性问题,而置信度得高低反映得就是这种估计得可而置信度得高低反映得就是这种估计得可靠性或把握性问题靠性或把握性问题、n区间估计得结果通常用下述方式表达区间估计得结果通常用下述方式表达:“我们有我们有95%得把握认为得把握认为,全市职工得月工资收入为全市职工得月工资收入为182元元至至218元之间元之间”或者或者“全省人口中全省人口中,女性占女性占50%至至52%得可能性为得可能性为99%”1、在样本容量一定得情况下、在样本容量一定得情况下,置信区间与置信度就置信区间与置信度就是互相制约得是互相制约得,表现为表现为:置信度越高置信度越高,置信区间越宽置信区间越宽,估计精度越低估计精度越低;置信度越低置信度越低,置信区间越窄置信区间越窄,估计精度越高。估计精度越高。(例子例子:“某班得数学考试成绩在某班得数学考试成绩在0-100之间之间”,与与“某班考试某班考试得成绩在得成绩在75-85之间之间”-75-85之间得人数只有之间得人数只有80人人,那么置那么置信度只有信度只有0、8。)从准确度来瞧从准确度来瞧,区间越大越好区间越大越好;从精确度来瞧从精确度来瞧,区间越小越好区间越小越好2、参数区间估计时、参数区间估计时,置信区间与置信度缺一不可置信区间与置信度缺一不可,必必须同时给出置信区间与置信度。须同时给出置信区间与置信度。1、4置信度置信度(1)与显著性水平与显著性水平得得关系关系1、对立统一得两个概念。置信度就是估计、对立统一得两个概念。置信度就是估计可靠得概率可靠得概率,而显著性水平就是不可靠得而显著性水平就是不可靠得概率。概率。2、置信度显著性水平、置信度显著性水平1;如果提出置信如果提出置信度要求为度要求为0、95,那么意味着显著性水平为那么意味着显著性水平为0、05;3、置信度往往用在参数估计中、置信度往往用在参数估计中,显著性水显著性水平一般用于假设检验中平一般用于假设检验中;2区间估计得公式区间估计得公式2、1总体均值得区间估计总体均值得区间估计估计公式为估计公式为:或者置信度或者置信度为为1 得区得区间估计为间估计为:2、2参数估计公式理解得第一种思路参数估计公式理解得第一种思路知识连线知识连线“均值抽样分布得基本特征均值抽样分布得基本特征”12大家应该也有点累了,稍作休息大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流均值抽样分布得基本特征均值抽样分布得基本特征1、大样本、大样本(通常指通常指n50,当然越大越好当然越大越好),均值均值抽样分布服从正态分布抽样分布服从正态分布;2、均值抽样分布之均值就就是总体均值、均值抽样分布之均值就就是总体均值;3、均值抽样分布得标准差、均值抽样分布得标准差,称为标准误差称为标准误差(standarderror),计算公式为计算公式为均值抽样分布得基本特征均值抽样分布得基本特征(续续1)4、如果将均值标准化、如果将均值标准化,就可得到标准正态就可得到标准正态分布分布:N(0,1)此表达式就此表达式就是参数估计是参数估计与假设检验与假设检验得基础得基础均值抽样分布得基本特征均值抽样分布得基本特征(续续2)5、通过标准化转化、通过标准化转化,均值抽样分布中任意均值抽样分布中任意两值之间得样本均值次数所占得比例就两值之间得样本均值次数所占得比例就是可以知道得。通过查标准正态分布表是可以知道得。通过查标准正态分布表,社会学常用得有社会学常用得有:90得面积在得面积在11、65(SE);65(SE);95得面积在得面积在11、96(SE);96(SE);99得面积在得面积在22、58(SE);58(SE);由此推出由此推出:总体均值区间估计得常用公式总体均值区间估计得常用公式置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:2、3参数估计公式理解得第二种思路参数估计公式理解得第二种思路01式中式中:X为总体均值为总体均值得点估计值得点估计值,即样本均值即样本均值;1为置信度为置信度;为标准误差为标准误差(SE),其中其中为总体标准差为总体标准差,当当未知时未知时,用样本标准差用样本标准差S代替代替;n为样本量为样本量,一般一般n50;为正态分布双侧区间得分位点为正态分布双侧区间得分位点;置信度为置信度为90,1、65置信度为置信度为95,1、96置信度为置信度为99,2、58得常用取值得常用取值:(参考附表四参考附表四)同样推出同样推出:总体均值区间估计得常用公式总体均值区间估计得常用公式置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:例例1:均值得区间估计均值得区间估计n调查某工厂工人得工资状况调查某工厂工人得工资状况,随机抽取了随机抽取了900名工人做样本名工人做样本,调查得到她们得平均工资为调查得到她们得平均工资为186元元,标准差为标准差为42元元、求求95%得置信度下得置信度下,全全厂职工得月平均工资就是多少厂职工得月平均工资就是多少?解解:将调查资料代入均值得区间估计公式得将调查资料代入均值得区间估计公式得n查附录得查附录得Z检验表中检验表中,n故故,总体得置信区间为总体得置信区间为,即即183、26-188、742、4大样本总体成数得区间估计大样本总体成数得区间估计成数估计主要就是对定类变量。成数估计主要就是对定类变量。比如产品得合格率、某项电视节目得比如产品得合格率、某项电视节目得收视率等等。收视率等等。总体成数得估计公式总体成数得估计公式:或置信度为或置信度为1 得区得区间估计为间估计为:式中式中,为总体成数得点估计值为总体成数得点估计值,即样本成数即样本成数;为标准误差为标准误差,P往往用往往用 代替代替;为正态分布双侧区间得分位点为正态分布双侧区间得分位点;置信度为置信度为90,1、65置信度为置信度为95,1、96置信度为置信度为99,2、58得常用取值得常用取值:(参考附表四参考附表四)同理同理,总体成数区间估计得常用公式总体成数区间估计得常用公式:置信度为置信度为90:置信度为置信度为95:置信度为置信度为99:例例2:总体百分数总体百分数(比例比例)得区间估计得区间估计n从某工厂随机抽取从某工厂随机抽取400名工人进行调查名工人进行调查,结果表结果表明女工得百分比位明女工得百分比位20%,现在要求在现在要求在90%得置信得置信度下度下,估计全厂工人中女工比例得置信区间估计全厂工人中女工比例得置信区间n解解:代入公式得代入公式得,即置信区间为即置信区间为16、7%-23、9%
展开阅读全文