资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第三章 参数估计和假设检验,主要内容,点估计方法,代替法、极大似然估计法,区间估计,单个正态总体均值和方差的区间估计,两个正态总体均值差和方差比例的区间估计,单个总体比率和两个总体比率差的区间估计,假设检验,单个正态总体均值与方差的检验,两个正态总体均值差与方差比的检验,单个总体比率和两个总体比率差的区间估计,第一部分,参 数 估 计,一、点估计方法,1.,代替原则:频率代替和矩法,(,1,)频率代替,用观察的频数代替总体比率的估计值。,主要用于处理离散数据。,比如投掷硬币正面朝上的频率。,(,2,)矩法,设,x,1,,,,,x,n,是,N,(,,,2,)的一个样本,因此,E,(,x,i,),=,,,D,(,x,i,),=,2,,,i,=1,,,2,,,,,n,,,,,2,是总体的一阶原点矩和二阶中心矩。用样本的一阶原点矩(即样本均值)去估计总体的均值,。用样本的二阶原点矩 去估计总体的二阶原点矩,2,2,。于是可得到近似关系式,由上式解出,与,2,的估计量,例,1,:,设总体,X,的分布密度为:,样本为(,X,1,,,X,2,,,,,X,n,),用矩法估计参数,解:,2,极大似然估计(简记,MLE,),设,x,1,,,,,x,n,是抽自密度为,f,(,x,;,)的一个样本,则,x,1,,,,,x,n,的联合密度为,f,(,x,1,;,),f,(,x,2,;,),f,(,x,n,;,)。这时,x,1,,,,,x,n,被视为变量,,被视为常量。如果把样本观察值,x,1,,,,,x,n,视为常量,将要估计的,视为变量,,f,(,x,1,;,),f,(,x,2,;,),f,(,x,n,;,)被称为,的似然函数,记为,L,(,;,x,1,,,,,x,n,)。即,极大似然估计的基本原理,根据样本的具体情况来选择估计参数,使样本出现的可能性最大,这种选择使得出现概率最大的那个估计值作为参数的估计量。,概率最大的事件最可能出现。,求解方法,构造似然函数;,对似然函数求偏导,解似然方程组,例,2.,设,x,1,,,,,x,n,是抽自,N,(,,,2,)的随机样本,求,,,2,的极大似然估计。,解:样本观察值,x,1,,,,,x,n,的联合密度,即似然函数为,在一般情况下,由于,L,的最大值点与,ln,L,的最大值点是相同的,可对,L,取对数。,由于似然函数中有两个未知参数,对其求偏导并令其为,0,解此方程组得,于是得到,和,2,的极大似然估计,二、评价估计量好坏的标准,无偏性,若参数,的估计量,有效性,一致性,参数估计习题,1,随机地抽取,8,只活塞,直径为(单位,mm,):,74.001,74.005,74.003,74.000,74.001,73.993,74.006,74.002,试求总体均值,和方差的矩估计量;并求样本方差。,解:,2,设总体服从区间,0,,,上的均匀分布,其密度函数为:,X,1,X,2,,,X,n,为样本,试用矩法估计均值和方差,以及参数,的估计量。,解:,3,设,X,1,X,2,,,X,n,为样本,求下列总体未知参数的矩估计和极大似然估计,三、区间估计,单个正态总体均值和方差的区间估计,两总体均值之差和方差的区间估计,单个总体比率和两个总体比率差的区间估计,区间估计步骤,明确待估参数和置信度,用参数的点估计导出估计量的分布,利用估计量的分布给出置信区间。,1,总体均值,的区间估计,(,1,)正态总体,方差已知,当方差,2,已知,此时样本均值,当给定显著性水平,时,有,(,2,)当总体分布未知,或非正态分布时,样本如果为大样本(,n50,时),认为样本均值近似地服从正态分布,用样本方差来估计总体方差。,例,3,某县,1997,年抽样调查了,400,户农民家庭的人均年化纤布消费量,得到均值为,3.3,米,标准差为,0.98,米。试以,95,的置信度估计该县,1987,年农民家庭年人均化纤布的消费水平。,解:由题意,虽然总体未知,但,n,=400,属于大样本,可用,Z,统计量进行区间估计,即,将各数值代入,得到,置信区间为,3.204,3.396,故我们有,95,的把握保证该县,1997,年农民家庭年人均化纤消费量为,3.204,米到,3.396,米。,(3),正态总体中,均值,和方差,2,均未知,要用小样本估计,时,也要用样本方差,S,2,代替,2,,此时不能应用标准正态分布的,Z,统计量,而应该用,t,统计量,即,则均值,的,1,的置信区间为,例,4,铅的比重测量值是服从正态分布的。现测量了,16,次,得到样本均值,2.705,,,S,0.029,。若置信度为,95%,,试求铅的比重的置信区间。,解:根据已知,n,=16,,样本均值,2.705,,,S,0.029,,且从附录查到,铅比重的置信区间为,2.690,,,2.720,。,例,5,:已知一批产品的均值为,,方差为,0.5,2,,问至少应抽取多大容量的样本,才能使样本均值和总体均值的绝对误差,在置信度不低于,95%,的条件下小于,0.1,?,解:,2,两总体均值之差的区间估计,两方差已知,两方差未知,是大样本,用样本方差代替总体方差,两方差未知,小样本,但两方差相等,用,t,统计量。,(,1,)方差已知,样本服从,由样本的独立性可知,,(,2,)方差未知时,但两个样本都是大样本,则不论总体分布的情况如何,可用样本方差代替总体方差,在给定,后,置信区间为,例,6,从某市近郊区和远郊区各自独立地抽取了,50,户农民家庭,调查每户年末手存现金和存款余额。经计算得:均值分别为,650,元,,480,元,,S,1,120,元,,S,2,106,元。试以,95%,的概率估计该市近郊区与远郊区农民平均每户年末手存现金和存款金额之差的置信区间。,解:虽然两总体分布未知,但由于,n,1,=,n,2,=50,,属于大样本,故可用,Z,统计量近似计算。有,经计算得到,125.62,,,214.38,,即该市近远郊农民平均每户年末手存现金和存款余额相差大约,125.62,元至,214.38,元,其可靠性为,95,。,(,3,)若两个样本是小样本,两个总体均为正态分布,总体方差未知,但已知方差相等,则可用样本方差来替代总体方差。这时,该统计量不再服从正态分布,而应采用,t,统计量,即,3,单个正态总体方差的区间估计,正态分布,均值方差未知,(1),正态分布,均值方差未知,设总体服从正态分布,其中均值和方差均未知。从总体中任意抽一样本,试对总体方差进行区间估计。由于,即,例,7,某灯具厂为提高产品质量,降低其主要产品,C,型灯泡使用寿命的不稳定程度,随机抽取了,40,个,C,型灯泡,测得其平均使用寿命为,4800,小时,样本标准差为,300,小时。试以,95,的可靠性估计该型灯泡寿命方差的置信区间(已知其寿命服从正态分布)。,解:由题意知,n,=40,,,S,300,,查表得,得置信区间为,4,两个正态总体方差比的区间估计,在两个正态总体中,参数均未知。从两总体中独立地各取一个样本,其标准差分别,S,1,和,S,2,。我们要对总体方差之比做出区间估计。,由,F,分布的定义知,在给定置信度,1-a,时,,例,8,两种不同型号的电阻分别服从正态分布的总体,参数均未知。依次抽取容量为,25,和,15,的两独立样本,测得阻值样本方差依次为,6.38,和,5.15,,求两总体方差比的,90,的置信区间。,解:由题已知,n,1,=25,,,n,2,=15,,故,n,1,-1=24,,,n,2,-1=14,。又,1,0.90,,,例题,9,:有一大批糖果,现从中随机地取,16,代,称得重量如下:,506,,,508,,,499,,,503,,,504,,,510,,,497,,,512,,,514,,,505,,,493,,,496,,,506,,,502,,,509,,,496,,设重量近似地服从正态分布,试求总体均值的置信度为,0.95,的置信区间。,解,例,10,比较,A,、,B,两种型号的枪口速度,随机地取,A,型子弹,10,发,得到枪口平均速度为,500,(,m/s,),标准差,s1=1.10(m/s),,随机地取,B,型子弹,20,发,得到枪口平均速度为,496,,标准差,s2=1.2(m/s),,假设两总体近似地服从正态分布,方差相等,求两总体均值差的置信度为,0.95,的置信区间。,解:两总体方差未知但相等,构造,t,枢轴量,例,11,在稳定生产的情况下,某工厂生产的灯泡的使用寿命服从正态分布,现观察,20,个灯泡的使用时数,平均值为,1832,,样本标准差为,510,,试求:,(,1,)灯泡使用时数均值的,95%,的区间估计。,(,2,)灯泡使用时数的方差的,90%,的区间估计。,解:,例,12,随机地从,A,导线中抽取,4,根,,B,导线中抽取,5,根,测得电阻为:,A,导线:,0.143,0.142,0.143,0.137,B,导线:,0.140,0.142,0.136,0.138,0.140,测量的数据分别来自两个正态分布,样本相互独立,均值方差均未知,试求置信度为,95%,的均值差的置信区间。,解,:,例,13,设两化验员,A,、,B,独立地对某化合物各进行,10,次测定,两样本的方差分别为:,0.5419,,,0.6065,,总体服从正态分布,求置信度为,0.05,的方差比的置信区间。,解,:,5.,关于比率,P,的区间估计,设,X,服从(,0-1,)分布,它的分布率为,例,17,设从一大批产品中抽取,100,个样本,得一级品,60,个,求这批产品一级品率,p,的置信度为,0.95,的置信区间。,解:,6.,对两个总体比率差的区间估计,设,XB,(,1,,,p,1,),,YB,(,1,,,p,2,),,X,1,,,X,2,,,X,n,,,Y,1,,,Y,2,,,Y,m,分别为总体,X,和,Y,的样本,当,n,m,充分大时,的置信度为的双侧置信区间为:,例:某企业估计生产的手表的废品率,置信度为,95%,估计的区间长度不超过,0.04,,样本容量多大才能满足要求?,解:估计区间长度为:,7.,关于总体比率估计中样本容量的确定,第二部分,假 设 检 验,一、假设检验分类,参数检验,总体分布已知,对总体的参数作出判断。,非参数检验,总体分布的类型不确知,检验的目的是作出一般论断,如属于某种类型的分布。,二、假设检验与区间估计的关系,总体分布已知,推断总体参数,如在质量检验中,以一定的概率把握程度估计总体不合格率的范围,属于区间估计。,以一定的概率推断总体是否合格,属于假设检验。,同一实例中,区间估计和假设检验用同样本、同统计量、同分布。,区间估计中的置信区间对应假设检验的接受域,置信区间外对应的就是假设检验的拒绝域。,三、假设检验的基本原理,假设某包装量均值为,a=500,克,抽样得子样的均值为,508,克,均值偏离为,508-500=8,克,若,为,2,克,偏离值是,4,倍的,。,小概率事件:态变量落入(均值,3,)的概率为,99.73%,,取样落在区间外,小概率事件发生了,只能认为假设均值,=500,克值得怀疑。,反证法思想:带有概率性质的反证法。,四、假设检验中的两类错误,第一类错误,在原假设,H,0,成立的情况下,样本值落入了拒绝域,被拒绝了,称为拒真错误;,犯第一类错误的概率为,,称为检验水平。,第二类错误,在原假设,H,0,不成立的情况下,样本并未落入拒绝域,而接受了,称为纳伪错误。,犯第二类错误的概率为,。,在假设检验中,确定,,使,尽可能小。,原因:,原假设是明确的,备选假设是模糊的;,原假设是简单假设,备择假设是复合假设;,五、假设检验的步骤,第一步,建立假设,提出原假设,H,0,和备选假设,H,1,。,第二步,寻找检验,H,0,的统计量。,第三步,选择显著性水平,。,第四步,用检验统计量值与临界值比较,确定接受还,是拒绝,H,0,。,一个正态总体的均值检验,两个正态总体均值是否相等的检验,一个正态总体的方差检验,两个正态总体的方差检验,检验内容,六、一个正态总体均值的假设检验,原假设和备择假设,H,0,:,=,0,,,H,1,:,0,(双,侧检验),H,0,:,0,,,H,1,:,0,(,右侧检验),H,0,:,0,,,H,1,:,0,(,左侧检验),已知方差时的均值检验,未知方差,属于大样本时的均值检验,未知方差,小样本时的均值检验,例,1,:洗衣粉包装量服从正态分布,,=,0,=2,克为已知,随机抽取,10,袋,测得平均包装量为,498,克,能否认为均值为,500,克?(显著水平,0.05,),解:设,H,0,:,均值,=500,克,,H,1,:均值,500,克,例,2,:某一燃料的等级服从正态分布,平均等级为,98.0,,标准差为,0.8,,抽取,25,桶新燃料进行测试,样本平均值为,97.7,,标准差与原来一致,能否认为新燃料的等级比原来的等级偏低?(显著水平,0.05,),解:假设检验:,H,0,:,0,=98.0,,,H,1,:,0,98.0,例,3,某食品厂用自动装罐机装罐头食品,每罐标准重量为,500,克。现随机抽取,10,罐来检查机器工作情况,这,10,罐的重量为(单位:克):,495,,,510,,,505,,,498,,,503,,,492,,,502,,,512,,,497,,,506,。假定重量服从正态分布,试问这段时间机器工作是否正常(给定显著性水平,5,)。,解:建立假设,,H,0,:,500,H,1,:,500,因而不能拒绝原假设,故机器没发现异常。,七、两个正态总体均值是否相等的检验,(,1,)若两正态总体的方差已知,检验两正态总体均值是否相等时,用,Z,统计量检验;,(,2,)两正态总体方差未知,属于大样本(样本容量大于等于,50,):,(,3,)两正态总体方差未知,但方差相等:,例,4,现有两种不同热处理方法对金属材料做抗拉强度试验,得到试验数据(单位:公斤厘米,2,)为,甲法:,31,,,34,,,29,,,26,,,32,,,35,,,38,,,34,,,30,,,29,,,32,,,31,乙法:,26,,,24,,,28,,,29,,,30,,,29,,,32,,,26,,,31,,,29,,,32,,,28,设两总体均为正态总体,且方差相等。在给定显著性水平,0.05,时,问两种方法得到的抗拉强度有无显著差异。,解:将两种热处理加工的金属材料抗拉强度分别视为总体,建立假设,H,0,:,1,2,H,1,:,1,2,统计量落入拒绝域中。故两种热处理法加工的金属材料抗拉强度有显著差异。,八、单个正态总体方差的检验,设,XN,(,1,,,2,),,建立假设,例,5,已知某纺纱车间纺出细纱的支数服从正态分布,其总体标准差为,1.2,支。从某日纺出的一批细纱中,随机地抽出,16,缕进行支数测量,得到样本标准差,S,为,2.1,支,问该日纱的均匀度与平时有无显著差别(取,0.05,)。,解:建立假设,检验量落入拒绝域中,说明这一天细纱均匀度与往日相比有显著差别。,设,X,1,和,X,2,分别抽自正态总体,九、两正态总体方差的检验,例,6,现用两台机床加工同一种轴。从这种两台机床的产品中分别随机地抽取若干根,测得直径(单位:毫米)为机床甲:,20.5,,,19.8,,,19.7,,,20.4,,,20.1,,,20.0,,,19.0,,,19.9,;机床乙:,19.7,,,20.8,,,20.5,,,19.8,,,19.4,,,20.6,,,19.2,。假定各台机床加工轴的直径分别服从正态总体,试比较这两台机床加工的精度间有无显著差异(取,0.05,)。,解:经计算得样本值,十、关于比率,P,的假设检验,设,XB,(,1,,,P,)分布,,P,为未知参数,设,X,1,,,X,2,,,X,n,来自总体的一个大样本,,例:现抽检一批自行车零件,根据以往数据所知,不合格率为,5%,,在,200,个抽检零件中,发现有,7,个不合格,问不合格率是否下降?,解:设定检验假设为:,H,0,:,P=0.05,,,H,1,:,P0.05,十一、关于两个总体比率差的假设检验,设,XB,(,1,,,P,),,YB,(,1,,,P,)分布,设,X,1,,,X,2,,,X,n,来自总体,X,的一个样本,,Y,1,,,Y,2,,,Y,m,来自总体,Y,的一个样本,,假设检验习题,1,设计规定的由自动机床生产的产品尺寸,a=35,,随机抽取,20,个,测量结果为:,产品尺寸,x,i,:,34.8 34.9 35.0 35.1 35.3,频数,n,i,:,2 3 4 6 5,试求在显著性水平,a=0.05,下,产品有无系统偏差。,解:,2,某医生在高校随即地抽取,100,名男生,测得其血压平均为,136mmHg,,标准差为,18mmHg,,另一高校抽取,80,名男生,测得血压均值为,128mmHg,,标准差为,14mmHg,,假设血压服从正态分布,问这两高校男生的血压平均值有无显著差异?,解:,考虑如下检验:,3,北京市某小学四年级学生进行体检,随机抽取,16,名衄生,身高分别为:,124 118 121 141 139 128 133 130 140 136 129 135 132 140 137 136,在天津某小学随机测得,15,名四年级女生身高分别为:,128 134 143 126 130 129 131 125 135 140 123 135 136 129;,假定两地女生身高服从正态分布,试问两地女生身高的分散程度有无显著差别?,解:,
展开阅读全文