资源描述
应用数理统计基础(庄楚强)
考试共8道题
第二章的统计量与常见统计分布(每题12分)
1、样本的数据期望与方差
2、 分布的概念与性质
3、一连续型函数(只有一个未知参数)的无偏估计
第三章参数估计中的矩估计、极大似然估计、估计量的评选标准、区间估计。
(共51分)
4、一正态分布的置性区间
5、两个未知参数函数的矩估计
6、①求一离散型的总体似然估计
②求未知参数的信息量
③求得的似然估计是否是最小方差估计
第四章中的正态总体均值与方差的检验、非正态总体均值的假设检验。(共25分)
7、正态分布的假设检验
8、一离散型总体的假设检验
第二章、数理统计的基本概念与抽样分布
第一节、数理统计的几个基本概念
重点:统计量,书中例题2、习题第四题
第三节、常用统计分布
重点:常用统计分布(、t、F)的定义及性质
第四节、抽样分布
重点:定理1及推论、定理4及推论
本章习题4、5、7、9、13、19、20
第三章、参数估计
掌握:矩估计、极大似然估计、区间估计
本章习题1、2、3、4、10、11、15、16、18、27、29
第四、章假设检验
重点:第二节、一个正态总体均值与方差的检验
第三节、两个正态总体均值与方差的检验
第四节、非正态总体均值的假设检验
书上的例题、习题37、38、39、40
第一章概率论复习与补充
1、概率
2、期望
数据期望的性质
性质1:常量的期望就是这个常量本身, 即 E(c)=c.
推论:E(Ex) = Ex
性质2:随机变量 x 与常量 c 之和的数学期望等于 x 的期望与这个常量 c 的和 E(x+c)=Ex+c
性质3:E(cx) = cE x
性质4:随机变量的线性函数的数学期望等于这个随机变量期望的同一线性函数 E(k x +c)=k E x +c
3、方差
方差的性质
性质 1:常量的方差等于零。即:设 c 为常数,则 Dc = 0
性质 2:随机变量与常量之和的方差就等于随机变量的方差本身
即:D(X+c)=DX
性质 3:常量与随机变量乘积的方差,等于常量的平方与随机变量 方差的乘积。 即:D(cX )=c2DX
性质 4:设 k , b 为常数,则:D(kX +b)=k2DX
性质 5:两个独立随机变量和(差)的方差,等于这两个随机变量方差的和。 即:D(X ±Y ) = DX +DY
第二章数理统计的基本概念与抽样分布
1、统计量(第一题样本数据期望与方差)
预测类似题目可能会有二项分布B(n,p)、0—1分布B(1,p)、均匀分布R[a,b]、指数分布E(λ)、正态分布N(μ,σ2)。
2、常用统计分布(第二题有开方分布的概念与性质)
1) 正态分布函数
定义:若连续随机变量X 的概率密度为 其中 m 为常数,s > 0 为常数,则称 X 服从参数为 m , s 2 的正态分布,记为 X ~ N(m , s 2)。
其分布函数为
正态分布满足密度函数的两个性质:
(1) j (x) > 0 xÎR (2)
标准正态分布
参数m = 0,s =1的正态分布称为标准正态分布其密度函数为:
记为X~ N(0,1)
一般正态分布与标准正态分布的关系
若 X ~ N(m , s 2),Y~ N(0 , 1),它们的密度函数分别记为j (x)和 j 0(x) ,分布函数分别记为F (x) 和F0 (x) ,则
证明:
2) χ2分布
定义 设随机变量X1,X2,…,Xn相互独立,且同服从标准正态分布,则它们的平方和
c 2= X12+X22+… +Xn2
服从的分布称为自由度为 n 的c 2分布。记为: c 2 ~ c 2(n)
c 2 的密度函数为
χ2分布的基本性质
(1) c 2的特征函数
(2) 若 X~c 2(n),Y~c 2(m),且X与Y相互独立, 则 X+Y~ c 2 (n+m)
推论:(1) 若 Xi~c 2(ni), i = 1, 2, …, n ,且相互独立, 则:
(2) 若 X1, X2, …, Xn相互独立,同服从于正态分布N( mi , si2),则
(3) 若分布, 则当 n 充分大时, 近似服从N(0,1).
(4) 若分布, 则当 n 充分大时, 近似服从N(0,1).
c2分布的临界值(a 分位点)
对于给定a(0<a <1),称满足条件:
特征函数
定义 设 ξ为一个实随机变量, F( x )为ξ的分布函数, t 为实数, 称函数
为随机变量ξ( 或分布函数F( x ) )的特征函数。
当ξ为连续型随机变量时, 特征函数为:
当ξ为离散型随机变量时, 特征函数为:
特征函数的一些常用性质
性质1 有界性φ( t ) ≤φ( 0) = 1 。
性质2 设η= kξ+ b, 其中k , b 为常数, 则
证
性质3 若ξ, η独立, 则
性质4 若ξ的n 阶原点矩存在, 则ξ的特征函数的n 阶导数存在, 且有
( k = 1 , 2 , ⋯ , n)
性质5 特征函数与分布函数相互唯一确定(不证) .即分布函数唯一地决定特征函数,而特征函数也唯一地决定分布函数, 特别地, 当ξ为连续型随机变量, 且有F′( x ) = p( x ) 及时,则
3) t -分布
服从的分布为自由度为 n 的 t 分布, 记为t~ t (n)。
4) F 分布
其中 n1 叫做第一自由度, n2 叫做第二自由
度。
F 分布的性质
性质1 若 F ~ F(m, n), 则 1/F ~ F(n, m);
性质2 若
5) 抽样分布
定理1 设随机变量ξ1 ,ξ2 , ⋯ ,ξn 相互独立, 且
( i = 1 , 2 , ⋯ , n ) ,
则它们的任一确定的线性函数
其中常数k1 , k2 , ⋯ , kn 不全为零.
推论1 设总体ξ~ N(μ,σ2 ) , 而(ξ1 , ξ2 , ⋯ , ξn ) 是它的一个样本, 则样本的任一确定的线性函数
其中常数k1 , k2 , ⋯ , kn 不全为零.
推论2 设总体ξ~ N(μ,σ2 ) , (ξ1 ,ξ2 , ⋯ ,ξn )是ξ的一个样本, 则样本均值有
推论3 设 ξ与η 为两个正态总体,ξ~ N (μ1 ,σ21 ) ,(ξ1 ,ξ2 , …ξn1) 为ξ 的样本,η~ N(μ2 ,σ22) , (η1 ,η2 , ⋯ , ηn2)为η的样本, 且这两个样本独立, 则这两个样本均值与之差
或
定理4 设总体ξ~ N(μ, σ2 ) , (ξ1 ,ξ2 , ⋯ ,ξn )是ξ的一个样本, 则
(1)样本均值与样本方差S2 独立。
(2)
推论1 设总体ξ~ N(μ, σ2 ) , (ξ1 ,ξ2 , ⋯ ,ξn )为ξ的一个样本, 则
第三章 参数估计(4个题目51分)
1、矩法(两个未知参数的矩估计 12分)
在一定收敛意义上,经验分布函数是总体分布函数的近似,又由Xинчен 大数定律可知,样本的k 阶原点矩是总体相应矩的近似,这是矩估计法的根据.
设()为总体ξ 的样本,又总体ξ的k 阶原点矩存在但未知,我们用样本的k 阶原点矩 作为的估计量,即
(特别是)
这种用样本各阶原点矩的函数来估计总体各阶原点矩同一函数的方法,称为矩估计法,简称矩法.相应的估计量称为矩估计量。
特别地,当总体方差Dξ 存在时,它的矩估计量就是样本方差S2 ,即
或
极大似然估计
设总体分布(以离散型为例)为P(X=x)=F(x,q1, q2…… ,qk),(q1, q2…… ,qk )∈Θ未知,样本(X1, X2, …, X n )来自总体 X,则样本(X1, X2, …, X n )的概率分布函数为:
进行一次具体的抽样之后,(X1, X2, …, X n ) 得到一组观察值 (x1, x2, …, x n )。
事件(X1= x1, X2= x2, …, X n= xn )发生的概率为:
为(q1, q2…… ,qk )∈Θ的函数。因为(x1, x2, …, x n )在一次观察中就出现了,应出现在概率最大的地方。即求函数
取得最大值的最大值点,以此作为(q1, q2…… ,qk )的估计。
(2)现得到样本值为1.3,0.6 ,1.7 ,2.2 ,0.3 ,1.1 ,试分别用矩法与极大似然法求总体均值、总体方差的估计值.
无偏估计
定义:如果对一切q ÎQ ,有 成立,则称为参数q的无偏估计量,简称无偏估计。
例:设总体X 有期望 EX=m 与方差 DX=s 2,m 与s 2 都未知。
样本(X1, X2, …, X n)来自 X,试证:
(1) 样本方差S2是s 2的无偏估计;
(2) 样本标准差S不是标准差s 的无偏估计;
(3) B2不是s 2的无偏估计。
证:(1) 由定理知: ES2=s 2
(2) DS=ES2 - (ES)2=s 2 - (ES)2
(3) 因
有效估计
定义:设( ξ1 ,ξ2 ,… ,ξn )为总体ξ 的一个样本,总体的未知参数θ ∈ Θ ,Θ 为参数空间,( ξ1 ,ξ2 ,… ,ξn )为待估函数g(θ)的一个无偏估计量.若对g(θ)的任意一个无偏估计量(ξ1 ,ξ2 ,… ,ξn ) ,都有
则称( ξ1 ,ξ2 ,… ,ξn )是g(θ)的一个一致最小方差无偏估计量,缩记为UMVUE( Uniformly Minimum Variance Unbiase Estimation) .
定理1(Rao-Cramé r 定理)设总体ξ的分布密度为p( x ;θ),一维未知参数θ∈ Θ ,参数空间Θ 为一个开区间,(ξ1 ,ξ2 ,… ,ξn )为ξ 的样本,( ξ1 ,ξ2 ,… ,ξn )是待估函数g(θ)的任意一个无偏估计量.假定:
1)集合{ x :p( x ;θ)> 0}与θ无关,即密度为正值的那些x组成的集合与θ值无关.
I(θ)有另一个比较易于计算的表达式:
其中I(θ) 称之为Fisher息量。当I(θ)>0 时,其中称为Rao—Cramér不等式的下界。
其中
定义:设参数的一列估计量 =,满足关系式,() ,则称 为的渐近无偏估计量.
相和性
定义:设总体ξ的概率函数为p( x ;θ) ,(ξ1 ,ξ2 ,… ,ξn) 为总体ξ的样本,{θn=}为未知参数θ 的估计量序列,Θ为参数空间,若对任意ε>0 ,有则称θn为θ的相合(一致)估计量,也可说估计量θn具有相合性(一致性).
定理1 样本原点矩是相应的总体原点矩的相合估计量(假定被估计的总体原点矩存
在),即。
定理2 样本方差S2是总体方差Dξ的相合估计量(假定Dξ存在),即
定理3设θn=为θ的估计量,若Dθn 存在,且及则θn是θ的相合估计量。
例题1、设的正态分布,为样本
① 求σ2+μ的矩估计量
②判断是否是σ2+μ的无偏估计,若不是无偏估计量,请修正为无偏估计量。
例题2、设总体服从参数为P 的几何分布,即 0<p<1,①求p 的极大似然估计量
②求p的信息量I(p)
③问是否是p有效估计量
2、区间估计
区间估计的概念: 设θ=是未知参数θ的一个估计量, 对于一组样本观测值 ( x1, x2, …, xn ) , 算得一个估计值), 点估计就是取。
定义:设总体的分布函数为F( x ;θ),θ 为未知参数,θ∈Θ,为的一个样本,若对事先给定的α(0< α<1)存在两个统计量T1=T1、T2=T2使得
则称区间(T1,T2)为参数θ的1- α的区间估计或1- α的置信区间.T1,T2分别称为置信下限和置信上限,而1- α称为置信区间(T1,T2)的置信度或置信水平,α称为显著性水平或误判风险.
正态总体分布的置信区间
总是假定总体,μ为未知数,而为的一个样本。
① σ2已知,求μ的置信区间
求μ的1- α置信区间,就是要找随机区间( T1,T2),
使得为此,要先构造一个分布为已知的样本函数。
我们知道
根据标准正态分布的分位数可得
即:
所求μ的1- α置信区间为:,
习惯上,这个置信区间常常写作
② σ2未知,求μ的置信区间
由
t 分布的分位数可得
即
亦即
即得到σ2未知,求μ的1- α置信区间
由,上面的μ的1- α置信区间也可写成
正态总体方差的区间估计
① μ已知,求σ2的置信区间
因为
所求σ2的1- α置信区间为
② μ未知,求σ2的置信区间
因为
所求σ2的1- α置信区间为
第四章、假设检验(两题共25分)
展开阅读全文