资源描述
(完整word)经验分布函数及其应用
经验分布函数及其应用
经验分布函数定义
定义:设是总体(离散型、或连续型,分布函数F(x)未知)的n个独立观测值,按大小顺序可排成 。若 ,则不超过x的观测值的频率为函数,就等于在n次重复独立试验中事件的频率。
我们称此函数 为总体的经验分布函数或样本分布函数.
简单性质:
1.对于每一组观测值 ,单调,非降,左连续且在点有间断点,在每个点的跳跃值都是 。
2.显然,具有分布函数的其他性质.
3.为样本的函数,是一统计量,即为一随机变量,由于相互独立且有相同的分布函数,因而它等价于n次独立重复试验的伯努利概型中事件发生k次其余 次不发生的额概率,即有:
4。格列汶科定理
设总体 的分布函数为 ,经验分布函数为,对于任何实数x,记
则有
其中 也为一统计量用来衡量与之间在所有的x的值上的最大差异程度,格列汶科定理证明了统计量以概率为1地收敛于0,也就是如下所要说的经验分布函数的收敛性问题。
经验分布函数的收敛性
经验分布函数在统计中有着非常重要的作用, 是理论分布函数与实际数据间的桥梁, 本科教材中已经指出, 当样本容量足够大时, 经验分布函数依概率收敛于总体分布函数,所以, 统计推断才得以以样本为依据, 而得到合理的结果.而事实上, 经验分布函数与总体分布函数还有更进一步的收敛关系, 下简单介绍之
我们采用R语言中ecdf(stats)函数,ecdf()所属R语言包:stats,
1
2
3
4
plot(ecdf(c(rnorm(10000))),
do.points=FALSE, verticals=TRUE,main = ”模拟正态分布的经验分布函数”)
mtext("样本容量为10000",side=3,line=0)
以下用的是采用数学方法画出经验分布函数的代码:
1
2
3
4
5
6
dat=rnorm(10000)
x=density(dat)$x
dx=diff(density(dat)$x)[1]
y=density(dat)$y
plot(x,cumsum(y*dx),main = "模拟正态分布的经验分布函数")
mtext("样本容量为10000”,side=3,line=0)
经验分布函数是一个随机变量,而经验分布函数的观测值就是普通意义上的分布函数,它具有分布函数的一切性质。
展开阅读全文