标准差公式.doc_咨信网zixin.com.cn

资源描述

标准差（Standard Deviation），也称均方差（mean square error），是各数据偏离平均数的距离的平均数，它是离均差平方和平均后的方根，用S（σ）表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的，标准差未必相同。　标准差也被称为标准偏差，或者实验标准差，公式如下两式：或即：如是总体，标准差公式根号内除以n 如是样本，标准差公式根号内除以（n-1) 因为我们大量接触的是样本，所以普遍使用根号内除以（n-1) 公式意义所有数减去其平均值的平方和，所得结果除以该组数之个数（或个数减一)，再把所得值开根号，所得之数就是这组数据的标准差。标准差越高,表示实验数据越离散,也就是说越不精确；反之,标准差越低,代表实验的数据越精确简单来说，标准差是一组数据平均值分散程度的一种度量。一个较大的标准差，代表大部分数值和其平均值之间差异较大；一个较小的标准差，代表这些数值较接近平均值。　　例如，两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ，但第二个集合具有较小的标准差。标准差可以当作不确定性的一种测量。例如在物理科学中，做重复性测量时，测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值，测量值的标准差占有决定性重要角色：如果测量平均值与预测值相差太远（同时与标准差数值做比较），则认为测量值与预测值互相矛盾。这很容易理解，因为如果测量值都落在一定数值范围之外，可以合理推论预测值是否正确。标准差应用于投资上，可作为量度回报稳定性的指标。标准差数值越大，代表回报远离过去平均数值，回报较不稳定故风险越高。相反，标准差数值越细，代表回报较为稳定，风险亦较小。例如，A、B两组各有6位学生参加同一次语文测验，A组的分数为95、85、75、65、55、45，B组的分数为73、72、71、69、68、67。这两组的平均数都是70，但A组的标准差为17.07分，B组的标准差为2.37分（此数据时在R统计软件中运行获得），说明A组学生之间的差距要比B组学生之间的差距大得多。求证下列公式：由题意可知，求证下列式子即可：假设xi=+ai，既有xi-=ai，即求证下列式子即可：因为：所以：所以：所以：设X是一个随机变量，若E{[X-E(X)]^2}存在，则称E{[X-E(X)]^2}为X的方差，记为D(X)或DX。　　即D(X)=E{[X-E(X)]^2}称为方差，而σ(X)=D(X)^0.5（与X有相同的量纲）称为标准差（或均方差）。即用来衡量一组数据的离散程度的统计量。　　方差刻画了随机变量的取值对于其数学期望的离散程度。　　若X的取值比较集中，则方差D(X)较小；　　若X的取值比较分散，则方差D(X)较大。　　因此，D（X）是刻画X取值分散程度的一个量，它是衡量X取值分散程度的一个尺度。方差的计算　　由定义知，方差是随机变量 X 的函数　　g(X)=[X-E(X)]^2 　　的数学期望。即：　　由方差的定义可以得到以下常用计算公式：　　D(X)=E(X^2)-[E(X)]^2 　　证明：　　D(X)=E[X-E(X)]^2 　　=E{X^2-2XE(X)+[E(X)]^2} 　　=E(X^2)-2[E(X)]^2+[E(X)]^2 　　=E(X^2)-[E(X)]^2 　　方差其实就是标准差的平方。方差的几个重要性质　　（1）设c是常数，则D(c)=0。　　（2）设X是随机变量，c是常数，则有D(cX)=(c^2)D(X)。　　（3）设 X 与 Y 是两个随机变量，则　　D(X+Y)= D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]} 　　特别的，当X，Y是两个相互独立的随机变量，上式中右边第三项为0（常见协方差），　　则D(X+Y)=D(X)+D(Y)。此性质可以推广到有限多个相互独立的随机变量之和的情况. 　　（4）D(X)=0的充分必要条件是X以概率为1取常数值c，即P{X=c}=1，其中E(X)=c。常见随机变量的期望和方差　　设随机变量X。　　X服从(0—1)分布，则E(X)=p D(X)=p(1-p) 　　X服从泊松分布，即X~ π(λ),则 E(X)= λ，D(X)= λ 　　X服从均匀分布，即X~U(a，b),则E(X)=(a+b)/2, D(X)=(b-a)^2/12 　　X服从指数分布，即X~e(λ), E(X)= λ^(-1)，D(X)= λ^(-2) 　　X服从二项分布，即X~B(n,p)，则E(x)=np, D(X)=np(1-p) 　　X 服从正态分布，即X~N(μ,σ^2), 则E(x)=μ, D(X)=σ^2 　　X 服从标准正态分布，即X~N(0,1), 则E(x)=0, D(X)=1

展开阅读全文