1、社会统计学卢淑华第六章第二节 名词解释1、总体:研究的全体2、样本与简单随机样本:从总体中按一定方式抽出的一部分叫样本。要求抽样的数据不但是随机变量而且互相独立,遵从同一分布,则,这种样本就叫简单随机样本。简单随机样本有3种情况3、统计量:根据样本数据计算的统计指标称统计量。i 13样本成数1 nn i 1nxi x 22样本方差 S 2 1n 1P mn用样本均值:x xi用样本方差:1第三节 参数的点估计作为 的点估计值一、总体参数均值与方差的点估计公式1、总体均值的点估计值1 nn i 12、总体方差的点估计值xi x 22nn 1 i 1S 2用标准差:S x3、总体成数的点估计值用样
2、本成数:表示在样本n次观测中,A类共出现m次。i mni 1mnp 1 nn i 1 xi例:5位被调查者的月收入:A 500B 510C 490D 520E 480求总体均值、方差的点估计值 x 的方差:Dx 2样本方差 S 2 的方差:DS n 2 1二、评价估计值的标准1、无偏性:x 的均值等于待估参数假如 Q 是总体参数Q的估计值,且Q 分布的均值有 E Q Q,则称 Q 是Q的无偏估计。2、有效性:1方法:假如两个估计值Q1 x1 x2 xn 及 Q 2 x1 x2 xn ,它们都满足无偏性,则当 Q1 的方差比 Q 2 的方差小时,则Q1 较 Q 2 更有效。2增加样本容量可以有效
3、的增加一次抽样接近待估参数的概率。样本均值n2 43、一致性:一个数的估计值要求随样本容量n的增大而以较大的概率去接近被估计参数的值。把样本容量为n时的估计值记作 Q n,假如 n 时,Q n 按概率收敛于总体参数Q,即对于任何正数 ,有:lim P Q Q 1n 则称 Q n 是Q的一致估计值。2、总体为正态分布 N,,但方差为未知,统计量 s第四节 抽样分布已不再服从正态分布,而是服从自由度k=n-1的t分布。一、例二、样本均值的分布1、总体分布为正态分布 N,2,且方差,样本均值自然服从正态分布。x 2n3、任意总体,大样本情况,根据中心极限定理,在大样本情况下,x 的分布接近于正态分布
4、。结论:在社会现象的研究中,只要n足够大,x 的分布将确定它为一个近似的正态分布。一般情况下 S 分布很复杂,它的准确分布22不一定能求出来。要知道它的大致形状,可通过计算机模拟的方法,从总体中随机抽取相当数目的样本,并作出样本方差的频率直方图。,置信区间反映估计的准确性Q第五节 正态总体的区间估计一、置信度、置信区间假如用Q x1 x2 xn 作为未知参数Q的估计值,则区间包含参数Q之概率为1 的关系表达式为Q1 置信度置信概率置信区间估计的可靠性 显著性程度置信区间不可靠的概率置信区间与置信度的关系:在样本容量一定的情况下,置信区间和置信度是互相制约的。置信度愈大,则相应的置信区间也愈宽。
5、1、为P x 1 二、正态总体均值的区间估计即:2x nN 0,1以下统计量满足正态分布 Z 对于 的双侧置信区间有P Z 2 Z Z 2 1 22 n x nzz练习例:某地月收入状况服从正态分布,根据64人的抽样,其平均收入为800元,求置信度为时的 的双侧置信区间。2、为未知时当总体满足正态分布,但 未知的情况P x t 2 1 22下,以下统计量满足自由度k=n-1的t分布。x s nt t n 1 t 2 1 的双侧置信区间有:pt代入:s n x t 2sn假如 未知,x 800接上例抽样人数为20,求置信区间。2s 10 x n 1由度k=n-1的 x 分布:S对于给定置信度 1
6、 ,双侧区间 x 的临界p x1 x x 1 x x三、正态总体方差的区间估计对于正态总体 N ,2,以下统计量满足自2 n 1 2 222值应满足:2 2 2 2 2 1 222n 1 s212n 1 s22整理:p求 的置信区间。0.05 接上例:抽样10户,收入状况如下:790 800 810 820 780760 840 800 750 8502 x z 1 p x z第六节 大样本区间估计一、大样本总体均值的区间估计 s s 2 n 2 n 为总体标准差,当 为未知情况下,可用样本标准差代替总体标准差。n为样本容量 n 50z2 为正态分布双侧区间的分位点。二、总体成数二项总体参数的
7、估计为总体中A成数P的点估计值。一总体成数P的点估计假如在样本容量为n的简单随机抽样中,对于所要研究的A共出现m次,则样本成数 Pmnp E p ppqnD p p p z p p p z p 1 z 为正态分布双侧区间的分位点二大样本总体成数p的区间估计区间估计公式:2 2 ppp1 pn总体成数p的点估计值 当p未知情况下,用 p 代替 p p2x x 1 s1 2 s22222nn区间:x x zx x,x x z x x z 为正态分布双侧区间的分位点三、大样本二总体均值差的区间估计2 21、样本均值差为:x1 x2 1 2作为总体均值差 1 2 的点估计值。2、区间估计:px1 x2 z x1 x2 1 2 x1 x2 z x1 x2 1 2 21 21 21 21 2 1 2 1 2 1 22 221、样本成数差 p p 为总体成数差 p p 的z 为正态分布双侧区间的分位点p p1 p2 p1 p2 1 2 p p 1 2 p1 p2 四、大样本二总体成数差的区间估计点估计值。2、区间估计2 1 2 1 2 122 p p p p2 1zz p1 1 p1 p2 1 p2 n1 n2 p1 p12p2 p