资源描述
《社会统计学》复习资料
一、概念辨析(3×8')
1.参数估计与假设检验
参数估计是通过样本对总体的未知参数进行估计,假设检验指通过样本对总体的某种假设进行检验。参数估计是先看样本的情况,再看总体的情况。假设检验是先假设总体的情况,再以一个随机样本的统计值来检验这个假设是否正确。换言之,要先构思总体情况,才进行抽样和分析样本的资料。
2.点估计与区间估计
点估计指根据样本资料以一个最适当的样本统计值来代表总体的参数值,简单明确,但不能说明估计结果的抽样误差和把握程度;区间估计指以两个数值之间的间距来估计参数值。点估计是区间估计的基础。
3.置信度和置信度水平
置信度又称置信概率或置信系数,表示用置信区间估计的可靠性,即置信区间内包含参数的概率。置信度水平表示用置信区间估计不可靠的概率。置信度与置信度水平之和为1。
4.虚无假设与研究假设
虚无假设又称原假设、零假设。是一种无差别假设,是一种已有的,具有稳定性的经验看法,没有充分根据,是不会被轻易否定的。研究假设又称备择假设,是研究者所需证实的假设。否定后可以认为是对的。
5.甲种误差与乙种误差
甲种误差又称第一类错误,是指为真,但小概率事件发生了,拒绝了,即把真的当成假的,它是在拒绝原假设时出现的错误。犯甲种误差的概率是显著性水平。乙种误差即纳伪的错误,又称第二类错误,是指为假,但小概率事件没有发生,接受即把假的当成真的,它是在接受原假设时出现的错误。犯乙种误差的概率为,的值随着真值与原假设中的偏离程度而变化,越小,的数值就越大。大就小,小就大。
6.独立样本和配对样本
独立样本指从二个总体中,分别独立地各抽取一个随机样本进行比较和研究。配对样本指它只有一个样本,但样本中每个个体要先后观测两次,这样所有个体先观测的值看作是来自第一个总体的样本值,所有个体后观测的值,看作是来自另一个个体的样本值,以此来比较两总体之间的不同。
二、单项选择(10×1.5')
三、多项选择(5×2')
四、判断题(10')
五、计算题(41')
1.标准差与四分位差
2. 区间估计
3.假设检验
主要知识点归纳
一、四种测量尺度
特性∕尺度
定类尺度
定序尺度
定距尺度
定比尺度
分类(=,≠)
√
√
√
√
排序(<,>)
√
√
√
间距(+,-)
√
√
比值(×,÷)
√
二、单变量描述
1. 定类层次
⑴次数:每一值原始资料出现次数。
⑵比例:
⑶比率:比例的百分数。
⑷对比值:两数目、的对比值。
⑸条形图、圆形图。
⑹众值:次数最多之值。
⑺离异比率:(为众值次数)
⑻统计表要求:①表要编号;②表名称;③上下粗线条;④注明资料来源。
2. 定序层次
⑴累加次数:把次数逐级累加,分为向上累加()和向下累加()
⑵累加百分率:将各级百分率数值逐渐相加。
⑶中位值:在一个序列的中央位置之值。
分组资料:
(为中位值组的真实下限,为中位值组频数,为低于中位值组真实下限之累加次数,为中位值组组距,为全部个案数目)
⑷四分位差
①原资料: 位置;位置;
②分组资料:位置;位置;
;
注:、为、组真实下限;、为、组次数;、为低于、组累加次数;、为、组距。
3. 定距层次
⑴间距:上、下限之差。
⑵组距:真实上、下限之差。
⑶直方图:又称矩形图,以一个矩形的面积表示每组数值的次数或百分率的多少。
⑷均值:两种情况下不用均值:①开放间距;②存在极端个案。
⑸极差:最大值与最小值之差。
⑹平均差:各记分数偏离均值的绝对差的算术平均数。
⑺标准差
①未分组资料:(为次数,为均值)
②分组资料:(为每组的组中点, 为次数)
4. 正态曲线
⑴特点:①中间高,两边低;②对称轴为;③以横轴为渐近线。
⑵标准正态分布的均值是0,标准差是1。
⑶标准分:以均值为基点,以标准差为度量单位的数值。
⑷任意两点、之间面积为
三、双变量测量
1. 消减误差比例(PRE)
⑴定义:用一种现象来解释另一种现象时,减少百分之几的误差。
⑵(表示在不知道的情况下,预测值所产生的全部误差;表示在知道的情况下,根据的每个值来预测值时产生的误差)
⑶时,,与全相关;,,与无相关。
2. 定类变项
⑴系数:
⑵系数:
⑶相关测量法
(对称); (不对称)
注:、为变项、的众值次数,、分别为、变项每个值下、
的众值次数。、[0,1]
⑷相关测量法(适用于不对称关系)
;;[0,1]
为某条件次数,、分别为、变项的某个边缘次数。
3. 定序变项
⑴系数(适用于对称关系,不考虑同分对)
[-1,1] (为同序对数,为异序对数)
⑵相关测量法(适用于不对称关系)
;[-1,1](为只在上同分的对数)
4. 定距变项
⑴简单线性回归
;;
⑵协方差:
⑶积距相关系数:[-1,1]
5. 定类变项与定距变项
⑴相关比率(平方系数,适用于不对称关系):
;[0,1]
四、参数估计
1. 点估计
⑴样本均值:
⑵样本方差:
⑶样本成数:
2. 区间估计
⑴正态分布总体的区间估计
①总体方差()已知:
②总体方差()未知:
⑵大样本区间估计()
①均值的区间估计:
②成数的区间估计:;
(或)
③二总体均值差的区间估计()
;
若未知,则可用
④二总体成数差的区间估计()
;
⑤积距相关系数
;
五、单、二总体假设检验
1. 一端检验与两端检验
⑴区分:在成立研究假设时可以定出方向,则选用一端检验。不能定出方向的,则使用二端检验。在显著度相同时,两端检验比一端检验更难否定虚无假设。
⑵检定力(乙种误差概率)
2. 单总体假设检验
⑴大样本假设检验
①总体均值检验:(若未知,则可用,)
②总体成数检验:()
⑵小样本假设检验
①总体均值检验:(未知;);(已知)
②总体方差检验:()
3. 二总体假设检验
⑴大样本假设检验
①总体均值差检验:(若未知,可用方差代替)
②总体成数差检验:;(、总体、的样本成数;)
若、未知,则存在两种情况:
当,
当,;()
⑵小样本假设检验
①总体均值差检验、
已知,
未知,,;
②总体方差比检验:
单边:或
双边:
⑶配对样本比较
;
六、假设检定:两个变量的相关
1. 定类变项
⑴交互分类表检验
①表:
②表:
相对频次不变,样本容量增加K倍,值将增加倍
2. 定序变项
⑴统计检验
①当时,
②当时,
⑵系数检验:()
⑶检验:
;;
:变项边缘次数中两两相乘的乘积之和;:变项边缘次数中两两相乘的乘积之和;:变项边缘次数中三三相乘的乘积之和;:变项边缘次数中三三相乘的乘积之和。
3. 定距变项
⑴原假设检验
①总偏差平方和:
②剩余平方和:
③回归平方和:
④统计量:
⑵相关系数检验:
;;
4. 定类-定距变项
⑴方差分析的检验:;;;
- 8 -
展开阅读全文