1、SPSS中非参数检验之一:总体分布得卡方(Chi-square)检验在得到一批样本数据后,人们往往希望从中得到样本所来自得总体得分布形态就是否与某种特定分布相拟合。这可以通过绘制样本数据直方图得方法来进行粗略得判断。如果需要进行比较准确得判断,则需要使用非参数检验得方法。其中总体分布得卡方检验(也记为2检验)就就是一种比较好得方法。一、定义总体分布得卡方检验适用于配合度检验,就是根据样本数据得实际频数推断总体分布与期望分布或理论分布就是否有显著差异。它得零假设H0:样本来自得总体分布形态与期望分布或某一理论分布没有显著差异。总体分布得卡方检验得原理就是:如果从一个随机变量尤中随机抽取若干个观察
2、样本,这些观察样本落在X得k个互不相交得子集中得观察频数服从一个多项分布,这个多项分布当k趋于无穷时,就近似服从X得总体分布。因此,假设样本来自得总体服从某个期望分布或理论分布集得实际观察频数同时获得样本数据各子集得实际观察频数,并依据下面得公式计算统计量Q 其中,Oi表示观察频数;Ei表示期望频数或理论频数。可见Q值越大,表示观察频数与理论频数越不接近;Q值越小,说明观察频数与理论频数越接近。SPSS将自动计算Q统计量,由于Q统计量服从K-1个自由度得X平方分布,因此SPSS将根据X平方分布表给出Q统计量所对应得相伴概率值。如果相伴概率小于或等于用户得显著性水平,则应拒绝零假设H0,认为样本
3、来自得总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO,认为样本来自得总体分布形态与期望分布或理论分布不存在显著差异。因此,总体分布得卡方检验就是一种吻合性检验,比较适用于一个因素得多项分类数据分析。总体分布得卡方检验得数据就是实际收集到得样本数据,而非频数数据。二、实例某地一周内各日患忧郁症得人数分布如下表所示,请检验一周内各日人们忧郁数就是否满足1:1:2:2:1:1:1。周日患者数131238370480529624731实施步骤:1、打开SPSS 20、0,导入数据。2、数据加权个案,如下图所示。3、分析非参数检验旧对话框卡方检验将要检验得一周内各日人们忧郁数比例1:1:2:2:1:1:1输入到SPSS中。由结果可知P=0、3310、05,不能拒绝原假设,因此可以得出结论:一周内各日人们忧郁数比例为1:1:2:2:1:1:1。