1、上海财经大学统计与管理学院方差分析-不平衡设计问题和数据描述研究澳洲儿童入学出勤情况影响因素。土著与白人儿童是否有差异?以所在学期逃学的天数研究出勤率。方法介绍不平衡数据析因设计,一类、三类偏差平方和参考资料汪仁官,陈荣昭(译),蒙哥马利(著),1998,实验设计与分析,中国统计出版社。SAS分析glm过程版权所有:吴纯杰版权所有:吴纯杰广义线性模型(不平衡数据的方差分析)数据描述数据描述澳洲儿童土著与白人之间的上学出勤率比较研究。数据集:ozkids变量:cell-单元号,不同水平组合origin A土著,N白人sex M男,F女grade F0小学最后一年级,F1-F3中学一年级至三年级t
2、ype Sl差生,Al一般生days absent 学年旷课天数问题提出出勤率是否与不同人群、年级等因素有关?上海财经大学统管院统计模型上海财经大学统管院数据描述上海财经大学统管院共154条观测,各水平分组数不等数据录入和整理data ozkids;/*Chapter 6*/infile d:ozkids.dat dlm=,expandtabs missover;input cell origin$sex$grade$type$days;do until(days=.);output;input days;end;input;run;上海财经大学统管院注注:expandtabs将tab制表符转
3、换为空格处理,missover当前数据行不够分配余下变量时,则未分配的变量定义为缺失值处理;dlm=,间隔符号接受空格或逗号。若去掉missover选项,结果如何?为什么?注注:理解do until直到型循环.当条件成立时,退出。注注:通过第二个input days语句录入当前行余下的数据。注注:最后的input释放当前行,转入到下一行接收新数据。若去除该语句,运行结果是否有变化?为什么?一类和三类偏差平方和上海财经大学统管院一类和三类偏差平方和上海财经大学统管院注注:二类平方和为添加所有效应后的模型平方和与剔除该因子的模型平方和的差异。这里的三类等价于二类主效应的方差分析模型proc glm
4、 data=ozkids;class origin sex grade type;model days=origin sex grade type/ss1 ss3;run;proc glm data=ozkids;class origin sex grade type;model days=grade sex type origin /ss1;run;proc glm data=ozkids;class origin sex grade type;model days=type sex origin grade/ss1;run;proc glm data=ozkids;class origin
5、 sex grade type;model days=sex origin type grade/ss1;run;注:一类平方和与建模的因子顺序顺序有关,三类平方和则不受影响。注:结果显示origin和grade因子对旷课天数有显著差异影响。注:最后因子type的一类和三类平方和结果相等。上海财经大学统管院含交互效应的方差分析模型proc glm data=ozkids;class origin sex grade type;model days=origin sex grade type origin|sex|grade|type/ss1 ss3;run;注:model语句为先做主效应,再分别进行交互效应分析。注:结果显示SS1方法多个因子主效应和交互效应显著,但SS3方法结果无主效应显著,有少数交互效应显著,两者结果并不一致。注:需要进一步分析,参见第九章广义线性模型的深入研究,使用旷课天数服从Poisson分布和联系函数为logistic函数的广义线性模型。进一步研究可以发现四个因子都有显著影响。上海财经大学统管院作业5习题6.1-6.4上海财经大学统管院