1、Statistics and Application 统计学与应用统计学与应用,2023,12(4),946-960 Published Online August 2023 in Hans.https:/www.hanspub.org/journal/sa https:/doi.org/10.12677/sa.2023.124098 文章引用文章引用:刘萍汝,谢强,王晗笑.大学生学习情况调查统计分析J.统计学与应用,2023,12(4):946-960.DOI:10.12677/sa.2023.124098 大学生学习情况调查统计分析大学生学习情况调查统计分析 以平顶山学院为例以平顶山学院为
2、例 刘萍汝刘萍汝,谢谢 强强*,王晗笑王晗笑 平顶山学院数学与统计学院,河南 平顶山 收稿日期:2023年7月11日;录用日期:2023年8月1日;发布日期:2023年8月15日 摘摘 要要 本文通过设计调查问卷,统计学校同学对所研究因素的评分,整理问卷数据,建立以研究因素为自变量,本文通过设计调查问卷,统计学校同学对所研究因素的评分,整理问卷数据,建立以研究因素为自变量,学生平均绩点为因变量的多元线性回归模型,在建立该回归模型的过程中,发现原始变量间存在共线性,学生平均绩点为因变量的多元线性回归模型,在建立该回归模型的过程中,发现原始变量间存在共线性,因此采用主成分分析法对研究因素降维,提取
3、主成分,将学生成绩与提取的四个主成分做主成分回归分因此采用主成分分析法对研究因素降维,提取主成分,将学生成绩与提取的四个主成分做主成分回归分析。再将四个主成分与研究因素做线性回归,代入整理得到学生成绩与研究因素的最终回归方程。通过析。再将四个主成分与研究因素做线性回归,代入整理得到学生成绩与研究因素的最终回归方程。通过比较回归方程系数绝对值大小,可以知道在学习成绩和原始比较回归方程系数绝对值大小,可以知道在学习成绩和原始24个因素的回归表达式中,课内认真程度,个因素的回归表达式中,课内认真程度,课外学习时间,知识基础,阅读浏览量,社会实践经历,考前准课外学习时间,知识基础,阅读浏览量,社会实践
4、经历,考前准备在所有因素中系数绝对值较大,即学备在所有因素中系数绝对值较大,即学习行为因子对我校学生学习程度的影响较大习行为因子对我校学生学习程度的影响较大。关键词关键词 多元线性回归多元线性回归,主成分分析主成分分析,主成分回归主成分回归 Statistical Analysis of the Survey of College Students Study Situation Taking Pingdingshan University as an Example Pingru Liu,Qiang Xie*,Hanxiao Wang School of Mathematics and St
5、atistics,Pingdingshan University,Pingdingshan Henan Received:Jul.11th,2023;accepted:Aug.1st,2023;published:Aug.15th,2023 Abstract This paper designed a questionnaire,collected scores of students on the factors studied,sorted *通讯作者。刘萍汝 等 DOI:10.12677/sa.2023.124098 947 统计学与应用 out the questionnaire da
6、ta,and established a multiple linear regression model with the research factors as independent variables and students average score-point as dependent variables.In the process of establishing the regression model,it was found that there was collinearity among the original variables.Therefore,princip
7、al component analysis method was adopted to reduce the dimension of the research factors,extract the principal components,and perform principal com-ponent regression analysis between student achievement and the four principal components ex-tracted.Then,the four principal components and research fact
8、ors are used for linear regression,and the final regression equation of student achievement and research factors is obtained.By comparing the absolute value of the coefficient of the regression equation,it can be seen that in the regression expression of the academic performance and the original 24
9、factors,the absolute value of the coefficient of all factors is larger,namely,the learning behavior factor has a greater influence on the learning level of students in our school.Keywords Multiple Linear Regression,Principal Component Analysis,Principal Component Regression Copyright 2023 by author(
10、s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 世界上具有代表性的大学生调查研究项目有很多,例如英国的“全国大学生调查”,澳大利亚的“课程体验调查”与“大学就学经验调查”,及美国的“全国大学生学习性投入调查1”。近年以来,社会越来越期待能够培养出更多高等教育人才,因此国内学术界也开始关注大学生的学习和发展,并
11、且已取得瞩目成果:清华大学“中国大学生学习与发展追踪研究”,北京师范大学“中国大学生就读经验调查”,北京大学“首都高校质量检测项目”,除此外湖南大学、西安交通大学等参加了美国伯克利大学主持的“国际研究型大学学生就读经验调查”。诸多高校也曾使用调查问卷对本校生进行调查,例如中山大学2。总的来说,国内大学生学习情况调查项目既有改进学校教育质量的作用,又有充实和推进高等教育学科研究领域的功能,非常符合中国教育界发展和研究需要,应当坚持并且不断完善3。2.学生学习状况调查学生学习状况调查 2.1.设计调查问卷设计调查问卷 本次数据来源于自己制作的调查问卷,并用调查问卷收集得到的抽样数据估计学院学生的总
12、体状况,即对平顶山学院学生做抽样调查,并且为简单随机抽样调查。问卷共回收了 431 份,将原始问卷中 A,B,C,D,E 选项替换成5,3,0,3,5 等数字来表示所研究因素的状态和水平,导出后删除不合理数据并对剩余问卷数据进行统计。最后得到实际有效数据414 份。将这 414 份问卷录入 SPSS 软件中,以便对数据进行处理。本次问卷共设了 25 道题,包括可能会影响学生学习成绩的 24 个因素:对任课老师的印象(X1),课内认真程度(X2),好胜心(X3),校园学习环境(X4),对科目没有兴趣(X5),经济水平(X6),自信心(X7),没有学习方法(X8),人际关系(X9),愉快的情绪(X
13、10),课外学习时间(X11),自制力(X12),求知欲(X13),知识Open AccessOpen Access刘萍汝 等 DOI:10.12677/sa.2023.124098 948 统计学与应用 基础(X14),没有好的学习习惯(X15),家庭氛围(X16),阅读浏览量(X17),社会实践经历(X18),幸福感(X19),知识衔接差(X20),兴趣爱好(X21),家庭学习环境(X22),学习目标不明确(X23),考前准备(X24),和他们上学期的平均绩点,因为若要研究学生的学习情况,学习成绩即平均绩点是最直观简洁的参考方式。2.2.数据的信度检验数据的信度检验 Cronbach-信度
14、系数是最普遍被使用的关于问卷信度的估计方法,通常根据 Cronbach-系数判定调查问卷的信息是否可靠,通常其判定标准在 01 之间,系数越大,问卷信息越可靠。将 Cronbach-信度系数范围列表为表 1:Table 1.Cronbach-Coefficients table 表表 1.Cronbach-系数表 Cronbach-系数 结论 0.9 信度极高 0.8 信度非常好 0.7 可以接受 0.6 应该进行修订,但仍有价值 0.6 需要重新设置题项 对数据进行信度检验结果:Table 2.Case processing summary 表表 2.案例处理汇总 N%案例 有效 414 1
15、00.0 已排除 a 0.0 总计 414 100.0 Table 3.Reliability statistics 表表 3.可靠性统计量 Cronbachs Alpha 项数 0.902 24 由案例处理汇总表(表 2)可知,收集到的 414 个回答均有效,并且由可靠性统计量表(表 3)可以看出Cronbach-系数的值为 0.902,则证明所收集到的数据信度很好,真实、可靠、有效,可以用于本篇文章的统计分析基础数据。2.3.多重共线性检验多重共线性检验 VIF 值是检验回归方程多重共线性的常规方法,通常认为 VIF 值以 10 为界限(严格定义为 5),在此刘萍汝 等 DOI:10.12
16、677/sa.2023.124098 949 统计学与应用 基础上 VIF 值小于 10,且其越趋近 1,多重共线性的程度接近无;若 VIF 的值大于 10,则认为其不适合做回归分析。Table 4.Coefficient 表表 4.系数 模型 非标准化系数 标准系数 t Sig.共线性统计量 B 标准误差 试用版 容差 VIF 1(常量)0.221 0.000 .X1 0.051 0.000 0.159.0.040 24.959 X2 0.003 0.000 0.008.0.066 15.234 X3 0.055 0.000 0.166.0.023 43.147 X4 0.005 0.000
17、 0.017.0.324 3.084 X5 0.005 0.000 0.016.0.306 3.265 X6 0.003 0.000 0.011.0.234 4.268 X7 2.187E16 0.000 0.000.0.591 1.692 X8 0.004 0.000 0.013.0.249 4.010 X9 0.000 0.000 0.003.0.249 4.022 X10 0.055 0.000 0.167.0.024 41.750 X11 0.003 0.000 0.010.0.063 15.749 X12 0.050 0.000 0.154.0.226 4.423 X13 0.053
18、 0.000 0.160.0.143 7.003 X14 0.007 0.000 0.020.0.247 4.046 X15 0.010 0.000 0.031.0.298 3.358 X16 0.001 0.000 0.004.0.254 3.943 X17 0.004 0.000 0.012.0.248 4.026 X18 0.006 0.000 0.018.0.266 3.758 X19 0.051 0.000 0.157.0.046 21.939 X20 0.009 0.000 0.026.0.187 5.341 X21 0.051 0.000 0.157.0.218 4.582 X2
19、2 0.003 0.000 0.008.0.200 4.995 X23 0.008 0.000 0.023.0.236 4.239 X24 0.004 0.000 0.013.0.248 4.033 刘萍汝 等 DOI:10.12677/sa.2023.124098 950 统计学与应用 由系数表(表 4)可知,X1,X2,X3,X10,X11,X19的 VIF 系数均远远大于 10,表明这些变量有非常明显的共线性,为使得模型预测更为精确,使用主成分分析法,消除原始变量中的多重共线性,在诸多变量中提取主成分。进而采用主成分回归法协助建立学生成绩和 24 个研究变量的回归方程4。3.数据的主成分
20、分析数据的主成分分析 3.1.KMO 检验和巴特利球体检验检验和巴特利球体检验 做主成分分析前要先做 KMO 检验,KMO 检验可以检验变量间的相关性和偏相关性。KMO 的检验系数取值范围应在 0 到 1,KMO 值越接近 1,说明变量间的相关性越强,反之越弱。Table 5.KMO and Bartlett coefficients 表表 5.KMO 和 Bartlett 系数 检测类别 值的范围 主成分分析适合情况 KMO 值 大于 0.9 非常适合 0.80.9 很适合 0.70.8 适合 0.60.7 勉强适合 0.50.6 不太适合 小于 0.5 不适合 BartlettP 值 小于
21、或者等于 0.01 适合 KMO 和 Bartlett 系数表(表 5)给出了 KMO 系数代表的意义,调查问卷数据 KMO 和 Bartlett 系数检验输出结果如下:Table 6.KMO test and Bartley sphere test 表表 6.KMO 检验和巴特利球体检验 取样足够度的 Kaiser-Meyer-Olkin 度量。0.843 Bartlett 的球形度检验 近似卡方 11774.734 df 276 Sig.0.000 由 KMO 检验和巴特利球体检验表(表 6)可知,问卷数据的 KMO 统计量为 0.843,超过 0.8,即原始变量 KMO 检验通过,原始数
22、据的 Bartlett 的球形度检验 Sig.值为 0 0.05,说明调查问卷数据适合做主成分分析。3.2.寻找公因子的个数寻找公因子的个数 公因子方差表(表 7)表示在被提取的公因子中,原数据被表达的比例,由图可知几乎所有原始变量原始数据提取比例都在 80%左右,所以提取出的 4 个主成分对于原始变量的阐释能力是较好的。刘萍汝 等 DOI:10.12677/sa.2023.124098 951 统计学与应用 Table 7.Common factor variance 表表 7.公因子方差 初始 提取 X1 1.000 0.833 X2 1.000 0.857 X3 1.000 0.895
23、X4 1.000 0.751 X5 1.000 0.770 X6 1.000 0.810 X7 1.000 0.431 X8 1.000 0.820 X9 1.000 0.788 X10 1.000 0.894 X11 1.000 0.866 X12 1.000 0.817 X13 1.000 0.802 X14 1.000 0.819 X15 1.000 0.795 X16 1.000 0.749 X17 1.000 0.777 X18 1.000 0.805 X19 1.000 0.814 X20 1.000 0.865 X21 1.000 0.812 X22 1.000 0.835 X2
24、3 1.000 0.821 X24 1.000 0.787 由解释的总方差表(表 8)可以看出主成分 F1特征值为 7.651,即 F1表达了 7.651 个原始因素的信息,主成分 F2和主成分 F3主成分 F4特征值分别为 4.628,3.787 和 3.147,而 80.053%的贡献率是由前四个主成分的累计贡献达到的,因此使用前四个组成分足以描述原始变量的大部分信息。刘萍汝 等 DOI:10.12677/sa.2023.124098 952 统计学与应用 Table 8.The total variance of the interpretation 表表 8.解释的总方差 成份 初始特
25、征值 提取平方和载入 旋转平方和载入 合计 方差的%累积%合计 方差的%累积%合计 方差的%累积%1 7.651 31.878 31.878 7.651 31.878 31.878 6.292 26.215 26.215 2 4.628 19.284 51.162 4.628 19.284 51.162 4.910 20.457 46.671 3 3.787 15.780 66.942 3.787 15.780 66.942 4.083 17.014 63.685 4 3.147 13.111 80.053 3.147 13.111 80.053 3.928 16.368 80.053 5 0
26、.645 2.688 82.741 6 0.547 2.280 85.021 7 0.416 1.731 86.752 8 0.408 1.698 88.451 9 0.328 1.365 89.815 10 0.285 1.188 91.003 11 0.268 1.115 92.118 12 0.259 1.080 93.198 13 0.249 1.040 94.238 14 0.218 0.908 95.146 15 0.211 0.881 96.027 16 0.183 0.761 96.787 17 0.172 0.717 97.504 18 0.155 0.645 98.149
27、19 0.140 0.581 98.730 20 0.122 0.510 99.240 21 0.090 0.376 99.615 22 0.046 0.192 99.808 23 0.037 0.154 99.961 24 0.009 0.039 100.000 由方差解释表(表 8)和碎石图(图 1)可以看出,本例保留了大于 1 的特征根,即提取的 4 个主成分,这样由分析原来的 24 个变量转化为仅需分析 4 个综合变量,极大地起到了降维的作用。刘萍汝 等 DOI:10.12677/sa.2023.124098 953 统计学与应用 Figure 1.Gravel diagram 图图
28、1.碎石图 3.3.主成分表达式及分析主成分表达式及分析 Table 9.Composition matrix 表表 9.成份矩阵 成份 1 2 3 4 X1 0.775 0.439 0.151 0.127 X2 0.528 0.617 0.386 0.221 X3 0.792 0.464 0.190 0.127 X4 0.356 0.381 0.466 0.512 X5 0.483 0.006 0.604 0.415 X6 0.354 0.358 0.479 0.572 X7 0.551 0.316 0.167 0.022 X8 0.474 0.048 0.613 0.467 X9 0.38
29、3 0.380 0.381 0.593 X10 0.791 0.461 0.199 0.129 X11 0.527 0.628 0.384 0.216 X12 0.760 0.466 0.138 0.066 X13 0.744 0.424 0.222 0.142 刘萍汝 等 DOI:10.12677/sa.2023.124098 954 统计学与应用 Continued X14 0.483 0.648 0.349 0.212 X15 0.426 0.037 0.604 0.498 X16 0.348 0.404 0.319 0.602 X17 0.495 0.625 0.341 0.161 X
30、18 0.457 0.636 0.385 0.209 X19 0.769 0.429 0.146 0.131 X20 0.463 0.014 0.628 0.506 X21 0.760 0.434 0.196 0.088 X22 0.384 0.415 0.405 0.593 X23 0.454 0.001 0.592 0.514 X24 0.475 0.627 0.378 0.161 成分矩阵表(表 9)达出了标准化后 24 个因素与 4 个主成分之间的线性关系系数,为了得到含义更加明确,实际意义也更为明显的主成分,将原来的主成分进行旋转,即将因子分析中的因子旋转后得到一组新的因子载荷矩阵。
31、Table 10.Rotate the component matrix 表表 10.旋转成份矩阵 成份 1 2 3 4 X1 0.901 0.058 0.104 0.077 X2 0.116 0.914 0.061 0.063 X3 0.939 0.066 0.082 0.054 X4 0.020 0.072 0.149 0.850 X5 0.140 0.045 0.856 0.129 X6 0.038 0.032 0.121 0.890 X7 0.647 0.086 0.073 0.024 X8 0.153 0.012 0.889 0.072 X9 0.077 0.101 0.050 0.
32、877 X10 0.939 0.072 0.075 0.052 X11 0.109 0.919 0.058 0.071 X12 0.891 0.043 0.145 0.024 X13 0.890 0.085 0.034 0.051 刘萍汝 等 DOI:10.12677/sa.2023.124098 955 统计学与应用 Continued X14 0.055 0.897 0.064 0.085 X15 0.065 0.065 0.884 0.064 X16 0.054 0.129 0.012 0.854 X17 0.084 0.868 0.043 0.120 X18 0.052 0.893 0
33、.027 0.058 X19 0.890 0.059 0.103 0.084 X20 0.099 0.056 0.920 0.072 X21 0.892 0.087 0.090 0.025 X22 0.051 0.115 0.066 0.903 X23 0.108 0.060 0.897 0.041 X24 0.077 0.879 0.010 0.098 由旋转成分矩阵表(表 10)可以得到方差最大化正交旋转后原始变量与提取的 4 个主成分之间的因子载荷,即原始变量与提取的 4 个主成分之间的线性方程系数,由此可得原始变量与提取的主成分之间的回归表达式:11234212343123424123
34、4X0.901F0.058F0.104F0.077FX0.116F0.914F0.061F0.063FX0.939F0.066F0.082F0.054FX0.077F0.879F0.010F0.098F=+=+=+=+由成分矩阵表进一步计算,得出平均绩点和 24 个变量的得分系数矩阵表。Table 11.Component score coefficient matrix 表表 11.成份得分系数矩阵 成份 1 2 3 4 X1 0.148 0.016 0.015 0.003 X2 0.008 0.193 0.003 0.025 X3 0.156 0.014 0.022 0.004 X4 0.
35、016 0.022 0.005 0.223 X5 0.016 0.010 0.216 0.001 X6 0.011 0.033 0.004 0.236 X7 0.106 0.001 0.009 0.021 刘萍汝 等 DOI:10.12677/sa.2023.124098 956 统计学与应用 Continued X8 0.013 0.016 0.227 0.017 X9 0.003 0.017 0.025 0.232 X10 0.156 0.013 0.023 0.004 X11 0.010 0.194 0.004 0.023 X12 0.146 0.018 0.001 0.013 X13
36、0.149 0.008 0.033 0.002 X14 0.019 0.190 0.000 0.017 X15 0.030 0.002 0.229 0.020 X16 0.005 0.009 0.040 0.227 X17 0.013 0.181 0.008 0.006 X18 0.017 0.190 0.009 0.023 X19 0.146 0.016 0.015 0.005 X20 0.025 0.005 0.237 0.019 X21 0.147 0.007 0.017 0.012 X22 0.009 0.015 0.021 0.238 X23 0.022 0.003 0.231 0.
37、027 X24 0.012 0.185 0.016 0.011 由得分系数矩阵表(表 11)输出结果可以得到 4 个主成分与 24 个因素之间的回归方程系数,即回归方程可以表达为:11234567891011121314151617181920F0.148X0.008X0.156X0.016X0.016X0.011X0.106X0.013X0.003X0.156X0.010X0.146X0.149X0.019X0.030X0.005X0.013X0.017X0.146X0.025X0.147X=+212223240.009X0.022X0.012X 2123456789101112131415
38、1617181920F0.016X0.193X0.014X0.022X0.010X0.033X0.001X0.016X0.017X0.013X0.194X0.018X0.008X0.190X0.002X0.009X0.181X0.190X0.016X0.005X0.007=+21222324X0.015X0.003X0.185X+31234567891011121314151617181920F0.015X0.003X0.022X0.005X0.216X0.004X0.009X0.227X0.025X0.023X0.004X0.001X0.033X0.000X0.229X0.040X0.008
39、X0.009X0.015X0.237X0.017=+21222324X0.021X0.231X0.016X+41234567891011121314151617181920F0.003X0.025X0.004X0.223X0.001X0.236X0.021X0.017X0.232X0.004X0.023X0.013X0.002X0.017X0.020X0.227X0.006X0.023X0.005X0.019X0.012X=+212223240.238X0.027X0.011X+由四个主成分的表达式可看出:刘萍汝 等 DOI:10.12677/sa.2023.124098 957 统计学与应用
40、 第一个主成分 F1主要由1X、3X、7X、10X,12X,13X,19X,21X即对任课老师印象,好胜心,自信心,愉快的情绪,自制力,求知欲,幸福感,兴趣爱好决定,由于大多数情况都与学生心理方面相关,因此我们把它统称成为心理因子。第二个主成分 F2主要由4X、6X、9X,16X,22X即由校园学习环境,经济水平,人际关系,家庭氛围,家庭学习环境决定,我们把它统称为环境因子。第三个主成分 F3主要由5X、8X,15X,20X,23X即对科目的没有兴趣,没有好的学习习惯,知识衔接差,学习目标不明确决定,我们把它命名为缺陷因子。第四个主成分 F4主要由2X,11X,14X,17X,18X,24X即
41、对课内认真程度,课外学习时间,知识基础,阅读浏览量,社会实践经历,考前准备决定,我们把它统称为学习行为因子。Figure 2.Rotate the spatial matrix diagram 图图 2.旋转空间矩阵图 旋转空间矩阵图(图 2)代表提取四个主成分后,原始数据在四维空间上的分布。3.主成分回归分析主成分回归分析 3.1.学习成绩关于主成分的回归学习成绩关于主成分的回归 由系数表(表 12)可知,四个主成分的 VIF 检验值都为 1,小于 10,四个主成分之间不存在共线性,则通过主成分分析提取主成分之后,由 4 个主成分作为学生平均成绩的自变量是合适的。由模型汇总表(表 13)可以
42、看出:R2=0.830,调整后的 R2=0.828,可以知道,回归后自变量对因变量的解释率为 82.8%5。且根据方差分析表(表 14)可知:回归模型中 4 个主成分关于因变量即学生成绩的检验 P 值=0.00 0.05,拒绝方程不显著的假设,即 P 检验说明回归方程显著;每个自变量对因变量都有显著的影响6。根据系数表可以写出 y 关于 4 个主成分的回归方程,即:1234y3.3160.285F0.301F0.251F0.230F=+(3.1)刘萍汝 等 DOI:10.12677/sa.2023.124098 958 统计学与应用 Table 12.Coefficient 表表 12.系数
43、模型 非标准化系数 标准系数 t Sig.共线性统计量 B 标准误差 试用版 容差 VIF 1(常量)3.316 0.012 275.613 0.000 REGR factor score 1 for analysis 1 0.285 0.012 0.481 23.564 0.000 1.000 1.000 REGR factor score 2 for analysis 1 0.301 0.012 0.510 24.955 0.000 1.000 1.000 REGR factor score 3 for analysis 1 0.251 0.012 0.426 20.846 0.000 1
44、.000 1.000 REGR factor score 4 for analysis 1 0.230 0.012 0.391 19.120 0.000 1.000 1.000 Table 13.Model rollup 表表 13.模型汇总 模型 R R 方 调整 R 方 标准估计的误差 1 0.911a 0.830 0.828 0.2445 Table 14.Analysis of variance 表表 14.方差分析 模型 平方和 df 均方 F Sig.1 回归 118.804 4 29.701 496.836 0.000a 残差 24.390 408 0.060 总计 143.19
45、5 412 3.2.主成分关于原始因素的回归主成分关于原始因素的回归 在四个主成分和平均绩点做回归分析之后,再做 24 个原始变量和四个主成分的回归分析,可得 24个原始因素与主成分之间的回归表达式:112345678910111213141516171819202122F0.2210.051X0.003X0.055X0.005X0.005X0.003X0.000X0.004X0.001X0.055X0.003X0.050X0.053X0.007X0.010X0.001X0.004X0.006X0.051X0.009X0.051X0.003X0=+2324.008X0.004X (3.2)21
46、2345678910111213141516171819202122F0.2500.005X0.064X0.004X0.007X0.003X0.011X0.000X0.005X0.006X0.004X0.065X0.005X0.002X0.062X0.001X0.003X0.060X0.063X0.005X0.002X0.002X0.005X0=+2324.001X0.060X+(3.3)312345678910111213141516171819202122F0.2170.005X0.064X0.004X0.007X0.003X0.011X0.000X0.005X0.006X0.004X0.
47、065X0.005X0.002X0.062X0.001X0.003X0.060X0.063X0.005X0.002X0.002X0.005X0=+2324.001X0.060X+(3.4)412345678910111213141516171819202122F0.2400.000X0.008X0.002X0.071X0.001X0.076X0.000X0.006X0.075X0.002X0.008X0.005X0.002X0.006X0.007X0.074X0.002X0.008X0.001X0.006X0.005X0.076X0=+2324.009X0.004X (3.5)刘萍汝 等 DO
48、I:10.12677/sa.2023.124098 959 统计学与应用 将公式(3.2)、(3.3)、(3.4)、(3.5),代入公式(3.1)得到自变量 y(平均绩点)关于因变量 X(24 个因素)的回归表达式(3.6):12345678910111213141516171819202122y3.0680.012X0.033X0.013X0.011X0.004X0.011X0.000X0.005X0.014X0.013X0.033X0.010X0.013X0.031X0.005X0.015X0.032X0.031X0.012X0.005X0.012X0.014X0.0=+232405X0.
49、031X+(3.6)由公式(3.6)可知,每一个变量前都有它的回归系数,可以通过比较变量前系数的绝对值大小,分析每个变量对因变量的影响程度7,根据变量前的系数由大到小排序为:2111714182416922131031912146122023815y0.033X0.033X0.032X0.031X0.031X0.031X0.015X0.014X0.014X0.013X0.013X0.013X0.012X0.012X0.012X0.011X0.011X0.010X0.005X0.005X0.005X0.005X0.004X=+570.000X3.068+在回归方程中系数绝对值较大的为 X2,X1
50、1,X17,X14,X18,X24。即课内认真程度,课外学习时间,知识基础,阅读浏览量,社会实践经历,考前准备是需要重点研究的对象,就此对平顶山学院学生学习影响较大的因素找到,为学校提高教学水平改革提供一定基础。4.结论结论 通过制作的调查问卷收集整理数据,问卷包括影响学生学习的 24 个因素和他们上学期的平均绩点,然后对数据进行了初步整理,做了关于数据可靠性的信度分析,通过信度分析结果发现调查问卷的可靠性极高,则说明收集的数据对于要做的回归分析问题有基础的依据8。然后对调查问卷数据进行了 VIF检验,结果显示多个研究因素的 VIF 值远远高于临界值,则说明数据间存在多重共线性,而存在共线性会