1、自觉遵守考场纪律如考试作弊此答卷无效 密 封 线 武汉轻工大学《数据分析与可视化》2024-2025学年第一学期期末试卷 院(系)_______ 班级_______ 学号_______ 姓名_______ 题号 一 二 三 四 总分 得分 批阅人 一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.) 1、从一个总体中抽取样本,计算样本均值的抽样分布。随着样本容量的增大,样本均值的抽样分布会趋近于哪种
2、分布?( ) A. 正态分布 B. t 分布 C. F 分布 D. 卡方分布 2、为研究某种减肥产品的效果,选取了 20 名志愿者进行为期一个月的试验。试验前后分别测量了他们的体重,已知试验前平均体重为 75 公斤,标准差为 5 公斤,试验后平均体重为 70 公斤,标准差为 4 公斤。请问减肥效果是否显著?( ) A. 显著 B. 不显著 C. 无法确定 D. 以上都不对 3、对于一个包含分类变量和连续变量的数据集,想要分析分类变量对连续变量的影响,应该使用哪种方法?( ) A. 方差分析 B. 协方差分析 C. 逻辑回归 D. 以上都可以 4、在多元回归分析中,如果增
3、加一个自变量,而调整后的 R²变小,说明这个自变量对模型的贡献是?( ) A. 正向的 B. 负向的 C. 不显著的 D. 无法确定 5、某研究人员想了解某种药物在不同剂量下的疗效差异,同时考虑患者的年龄和性别因素。应采用哪种统计设计?( ) A. 完全随机设计 B. 随机区组设计 C. 析因设计 D. 拉丁方设计 6、已知一个总体服从均匀分布,区间为[0, 10]。随机抽取一个样本量为 50 的样本,计算样本均值的期望值是?( ) A. 2.5 B. 5 C. 7.5 D. 10 7、在分析股票价格的波动时,发现其收益率序列存在自相关现象。为消除自相关,可
4、采用以下哪种方法?( ) A. 差分法 B. 移动平均法 C. 指数平滑法 D. 以上都可以 8、在一项关于不同品牌手机用户满意度的调查中,共收集了 1000 份有效问卷。其中品牌 A 的用户有 300 人,平均满意度为 80 分;品牌 B 的用户有 500 人,平均满意度为 75 分;品牌 C 的用户有 200 人,平均满意度为 85 分。计算这三个品牌用户的总体平均满意度约为多少?( ) A. 78 分 B. 79 分 C. 80 分 D. 81 分 9、已知变量 X 和 Y 的回归方程为 Y = 2X + 1,X 的均值为 3,标准差为 2。那么 Y 的均值和标准差
5、分别为( ) A. 7,4 B. 7,2 C. 5,4 D. 5,2 10、在进行方差分析时,如果因素的不同水平之间差异显著,进一步进行多重比较时常用的方法是( ) A. LSD 法 B. S-N-K 法 C. Tukey 法 D. 以上都是 11、在一项调查中,要了解不同职业人群的平均收入水平。如果职业种类较多,应该如何分组?( ) A. 等距分组 B. 不等距分组 C. 单项式分组 D. 复合分组 12、某超市想了解不同促销活动对销售额的影响,同时考虑活动时间和天气因素。应采用哪种统计模型进行分析?( ) A. 多元线性回归 B. 广义线性模型 C. 混合效应
6、模型 D. 以上都不对 13、在比较多个总体的均值是否相等时,如果数据不满足方差分析的前提条件,应该采用哪种非参数检验方法?( ) A. Kruskal-Wallis 检验 B. Wilcoxon 秩和检验 C. Friedman 检验 D. Mood 中位数检验 14、为比较不同班级学生的考试成绩,计算了每个班级的平均分和标准差。如果一个班级的平均分较高,标准差较小,说明这个班级的成绩情况如何?( ) A. 整体水平高且差异小 B. 整体水平高但差异大 C. 整体水平低但差异小 D. 整体水平低且差异大 15、为了研究不同广告策略对产品销售额的影响,将市场分为三个区域
7、分别采用不同的广告策略,并记录销售额数据。这种实验设计属于?( ) A. 单因素方差分析 B. 多因素方差分析 C. 拉丁方设计 D. 正交设计 16、某班级学生的身高数据近似服从正态分布,要估计身高在 170cm 以上的学生所占比例,应使用哪种统计方法?( ) A. 标准正态分布表 B. t 分布表 C. F 分布表 D. 卡方分布表 17、为检验某种新的生产工艺是否能提高产品质量,抽取了采用新工艺和原工艺生产的产品进行对比。这属于( ) A. 单侧检验 B. 双侧检验 C. 配对检验 D. 以上都不是 18、为研究某种农作物的产量与施肥量、种植密度之间的关系
8、进行了田间试验。这是一个什么类型的实验设计?( ) A. 完全随机设计 B. 随机区组设计 C. 析因设计 D. 拉丁方设计 19、某市场调研公司对消费者的品牌忠诚度进行调查,结果用 1 - 10 分表示。若要分析不同性别消费者的品牌忠诚度是否有显著差异,应采用以下哪种参数检验方法?( ) A. 独立样本 t 检验 B. 配对样本 t 检验 C. 单因素方差分析 D. 双因素方差分析 20、某工厂为了监控生产过程中的质量,每隔一段时间抽取一定数量的产品进行检测。这种抽样方式属于以下哪种?( ) A. 简单随机抽样 B. 系统抽样 C. 分层抽样 D. 整群抽样
9、 二、简答题(本大题共3个小题,共15分) 1、(本题5分)论述在进行回归分析时,如果存在异方差问题,应该如何诊断和处理?解释常见的处理方法及其原理。 2、(本题5分)在进行心理学研究时,如何运用统计学方法来处理实验数据和调查问卷数据?请阐述具体的方法和步骤,并举例说明。 3、(本题5分)论述如何使用偏最小二乘回归来解决自变量之间存在多重共线性且样本量较小时的回归问题,解释其原理和优势,并举例应用。 三、案例分析题(本大题共5个小题,共25分) 1、(本题5分)某健身俱乐部记录了会员的锻炼频率、锻炼项目、身体
10、指标变化、会员续费情况等数据。请分析锻炼项目和频率对身体指标和会员续费的影响。 2、(本题5分)一家电子设备制造企业记录了不同生产线的产量、质量和工人工作时间。请分析如何通过这些数据提高生产效率和产品质量。 3、(本题5分)某化妆品电商平台记录了不同品牌化妆品的销售数据、用户评价和促销活动效果等,分析应如何利用统计方法优化平台运营和品牌合作策略。 4、(本题5分)某房地产公司记录了不同楼盘的销售价格、销售速度和客户特征,以制定营销策略和项目规划。请分析相关数据。 5、(本题5分)一家汽车制造
11、企业记录了不同车型的零部件故障频率和维修成本。请分析如何利用这些数据改进零部件质量和降低售后成本。 四、计算题(本大题共2个小题,共20分) 1、(本题10分)某学校为了解学生的课外阅读时间与学习成绩之间的关系,对 120 名学生进行调查。记录每个学生的每周课外阅读时间和期末考试成绩如下表所示:|学生编号|课外阅读时间(小时)|成绩| |----|----|----| |1|2|60| |2|3|65| |3|4|70| |4|5|75| |5|6|80| |...|...|...| |116|17|90| |117|18|92| |118|19|94| |119|
12、20|96| |120|21|98| 求课外阅读时间与学习成绩之间的相关系数,并建立线性回归方程,预测当课外阅读时间为 25 小时时的成绩。 2、(本题10分)某超市为了解不同时间段的客流量情况,统计了每天上午 8 点至 10 点、下午 2 点至 4 点、晚上 6 点至 8 点三个时间段的客流量。其中,上午的平均客流量为 200 人,标准差为 30 人;下午的平均客流量为 180 人,标准差为 25 人;晚上的平均客流量为 250 人,标准差为 40 人。在 95%的置信水平下,检验这三个时间段的平均客流量是否存在显著差异。 第5页,共5页






