1、站名: 年级专业: 姓名: 学号: 凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。 …………………………密………………………………封………………………………线………………………… 新疆医科大学 《基于SPSS的调查问卷数据分析》2023-2024学年第一学期期末试卷 题号 一 二 三 四 总分 得分 一、单选题(本大题共15个小题,每小题1分,共15分.在每小题给出的四个选项中,只有一项是符合题
2、目要求的.) 1、某地区的房价数据呈现右偏态分布,若要对其进行描述性统计,以下哪个指标不太适合用来反映数据的集中趋势?( ) A. 均值 B. 中位数 C. 众数 D. 以上都适合 2、在进行相关分析时,如果两个变量之间的相关系数接近于 0 ,能否说明它们之间没有关系?( ) A. 能 B. 不能 C. 不一定 D. 以上都不对 3、某工厂生产的零件尺寸服从正态分布,现从生产线上随机抽取 100 个零件进行检测,发现有 10 个零件的尺寸不符合标准。若要估计该生产线生产的零件不合格率的 95%置信区间,应使用的方法是( ) A. 正态近似法 B. 精确计算法 C. 中
3、心极限定理 D. 以上都不对 4、在进行假设检验时,如果拒绝了原假设,但是实际上原假设是正确的,这种错误被称为( ) A. 第一类错误 B. 第二类错误 C. 抽样误差 D. 非抽样误差 5、在研究身高和体重的关系时,收集了一批数据并进行回归分析。如果回归方程的决定系数 R² 接近 1,这表明了什么?( ) A. 身高和体重几乎没有关系 B. 身高能很好地预测体重 C. 体重能很好地预测身高 D. 无法得出明确结论 6、已知某时间序列数据呈现明显的上升趋势,现采用移动平均法进行预测。若选择移动期数为 3,则预测值会( ) A. 滞后于实际值 B. 领先于实际值 C. 与
4、实际值完全一致 D. 无法确定 7、某地区的房价近年来持续上涨,为了研究房价与房屋面积、地理位置等因素的关系。收集了 500 套房屋的相关数据,若要建立房价的预测模型,以下哪种统计方法最为合适?( ) A. 线性回归 B. 逻辑回归 C. 聚类分析 D. 判别分析 8、在对一批产品进行质量检验时,规定不合格率不能超过 5%。随机抽取 100 个产品进行检验,发现有 8 个不合格。在显著性水平为 0.05 下,这批产品是否合格?( ) A. 合格 B. 不合格 C. 无法确定 D. 需要重新抽样 9、从一个均值为 50 ,标准差为 10 的正态总体中,随机抽取一个样本
5、量为 100 的样本。计算样本均值的抽样分布的标准差是?( ) A. 1 B. 10 C. 0.1 D. 5 10、在进行统计分析时,如果数据存在缺失值,以下哪种处理方法不太合适?( ) A. 直接删除含缺失值的观测 B. 用均值或中位数填充 C. 用随机值填充 D. 基于模型的插补 11、某地区的房价近年来持续上涨,为了解房价的变化趋势,统计了过去 10 年的房价数据。若要拟合一条合适的趋势线,以下哪种方法较为合适?( ) A. 线性回归 B. 指数平滑 C. 移动平均 D. 多项式回归 12、为研究广告投入与销售额之间的关系,收集了多个企业的相关数据。如
6、果两者之间存在非线性关系,以下哪种方法可能更适合进行分析?( ) A. 多项式回归 B. 逻辑回归 C. 逐步回归 D. 岭回归 13、在进行数据标准化处理时,常用的方法是将数据减去均值再除以标准差。标准化后的数据具有什么特点?( ) A. 均值为 0 ,方差为 1 B. 均值为 1 ,方差为 0 C. 均值和方差都不变 D. 均值和方差都为任意值 14、在一个正态分布中,如果将数据进行标准化变换,那么变换后的数据服从什么分布?( ) A. 正态分布 B. t 分布 C. 标准正态分布 D. 无法确定 15、对两个总体的均值进行比较时,如果两个总体的方差未知但相等
7、应该使用哪种检验方法?( ) A. Z 检验 B. t 检验 C. F 检验 D. 卡方检验 二、简答题(本大题共4个小题,共20分) 1、(本题5分)详细阐述如何运用统计方法进行缺失值的多重插补?包括插补方法的选择、实施步骤和效果评估。 2、(本题5分)详细论述在进行假设检验时如何控制多重比较的误差率,包括 Bonferroni 校正、Holm 校正和 FDR 控制等方法,分析各种方法的特点和适用情况。 3、(本题5分)阐述支持向量机(SVM)的基本原理和应用场景,以一个实际的二分类问题为例,说明如何使用SVM进行建模和分类。
8、 4、(本题5分)解释生存分析的基本概念和应用场景。以癌症患者的生存率研究为例,说明如何进行生存分析和解读结果。 三、计算题(本大题共5个小题,共25分) 1、(本题5分)某工厂为了解不同生产工艺对产品质量的影响,采用工艺 A 生产了 200 件产品,其中合格品 180 件;采用工艺 B 生产了 150 件产品,其中合格品 120 件。试在 90%的置信水平下检验两种生产工艺的产品合格率是否有显著差异。 2、(本题5分)某城市有 4000 家企业,员工人数的增长率服从正态分布,平均增长率为 5%,标准差为 2%。随机
9、抽取 400 家企业进行调查,求样本平均数的抽样分布,并计算抽样平均误差。若已知总体服从正态分布,求这 400 家企业的员工人数增长率在 4%到 6%之间的概率。 3、(本题5分)某地区为了解居民的健康状况与生活习惯之间的关系,随机抽取了 500 位居民进行调查。结果如下表所示:|生活习惯|健康人数|不健康人数| |----|----|----| |良好生活习惯|300|100| |一般生活习惯|150|150| |不良生活习惯|50|200| 求不同生活习惯居民的健康比例,并进行独立性检验,判断居民的健康状况与生活习惯是否有关(显著性水平为 0.05)。
10、 4、(本题5分)某超市销售三种品牌的洗发水,A 品牌在过去一个月内销售了 500 瓶,价格为 30 元/瓶;B 品牌销售了 400 瓶,价格为 25 元/瓶;C 品牌销售了 300 瓶,价格为 20 元/瓶。请计算这三种品牌洗发水的加权平均价格,并分析价格对销售的影响。 5、(本题5分)某公司的员工工资分布如下: 工资(元) 人数 3000 20 4000 30 5000 40 6000 10 计算员工工资的均值、中位数和众数,并绘制工资分布的直方图。 四、案例分析题(本大题共4个小题,共40分) 1、(本题10
11、分)某超市分析不同促销组合对各类商品销售的影响,收集了丰富的销售数据和促销方案信息。请基于此进行研究。 2、(本题10分)某制药公司为了控制药品质量,对生产过程中的工艺参数、原材料质量和检测结果进行了严格监控和分析。确保药品质量稳定。 3、(本题10分)某教育培训机构想了解不同课程的报名人数和学员学习效果与课程设置、师资力量等的相关性,已获取相关数据,如何进行分析和改进? 4、(本题10分)某运动品牌对不同地区的市场销售数据进行分析,包括消费者需求、竞争态势、营销活动效果等。请制定针对性的市场拓展计划。 第3页,共3页