1、装订线 资阳环境科技职业学院《统计学基础与SPSS应用》 2023-2024学年第一学期期末试卷 院(系)_______ 班级_______ 学号_______ 姓名_______ 题号 一 二 三 四 总分 得分 一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.) 1、某学校对学生的身高和体重进行了测量,想要了解身高和体重之间的关系是否为线性关系,可以通过绘制以下哪种图形来判断?( ) A. 散点图 B. 折线图 C.
2、直方图 D. 箱线图 2、对于一个时间序列数据,经过一阶差分后变得平稳。若要对其进行预测,以下哪种模型可能较为合适?( ) A. 移动平均模型 B. 自回归模型 C. 自回归移动平均模型 D. 指数平滑模型 3、已知变量 X 和 Y 的相关系数为 0.8 ,对 X 和 Y 分别进行标准化处理后,它们的相关系数是多少?( ) A. 0.8 B. 0 C. 1 D. 无法确定 4、已知两个变量 X 和 Y 的相关系数为 0.8。现对 X 和 Y 分别进行标准化处理,得到变量 Z 和 W ,则 Z 和 W 的相关系数为( ) A. 0 B. 0.8 C. 1 D
3、 无法确定 5、已知某数据的四分位数间距为 20,下四分位数为 30,那么上四分位数约为多少?( ) A. 40 B. 50 C. 60 D. 70 6、在研究某地区的经济发展与环境污染的关系时,发现随着经济的增长,环境污染先加重后减轻。这种关系被称为?( ) A. 正相关 B. 负相关 C. 非线性相关 D. 不相关 7、在一项市场调查中,研究人员想了解消费者对某新产品的接受程度。随机抽取了 200 名消费者,其中 120 人表示愿意尝试。以 90%的置信水平估计愿意尝试该产品的消费者比例,其置信区间为( ) A. (0.54, 0.66) B. (0.56, 0.
4、64) C. (0.58, 0.62) D. (0.60, 0.60) 8、某企业生产的产品重量服从正态分布,均值为 500 克,标准差为 20 克。现从生产线上随机抽取一个产品,其重量超过 540 克的概率约为( ) A. 0.0228 B. 0.0456 C. 0.0668 D. 0.0816 9、在比较多个总体的均值是否相等时,如果数据不满足方差分析的前提条件,应该采用哪种非参数检验方法?( ) A. Kruskal-Wallis 检验 B. Wilcoxon 秩和检验 C. Friedman 检验 D. Mood 中位数检验 10、某研究想要分析不同年龄段人群对某
5、种新产品的接受程度,以下哪种抽样方法能更好地保证样本的代表性?( ) A. 简单随机抽样 B. 分层抽样 C. 整群抽样 D. 系统抽样 11、在对一批产品进行质量检验时,采用抽样的方法。如果希望在给定的置信水平下,使抽样误差尽量小,应该怎么做?( ) A. 增加样本容量 B. 减小样本容量 C. 改变抽样方法 D. 提高检验精度 12、在进行回归分析时,如果存在多重共线性问题,会对回归结果产生什么影响?( ) A. 系数估计不准确 B. 标准误差增大 C. t 值变小 D. 以上都有可能 13、已知某时间序列数据呈现出明显的季节性波动。为了消除季节因素的影响,以
6、便更好地分析数据的长期趋势,应该采用哪种方法?( ) A. 移动平均法 B. 指数平滑法 C. 季节指数法 D. 回归分析法 14、某工厂生产的零件尺寸服从正态分布,根据以往经验,其标准差为 0.1 厘米。现抽取 25 个零件进行测量,样本均值为 2.5 厘米。以 99%的置信水平估计零件的平均尺寸,置信区间为( ) A. (2.42, 2.58) B. (2.44, 2.56) C. (2.46, 2.54) D. (2.48, 2.52) 15、某地区的房价近年来持续上涨,2015 年的平均房价为每平方米 8000 元,2020 年上涨到每平方米 15000 元。假设房价的
7、年增长率服从几何平均数,那么这五年的年平均增长率约为多少?( ) A. 15% B. 18% C. 20% D. 25% 二、简答题(本大题共3个小题,共15分) 1、(本题5分)阐述支持向量机(SVM)的基本原理和应用场景,以一个实际的二分类问题为例,说明如何使用SVM进行建模和分类。 2、(本题5分)对于含有缺失值的数据,有哪些常见的处理方法?每种方法的优缺点是什么? 3、(本题5分)在进行一项医学研究时,需要分析多个治疗组之间的疗效差异。论述如何使用多重比较方法(如 Tukey 法、Bonferroni 法),并说明其适用条件
8、和注意事项。 三、计算题(本大题共5个小题,共25分) 1、(本题5分)某城市对 1000 户家庭的月收入进行调查,数据如下:月收入在 5000 元以下的有 200 户,5000 - 8000 元的有 300 户,8000 - 12000 元的有 350 户,12000 元以上的有 150 户。请计算这 1000 户家庭月收入的均值、中位数和众数,并分析数据的分布特征。 2、(本题5分)某班级学生的语文、数学、英语成绩如下: 语文 数学 英语 80 90 70 75 85 80 90 70 90 …… 计算三门成绩的相关矩阵,并
9、分析两两之间的相关性。 3、(本题5分)某地区的农作物种植面积服从正态分布,平均种植面积为 200 亩,标准差为 40 亩。从该地区随机抽取 100 亩进行调查,求样本平均数的抽样分布,并计算抽样平均误差。若规定农作物种植面积在 190 亩到 210 亩之间为合格,求样本中合格亩数的比例的抽样分布及概率。 4、(本题5分)为研究某种农作物的生长情况,随机抽取了 100 株进行测量,得到其株高(单位:厘米)数据如下:120、130、115、125、135……已知该农作物的理想株高为 125 厘米,计算样本的平均株高、样本标准差,并检验该农作物的
10、株高是否达到理想水平。 5、(本题5分)对两种不同品牌的手机电池续航能力进行比较。随机抽取品牌 A 的手机 36 部,平均续航时间为 20 小时,标准差为 3 小时;随机抽取品牌 B 的手机 49 部,平均续航时间为 18 小时,标准差为 2.5 小时。求两种品牌手机平均续航时间之差的 95%置信区间。 四、案例分析题(本大题共3个小题,共30分) 1、(本题10分)某手机应用开发商统计了用户的使用频率、应用功能偏好、用户年龄、性别等数据。请分析用户特征与应用功能偏好之间的关系,以优化应用功能。 2、(本题10分)某社交平台对用户的兴趣标签和内容消费数据进行分析,包括兴趣分类、阅读时长、点赞评论等。请精准推送内容,提高用户活跃度。 3、(本题10分)某在线音乐平台收集了不同音乐风格的播放量、下载量和用户偏好变化,以优化音乐推荐和版权采购。请展开分析。 第5页,共5页






