资源描述
学校________________班级____________姓名____________考场____________准考证号
…………………………密…………封…………线…………内…………不…………要…………答…………题…………………………
大连软件职业学院《心理统计》2024-2025学年第一学期期末试卷
题号
一
二
三
四
总分
得分
批阅人
一、单选题(本大题共30个小题,每小题1分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、在一项关于农作物产量的研究中,同时考虑了施肥量、灌溉量和种植密度等因素。若要确定这些因素的最优组合,应采用哪种实验设计方法?( )
A. 正交试验设计
B. 均匀试验设计
C. 响应面设计
D. 以上都可以
2、在进行多元线性回归分析时,如果某个自变量的 t 检验不显著,但整个回归方程显著,应该( )
A. 保留该自变量 B. 剔除该自变量 C. 重新收集数据 D. 无法确定
3、已知某地区的人口增长率在过去 5 年分别为 2%、3%、1%、4%、2%,采用几何平均法计算这 5 年的平均人口增长率约为( )
A. 2.4% B. 2.5% C. 2.6% D. 2.7%
4、在进行假设检验时,如果拒绝了原假设,但是实际上原假设是正确的,这种错误被称为( )
A. 第一类错误 B. 第二类错误 C. 抽样误差 D. 非抽样误差
5、在对多个变量进行降维处理时,常用的方法有主成分分析和因子分析。它们的主要区别是什么?( )
A. 提取信息的方式不同 B. 应用场景不同 C. 计算方法不同 D. 以上都是
6、已知某变量的取值范围为 0 到 100 ,将其分为 5 个组,组距为 20 。第一组的下限为 0 ,上限为 20 。则第二组的下限和上限分别为( )
A. 20 , 40 B. 21 , 40 C. 20 , 41 D. 21 , 41
7、为了解某超市不同商品的销售情况,对一周内的销售数据进行分析。哪种统计图表最能直观地展示各类商品的销售额占比?( )
A. 柱状图 B. 折线图 C. 饼图 D. 箱线图
8、在一项关于大学生就业意向的调查中,收集了专业、性别、期望薪资等数据。若要分析不同专业学生的期望薪资是否有差异,同时控制性别因素的影响,应采用哪种统计方法?( )
A. 协方差分析
B. 分层分析
C. 偏相关分析
D. 以上都不对
9、为研究气温与空调销量的关系,收集了多年的数据。如果气温与空调销量之间存在非线性关系,应该如何处理?( )
A. 对气温进行变换 B. 对销量进行变换 C. 使用非线性模型 D. 以上都可以
10、某工厂生产的零件尺寸服从正态分布,均值为 10mm,标准差为 0.1mm。质量控制部门规定,零件尺寸在 9.9mm 至 10.1mm 之间为合格。一批产品中,合格产品的比例大约是多少?( )
A. 68.27% B. 95.45% C. 99.73% D. 几乎为 100%
11、在一项关于居民收入与消费关系的调查中,随机抽取了 500 个家庭的数据。已知家庭收入的均值为 8000 元,标准差为 1500 元。若收入服从正态分布,那么大约有多少家庭的收入在 5000 元到 11000 元之间?( )
A. 95% B. 68% C. 99.7% D. 81.8%
12、对于一个存在多重共线性的回归模型,使用岭回归方法进行修正,其原理是?( )
A. 增加变量
B. 减少变量
C. 对系数进行约束
D. 对数据进行标准化
13、已知变量 X 和 Y 的回归方程为 Y = 2X + 1,X 的均值为 3,标准差为 2。那么 Y 的均值和标准差分别为( )
A. 7,4 B. 7,2 C. 5,4 D. 5,2
14、某工厂生产的零件尺寸服从正态分布,现从生产线上随机抽取 100 个零件进行检测,发现有 10 个零件的尺寸不符合标准。若要估计该生产线生产的零件不合格率的 95%置信区间,应使用的方法是( )
A. 正态近似法 B. 精确计算法 C. 中心极限定理 D. 以上都不对
15、对于一个包含多个分类变量的数据集,想要了解不同分类变量之间的相关性,应该使用哪种统计方法?( )
A. 卡方检验 B. 相关系数 C. 方差分析 D. 以上都不是
16、某工厂生产的一批灯泡,其使用寿命服从正态分布。随机抽取 100 只灯泡进行测试,平均使用寿命为 1500 小时,标准差为 100 小时。若要检验这批灯泡的平均使用寿命是否为 1600 小时,应采用哪种假设检验方法?( )
A. Z 检验
B. t 检验
C. 卡方检验
D. F 检验
17、在对某公司员工工资进行调查时,得到如下数据:高管平均工资为 50000 元,普通员工平均工资为 8000 元。如果要比较高管和普通员工工资的差异程度,应使用的统计量是( )
A. 极差 B. 方差 C. 标准差系数 D. 平均差
18、在研究消费者对不同品牌手机的偏好时,收集了消费者的评价数据。为了比较不同品牌之间的差异,应该采用哪种统计方法?( )
A. 方差分析 B. 卡方检验 C. 多重比较 D. 以上都可以
19、对于两个相互独立的随机变量 X 和 Y ,已知 X 的方差为 4 ,Y 的方差为 9 ,那么它们的和 X + Y 的方差是多少?( )
A. 5
B. 13
C. 7
D. 25
20、对一组数据进行排序后,处于中间位置的数值被称为中位数。如果数据个数为偶数,中位数应如何计算?( )
A. 中间两个数的平均值 B. 中间两个数中的较大值 C. 中间两个数中的较小值 D. 无法确定
21、在对两组数据进行比较时,第一组数据的方差为 25,第二组数据的方差为 16。哪一组数据的离散程度更大?( )
A. 第一组 B. 第二组 C. 两组相同 D. 无法确定
22、已知两个变量 X 和 Y 之间存在线性关系,通过样本数据计算得到回归方程为 Y = 2X + 3 。若 X 的取值范围为[1, 5],当 X = 3 时,Y 的预测值的 95%置信区间是多少?( )
A. [7, 11]
B. [8, 10]
C. [9, 11]
D. [6, 10]
23、某超市为了解顾客的购买行为,对一周内的销售数据进行分析。已知某种商品的销售额每天都在变化,这种变化属于( )
A. 长期趋势 B. 季节变动 C. 循环变动 D. 不规则变动
24、对某批产品进行质量检验,随机抽取 200 个产品,其中不合格产品有 20 个。以 95%的置信水平估计这批产品的不合格率,其置信区间为( )
A. (0.06, 0.14) B. (0.07, 0.13) C. (0.08, 0.12) D. (0.05, 0.15)
25、某超市对不同品牌的饮料销售量进行统计,得到如下数据:品牌 A 销售量为 100 箱,品牌 B 销售量为 120 箱,品牌 C 销售量为 80 箱,品牌 D 销售量为 150 箱。计算销售量的四分位数间距约为( )
A. 50 箱 B. 60 箱 C. 70 箱 D. 80 箱
26、在对某城市居民收入水平的调查中,收集了不同职业、不同年龄和不同教育程度居民的收入数据。若要分析居民收入与这些因素之间的关系,最合适的统计方法是?( )
A. 多元线性回归
B. 逻辑回归
C. 聚类分析
D. 因子分析
27、对于一个含有分类变量和连续变量的数据集,要分析分类变量对连续变量的影响,以下哪种方法较为合适?( )
A. 方差分析
B. 协方差分析
C. 判别分析
D. 逻辑回归
28、在一个正态分布中,已知均值为 50,标准差为 10。随机抽取一个样本,其值在 40 到 60 之间的概率大约是多少?( )
A. 0.6826 B. 0.9544 C. 0.9974 D. 无法计算
29、某工厂生产的零件长度服从正态分布,均值为 5cm,标准差为 0.1cm。现从生产的零件中随机抽取 100 个进行测量,其平均长度为 4.98cm。假设显著性水平为 0.05,能否认为该批零件的长度不符合标准?( )
A. 能 B. 不能 C. 无法确定 D. 以上都不对
30、在研究某疾病的危险因素时,收集了患者的生活习惯、遗传因素、环境因素等数据。若要筛选出主要的危险因素,应采用哪种统计方法?( )
A. 逐步回归
B. 岭回归
C. 逻辑回归
D. 以上都不对
二、计算题(本大题共5个小题,共25分)
1、(本题5分)某工厂生产的零件尺寸服从正态分布,均值为 20mm,标准差为 1mm。现从生产线上随机抽取 100 个零件,测量其尺寸,发现有 15 个零件的尺寸大于 21mm。请在 95%的置信水平下,检验该生产线是否正常。
2、(本题5分)某超市记录了一周内每天的销售额(单位:元):10000、12000、8000、15000、9000、11000、13000。计算这一周销售额的平均数、中位数和极差,并分析销售额的波动情况。
3、(本题5分)某学校对学生的体育成绩进行统计,随机抽取了 250 名学生。样本学生的平均体育成绩为 70 分,标准差为 12 分。假设体育成绩服从正态分布,求该学校学生平均体育成绩的 99%置信区间。
4、(本题5分)某地区为了解居民对某种政策的支持率,随机抽取了 800 位居民进行调查。其中有 480 位居民表示支持该政策。求该地区居民对该政策的支持率的 95%置信区间。
5、(本题5分)某超市为了解不同时间段的客流量情况,记录了一周内每天不同时间段的顾客人数如下表所示:|日期|时间段 1|时间段 2|时间段 3| |----|----|----|----| |周一|50|80|100| |周二|60|90|110| |周三|70|100|120| |周四|80|110|130| |周五|90|120|140| |周六|100|130|150| |周日|110|140|160| 求不同时间段的平均客流量,并进行方差分析,判断不同时间段的客流量是否有显著差异(显著性水平为 0.05)。
三、简答题(本大题共5个小题,共25分)
1、(本题5分)什么是统计指数?它有哪些种类?举例说明其在经济领域中的应用。
2、(本题5分)详细论述在多元回归分析中如何检验回归模型的整体显著性和单个变量的显著性,说明检验的统计量和判断标准。
3、(本题5分)对于一组包含异常值的数据,在进行数据分析时应如何处理?请详细说明可以采用的方法,以及每种方法的适用情况和可能带来的影响。
4、(本题5分)解释什么是假设检验,说明假设检验的基本步骤,并阐述如何确定原假设和备择假设,举例说明在实际问题中的应用。
5、(本题5分)详细说明在进行多元统计分析时,如何进行变量筛选,包括逐步回归、向前选择、向后剔除等方法,并说明它们的优缺点。
四、案例分析题(本大题共2个小题,共20分)
1、(本题10分)某城市的文化活动组织方收集了活动参与人数、年龄分布、满意度等数据。请分析如何利用这些数据策划更受欢迎的文化活动。
2、(本题10分)某食品生产企业记录了不同生产线的产品质量检测数据,包括缺陷类型、生产批次、原材料来源等。请分析导致产品缺陷的主要原因,并提出改进生产质量的措施。
第7页,共7页
展开阅读全文