资源描述
自觉遵守考场纪律如考试作弊此答卷无效
密
封
线
大连航运职业技术学院《统计分析方法与软件应用》
2023-2024学年第一学期期末试卷
院(系)_______ 班级_______ 学号_______ 姓名_______
题号
一
二
三
四
总分
得分
一、单选题(本大题共15个小题,每小题1分,共15分.在每小题给出的四个选项中,只有一项是符合题目要求的.)
1、在一个有 1000 个观测值的数据集里,变量 X 的取值范围是[0, 100]。将其分为 10 个等宽的区间,绘制频率直方图。如果第 3 个区间的频率为 0.2,那么该区间的频数大约是多少?( )
A. 20
B. 200
C. 100
D. 50
2、在一个时间序列数据中,既有长期趋势,又有季节变动和不规则变动。为了分离出季节变动,应采用哪种方法?( )
A. 移动平均法
B. 指数平滑法
C. 季节指数法
D. 线性趋势法
3、已知某变量的概率分布函数为 F(x) ,则其概率密度函数 f(x) 等于( )
A. F'(x) B. F(x) C. 1 - F(x) D. 无法确定
4、在对数据进行标准化处理时,标准化后的变量均值和标准差分别是多少?( )
A. 0 和 1
B. 1 和 0
C. 原变量的均值和标准差
D. 无法确定
5、在多元线性回归分析中,如果自变量之间存在较强的多重共线性,可能会导致( )
A. 回归系数估计不准确 B. 决定系数增大 C. 残差平方和减小 D. 模型的拟合优度提高
6、为比较不同班级学生的考试成绩,计算了每个班级的平均分和标准差。如果一个班级的平均分较高,标准差较小,说明这个班级的成绩情况如何?( )
A. 整体水平高且差异小 B. 整体水平高但差异大 C. 整体水平低但差异小 D. 整体水平低且差异大
7、在一项关于城市居民消费水平的调查中,随机抽取了 500 个家庭。已知家庭月平均收入的标准差为 8000 元,若要以 95%的置信水平估计家庭月平均收入的均值,允许误差为 500 元,那么所需的最小样本量约为多少?( )
A. 256 B. 384 C. 553 D. 683
8、某公司的销售数据存在明显的趋势和季节性。在建立预测模型时,同时考虑这两个因素的方法是?( )
A. 简单线性回归 B. 多元线性回归 C. 时间序列分解 D. 指数平滑
9、在一次对大学生消费习惯的调查中,随机抽取了 300 名学生。发现每月生活费在 1000 元以下的有 50 人,1000 - 2000 元的有 180 人,2000 元以上的有 70 人。如果要以 95%的置信水平估计全校学生每月生活费的均值,应该采用哪种抽样分布?( )
A. 正态分布 B. t 分布 C. 卡方分布 D. F 分布
10、在多元回归分析中,如果增加一个自变量,而调整后的 R²变小,说明这个自变量对模型的贡献是?( )
A. 正向的 B. 负向的 C. 不显著的 D. 无法确定
11、已知某时间序列数据的一阶自相关系数为 0.6。现对该时间序列进行一次差分运算,得到新的时间序列。则新序列的自相关系数( )
A. 减小 B. 增大 C. 不变 D. 无法确定
12、在研究某地区的经济发展与环境污染的关系时,发现随着经济的增长,环境污染先加重后减轻。这种关系被称为?( )
A. 正相关 B. 负相关 C. 非线性相关 D. 不相关
13、为研究不同地区的经济发展水平,收集了各地区的 GDP、人均收入等数据。若要对这些地区进行分类,可采用哪种统计方法?( )
A. 判别分析
B. 聚类分析
C. 主成分分析
D. 因子分析
14、为了解某超市不同商品的销售情况,对一周内的销售数据进行分析。哪种统计图表最能直观地展示各类商品的销售额占比?( )
A. 柱状图 B. 折线图 C. 饼图 D. 箱线图
15、在一次关于大学生就业意向的调查中,共发放问卷 1000 份,回收有效问卷 800 份。在有效问卷中,有 400 人表示希望毕业后进入国有企业工作。以 95%的置信水平估计大学生中希望毕业后进入国有企业工作的比例的置信区间为( )
A. (0.45,0.55) B. (0.47,0.53) C. (0.48,0.52) D. (0.49,0.51)
二、简答题(本大题共4个小题,共20分)
1、(本题5分)解释什么是广义线性模型,它与普通线性模型的区别是什么?举例说明广义线性模型在实际问题中的应用。
2、(本题5分)论述在非参数统计中,Wilcoxon 秩和检验的适用情况和基本步骤,并与参数检验进行比较。
3、(本题5分)详细论述在多元统计分析中如何进行典型相关分析(Canonical Correlation Analysis),说明典型相关分析的目的和应用场景。
4、(本题5分)在进行多元线性回归分析时,如何检验模型的整体显著性和单个自变量的显著性?请说明相应的统计检验方法和判断标准。
三、计算题(本大题共5个小题,共25分)
1、(本题5分)某学校对学生的课外活动参与情况进行调查,随机抽取了 250 名学生。其中,参加体育活动的有 120 人,参加文艺活动的有 80 人,参加科技活动的有 50 人。求参加不同课外活动的学生比例,并构建 90%置信区间。
2、(本题5分)为了解某社区居民的健康状况,随机抽取了 240 位居民进行体检。其中,有慢性疾病的居民有 80 人。求该社区居民慢性疾病患病率,并构建 95%置信区间。
3、(本题5分)某工厂生产的产品次品率为 5%。现从该工厂生产的产品中随机抽取 100 件进行检验,求次品数量的期望值和方差。
4、(本题5分)为研究某地区的气温变化情况,收集了过去 30 年每年的平均气温数据。其均值为 18℃,标准差为 3℃。今年的平均气温为 20℃,请问今年的气温是否显著高于往年的平均水平(α = 0.05)?同时,计算 95%置信水平下今年气温的置信区间。
5、(本题5分)某工厂对生产的产品进行质量检测,随机抽取了 120 个产品。产品的合格率为 90%。求该工厂产品合格率的 99%置信区间。
四、案例分析题(本大题共4个小题,共40分)
1、(本题10分)某城市的文化活动组织方收集了活动参与人数、年龄分布、满意度等数据。请分析如何利用这些数据策划更受欢迎的文化活动。
2、(本题10分)某餐饮连锁企业想研究不同门店的销售额和成本结构差异,收集了财务数据,如何通过统计分析提高门店盈利能力?
3、(本题10分)某电商平台的物流合作伙伴想分析不同地区的物流成本和时效。请分析如何通过数据进行分析和优化物流方案。
4、(本题10分)某房地产公司记录了不同楼盘的销售价格、面积和销售周期。怎样通过统计分析预测市场需求和制定定价策略?
第5页,共5页
展开阅读全文