1、学校________________班级____________姓名____________考场____________准考证号 …………………………密…………封…………线…………内…………不…………要…………答…………题………………………… 菏泽职业学院 《经济数据分析与应用》2023-2024学年第一学期期末试卷 题号 一 二 三 四 总分 得分 批阅人 一、单选题(本大题共20个小题,每小题2分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.) 1、在研究某疾
2、病的危险因素时,收集了患者的生活习惯、遗传因素、环境因素等数据。若要筛选出主要的危险因素,应采用哪种统计方法?( ) A. 逐步回归 B. 岭回归 C. 逻辑回归 D. 以上都不对 2、为预测未来几个月的销售额,收集了过去几年的销售数据。哪种预测方法可能比较适合?( ) A. 线性回归 B. 时间序列分析 C. 聚类分析 D. 因子分析 3、在对某公司员工的工资进行调查时,发现工资数据存在严重的右偏。为了更准确地描述数据的集中趋势,应该使用以下哪个指标?( ) A. 算术平均数 B. 中位数 C. 众数 D. 几何平均数 4、某地区的房价近年来持续上涨,20
3、15 年的平均房价为每平方米 8000 元,2020 年上涨到每平方米 15000 元。假设房价的年增长率服从几何平均数,那么这五年的年平均增长率约为多少?( ) A. 15% B. 18% C. 20% D. 25% 5、在一项关于城市居民消费水平的调查中,随机抽取了 500 个家庭,记录了他们每月的消费支出。若要估计该城市所有家庭平均每月消费支出的 95%置信区间,以下哪种抽样方法更合适?( ) A. 简单随机抽样 B. 分层抽样 C. 整群抽样 D. 系统抽样 6、已知变量 X 和 Y 的相关系数为 0.8 ,对 X 和 Y 分别进行标准化处理后,它们的相关系数是多
4、少?( ) A. 0.8 B. 0 C. 1 D. 无法确定 7、某超市记录了每天不同时间段的顾客流量,为分析顾客流量的时间分布规律,应选用以下哪种图形?( ) A. 折线图 B. 柱状图 C. 饼图 D. 箱线图 8、在一组数据中,计算得到第一四分位数为 20,第三四分位数为 40。那么四分位距是多少?( ) A. 20 B. 40 C. 60 D. 无法计算 9、某工厂生产的零件长度服从正态分布,均值为 5cm,标准差为 0.2cm。现从生产线上随机抽取 100 个零件,测得其平均长度为 4.95cm。请问在显著性水平为 0.05 下,能否认为生产线出现
5、异常?( ) A. 能 B. 不能 C. 无法确定 D. 以上都不对 10、已知某时间序列数据呈现出明显的季节性波动。为了消除季节因素的影响,以便更好地分析数据的长期趋势,应该采用哪种方法?( ) A. 移动平均法 B. 指数平滑法 C. 季节指数法 D. 回归分析法 11、某公司生产的一批产品,其质量特性值服从正态分布,均值为 100,标准差为 5。从这批产品中随机抽取一个,其质量特性值大于 110 的概率大约是多少?( ) A. 0.0228 B. 0.1587 C. 0.8413 D. 0.9772 12、在一个时间序列数据中,既有长期趋势,又有季节变动和不
6、规则变动。为了分离出季节变动,应采用哪种方法?( ) A. 移动平均法 B. 指数平滑法 C. 季节指数法 D. 线性趋势法 13、某工厂生产的零件尺寸服从正态分布,均值为 10mm,标准差为 0.1mm。质量控制部门规定,零件尺寸在 9.9mm 至 10.1mm 之间为合格。一批产品中,合格产品的比例大约是多少?( ) A. 68.27% B. 95.45% C. 99.73% D. 几乎为 100% 14、对于一个时间序列数据,经过一阶差分后变得平稳。若要对其进行预测,以下哪种模型可能较为合适?( ) A. 移动平均模型 B. 自回归模型 C. 自回归移动平均模
7、型 D. 指数平滑模型 15、在分析某班级学生的考试成绩时,发现数学成绩和物理成绩之间存在一定的相关性。为进一步探究这种相关性的本质,应进行以下哪种分析?( ) A. 简单线性回归 B. 曲线回归 C. 非线性回归 D. 以上都不对 16、在对某数据集进行描述性统计分析时,发现数据存在极端值。为了使数据更具代表性,以下哪种处理方法较为合适?( ) A. 直接删除极端值 B. 对极端值进行修正 C. 采用中位数代替均值 D. 以上都可以 17、在方差分析中,如果因素 A 有 3 个水平,因素 B 有 4 个水平,每个处理组合重复 5 次实验,那么总的自由度是多少?(
8、 ) A. 59 B. 60 C. 58 D. 57 18、已知两个变量 X 和 Y 的协方差为 20,X 的标准差为 4,Y 的标准差为 5,计算它们的相关系数约为多少?( ) A. 0.5 B. 0.8 C. 1.0 D. 1.2 19、某超市对不同品牌的同一种商品进行了价格调查,想要了解这些品牌的价格离散程度,以下哪个统计量最合适?( ) A. 极差 B. 平均差 C. 方差 D. 标准差 20、在对数据进行标准化处理时,标准化后的变量均值和标准差分别是多少?( ) A. 0 和 1 B. 1 和 0 C. 原变量的均值和标准差 D. 无法确定
9、 二、简答题(本大题共3个小题,共15分) 1、(本题5分)详细说明如何使用支持向量机算法进行分类和回归任务,解释核函数的选择和作用,并举例应用。 2、(本题5分)详细论述在多元回归分析中如何检验回归模型的整体显著性和单个变量的显著性,说明检验的统计量和判断标准。 3、(本题5分)在进行多因素方差分析时,如何解释交互作用的结果?请结合具体的实验案例说明,并讨论如何进一步分析交互作用的影响。 三、案例分析题(本大题共5个小题,共25分) 1、(本题5分)某城市的环保部门记录了不同区域的空气质量指数、污染源和治
10、理措施等,分析怎样通过统计分析评估环境治理的效果。 2、(本题5分)某共享单车企业想了解不同区域的车辆使用频率和损坏率,收集了相关数据,如何通过统计分析优化车辆投放和维护? 3、(本题5分)某政府部门统计了不同地区的经济发展指标、人口结构和公共服务设施情况,分析如何通过统计分析制定区域发展政策和资源分配方案。 4、(本题5分)某手机应用开发商统计了不同版本应用的下载量、用户留存率和评分,以改进应用功能和用户体验。请分析这些数据。 5、(本题5分)某电商企业记录了不同商品的退货率和退货原因。请
11、分析如何依据这些数据改进商品质量和售后服务。 四、计算题(本大题共2个小题,共20分) 1、(本题10分)某公司对员工的工作满意度进行调查,随机抽取了 180 名员工。样本员工的平均满意度为 4.2 分(满分为 5 分),标准差为 0.7 分。假设工作满意度服从正态分布,求该公司员工平均工作满意度的 90%置信区间。 2、(本题10分)某学校有 1200 名学生,在一次化学考试中,成绩的平均数为 65 分,标准差为 10 分。现随机抽取 120 名学生的试卷进行分析,求这 120 名学生成绩的平均数的抽样分布,并计算抽样平均误差。若总体服从正态分布,求这 120 名学生的平均成绩在 63 分到 67 分之间的概率。 第5页,共5页






