1、 院系: 班级: 学号: 姓名: 装 订 线 考试科目: 统计学 考试时间:120 分钟 试卷总分:100分 考试方式: 闭卷 考生院系: 全校学生 题号 一 二 三 四 总分 题分 10 10 35 45 100 得分 评卷 教师 注:本试卷考生可用没有储存功能的计算器 一、
2、单选题(本大题共10小题,每小题1分,总计10分) 1.为了了解学生对学校某项政策的意见,从每个学院学生中随机抽取一些学生进行调查,这样的抽样方法是( )。 A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样 2.某次公务员考试有100万人参加了考试,所有考生成绩的均值为,方差为,现准备随机抽取200人作为样本进行初步的成绩分析,其均值为,方差为,则有:( ) A.= B. C. D. 3.某公司年底对员工进行年度考核,考核结果分为优秀、良好、合格和不合格四类,
3、则该计量尺度为( )。 A.定类尺度 B.定序尺度 C.定距尺度 D.定比尺度 4.根据某保险公司投保人缴纳保费(元)的数据绘制的直方图如下,能够较好地反映数据集中趋势的统计量是( )。 A.均值 B.中位数 C.方差 D.极差 5.为了研究影响职工工作积极性的主要因素,公司在全面分析的基础上,分别选取了几位工作极为认真负责和工作积极性较差的员工进行座谈调查,该调查方式为( )。 A.整群抽样 B.重点调查 C
4、.分层抽样 D.典型调查 6.某设备推销员向某企业推销设备,声称其代理的新设备能有效降低产品的次品率(),企业对该设备进行考察,从其加工的产品中随机抽取若干件进行检测,并与旧设备次品率()比较,若真能显著降低产品次品率则准备购进,此时应建立的假设是( )。 A. B. C. D. 7.在统计假设检验中可能犯两类错误,下列说法中正确的是( )。 A.拒绝原假设可能犯弃真错误 B.拒绝原假设可能犯取伪错误 C.不拒绝原假设可能犯弃真错误 院系: 班级:
5、 学号: 姓名: 装 订 线 D.不拒绝原假设一定犯取伪错误 8.某广告公司为了研究企业广告费投入(万元)对公司收入(万元)的影响,随机调查了40家公司,根据调查资料拟合得公司收入对公司广告费投入的回归方程为:,则方程中“7.025”的含义为( )。 A.公司收入每增长1万元,公司广告费支出平均增长7.025万元 B.公司收入每增长1万元,公司广告费支出增长7.025万元 C.公司广告费支出每增长
6、1万元,公司收入平均增长7.025万元 D.公司广告费支出每增长1万元,公司收入增长7.025万元 9.某企业根据历年产量预测未来的产量,为了消除不规则波动,决定对数据进行移动平均处理,甲研究员提出进行3项移动平均,乙研究员建议进行4项移动平均,则两者对数据的修匀作用为( )。 A.二者相同 B.前者大于后者 C.前者小于后者 D.均无修匀作用 10.某企业市场开发部为了研究各地区影响产品销售量的主要因素,收集了各地区人口数、人均收入、GDP等数据,并进行了主成分分析,得到5个主成分,则下列说法中正确的是( )。 A.原始数据
7、中变量间存在相关关系,各主成分间也存在相关关系 B.原始数据中变量间存在相关关系,各主成分间不存在相关关系 C.原始数据中变量间不存在相关关系,各主成分间存在相关关系 D.原始数据中变量间不存在相关关系,各主成分间也不存在相关关系 二、多选题(本大题共5小题,每小题2分,总计10分) 1.下列统计量中,易受极端值影响的有( )。 A.中位数 B.众数 C.均值 D.极差 E.四分位差 2.某企业为了研究客户满意度,需抽取一些客户进行调查,以便于推断全部客户的满意度,该企业可以采用的调查方法有( ) A.方便抽
8、样 B.分层抽样 C.判断抽样 D.系统抽样 E.整群抽样 3.在统计假设检验中,当我们作出拒绝原假设的结论时,表示( )。 A.有充足的理由否定原假设 B.原假设必定是错误的 C.犯错误的概率为显著性水平 D.犯错误的概率为取伪概率β E.犯错误的概率为观察到的显著性水平值 4.方差分析需要数据满足的条件有( )。 A.各总体服从正态分布 B.样本数据服从正态分布 C.各总体方差相等 D.样本数据方差相等 E.观察值相互独立 5. 参数估计中,评价估计量优劣的标准
9、有( )。 A.无偏性 B.一致性 C.独立性 D.有效性 E.显著性 三、简答题(本大题共2小题,总计35分) 1. 下列数据是30各不同国家中每100000个男子由于肝硬化的死亡率: 1.5 7.2 13.2 15.6 27 33.9 3.2 8.3 13.7 16.7 27 34.8 5.1 8.8 13.7 18.8 28.9 40.6 5.6 10 14.5 19.1 28.9 41.6 6.2 11.1 15 23.9 33.1 50.1 要求: (1)将上述数据按照0
10、—10,10—20,20—30,30—40,40—50,50—60分组,并绘制直方图;(5分) 院系: 班级: 学号: 姓名: 装 订 线 (2)根据直方图说明上述数据的分布状况;(5分) (3)根据表中数据计算由于肝硬化死亡率的中位数;(2分) (4)比较上述数据的中位数与均值(19.24)的差异,说明差异产生的原因;(5
11、分) (5)若要分析上述数据的集中趋势,用中位数和均值哪个代表性强,理由是什么?(5分) 2. 一所大学有3000名男生,其身高服从均值为174cm、标准差为3cm的正态分布。现从中有放回地随机抽取25人作为样本,测量其身高。 要求: (1)理论上讲,可以形成多少个不同的样本?(请写出其表达式,不用计算结果);(3分) (2)这些样本的均值()服从什么样的分布?其期望值是多少?(5分) (3)为了衡量这些样本均值()的差异程度,需计算什么样的统计量?请写出其表达式和计算结果。(5分)
12、 四、计算分析题(本大题共3小题,总计45分) 1.简单统计推断(本题13分) 为了研究公立大学与私立大学学生费用支出情况,随机抽取了15名公立大学学生和10名私立大学学生,统计了他们每年的花费金额(单位:万元),比较其差异情况。计算结果如下: 统计量 公立大学 私立大学 均值 7.56 16.51 方差 5.86 5.34 双总体等方差均值之差检验 t 自由度 双侧P-值 均值 之差 标准 误差 95%的置信区间 Lower(下限) Upper(上限) -9.22 23 0.00 -8.95 0.97 -10.96
13、 -6.94 要求: (1)计算两者的合并方差;(5分) 院系: 班级: 学号: 姓名: 装 订 线 (2)数据能否支持公立大学费用确实低于私立大学?请写出原假设和备择假设,并说明显著性水平为0.05的检验结果;(6分) (3)请给出二者差值的95%的置信区间(2分) 2.方差分析(本题15分) 为了研究不同肥料和不同
14、品种对产量的影响,在三块经三种不同肥料处理的土壤中种植四种不同品种的庄稼,登记其亩产量,进行方差分析,数据与结果如下: 庄稼1 庄稼2 庄稼3 庄稼4 肥料A 4.5 6.4 7.2 6.7 肥料B 8.8 7.8 9.6 7 肥料C 5.9 6.8 5.7 5.2 差异源 SS df MS F 双侧P-值 F 临界值 行 13.68 2 0.034258 5.14325285 列 3 0.512185 4.75706266 误差 6.58 6 — — — 总计 23
15、08 11 — — — — 要求: (1)根据已知资料,填出上述表中空白格的数字(3分) (2)写出上述分出方差分析的原假设和备择假设,并说明其含义(6分) (3)说明分析结果,并说明理由(4分) (4)上述方差分析没有考虑肥料与品种的交互作用,请说明上述数据能否进行有交互作用的方差分析?(2分) 3. 相关与回归分析(本题17分) 有些食品吃起来口味越好,对身体越不利,如巧克力中的脂肪含量。为了分析巧克力酸奶中脂肪含量与口味关系,测试了十种巧克力酸奶中的脂肪含量(%),并聘请了一些经过培训的品味师以0到
16、100的记分对酸奶口味评价。对两者的关系进行分析,结果如下: Correlations(相关分析) 脂肪百分比 口味记分 脂肪百分比 Pearson相关系数 1 0.74 双侧P-值 — 0.014 样本量 10 10 口味记分 Pearson相关系数 0.74 1 双侧P-值 0.014 — 样本量 10 10 ANOVAb(方差分析) 离差平方和 自由度 均方 F 双侧P-值 Regression(回归模型) 618.31776 1 618.31776 9.6653 0.014469 Re
17、sidual(残差) 511.78224 8 63.97278 — — Total(总计) 1130.1 9 — — — 回归系数及其检验 系数 标准误差 t 双侧P值 常数项 36.782644 11.38717 3.2301835 0.012054 脂肪百分比 1.576135 0.506973 3.1089107 0.014469 要求: (1)说明巧克力中脂肪含量与口味评价值的相关关系;(4分) 院系: 班级
18、 学号: 姓名: 装 订 线 (2)写出口味评价值对脂肪含量百分比的回归模型和回归方程;(3分) (3)对上述回归结果进行统计检验,写出原假设与备择假设,并说明检验结果;(5分) (4)计算回归方程的判定系数,并评价回归方程的优劣。(5分) (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)






