资源描述
目录2012年安徽大学432统计学专业硕士考研真题2012年安徽大学432统计学专业硕士考研真题及详解2013年安徽大学432统计学专业硕士考研真题2013年安徽大学432统计学专业硕士考研真题及详解2014年安徽大学432统计学专业硕士考研真题2014年安徽大学432统计学专业硕士考研真题及详解2015年安徽大学432统计学专业硕士考研真题2015年安徽大学432统计学专业硕士考研真题及详解2016年安徽大学432统计学专业硕士考研真题2016年安徽大学432统计学专业硕士考研真题及详解2017年安徽大学432统计学专业硕士考研真题(回忆版)及详解2012年安徽大学432统计学专业硕士考研真题2012年安徽大学432统计学专业硕士考研真题及详解一、单项选择题(共15小题,每小题4分,计60分)1设AB,P(A)0.6,P(AB)0.8,则事件B的逆事件的概率为()。A0.2B0.6C0.8D0.4C【答案】P(AB)P(A)P(B)P(AB),因为AB,即P(AB)0,故P(B)P(AB)P(A)0.2,因此P(B)1P(B)0.8。【解析】2A,B是任意两个事件,0P(A)1,P(B)0,P(B|A)P(B|A),则必有()。AP(A|B)P(A|B)BP(A|B)P(A|B)CP(AB)P(A)P(B)DP(AB)P(A)P(B)C【答案】因为P(B|A)P(AB)/P(A),【解析】由题意有即P(AB)P(A)P(AB)P(A)P(B)P(A)P(AB),所以P(AB)P(A)P(B)。3已知随机变量X服从二项分布且E(X)2,D(X)1.44,则二项分布的参数n,p的值为()。An4,p0.6Bn6,p0.4Cn8,p0.3Dn24,p0.1B【答案】二项分布的期望和方差的计算公式为:EXnp,DXnp(1p),本题中EXnp2.4,DXnp(1p)1.44,解得【解析】【说明】本题的题目设置有误,题目中的EX应该等于2.4,若按照题目中的EX2则无解(因为n必须为整数)4某地区零售总额比上年增长20%,扣除价格因素影响,实际增长11%,以此计算该地区物价指数为()。A9%B8.1%C109%D108.1%D【答案】居民消费价格指数商品零售名义总额/商品零售实际总额,设去年的商品零售总额为1,则CPI(120%)/(111%)108.1%。【解析】5统计调查中的代表性误差()。A只在抽样调查中存在B只在典型调查中存在C只在重点调查中存在D存在于所有的非全面调查中D【答案】统计调查误差,就是调查结果所得的统计数字与调查总体实际数值之间的离差。统计调查误差可分为登记性误差和代表性误差。登记性误差是由于错误登记事实而发生的误差,不管是全面调查或是非全面调查都会产生登记性误差。代表性误差,只有非全面调查中才有,全面调查不存在这类误差。非全面调查由于只对调查现象总体的一部分单位进行观察,并用这部分单位算出的指标来估计总体的指标,而这部分单位不能完全反映总体的性质,它同总体的实际指标会有一定差别,这就发生了误差。【解析】6假如各组指标值都扩大两倍,而频数都减少为原来的1/3,那么平均数()。A不变B减少为原来的1/3C扩大两倍D无法计算C【答案】分组数据平均数的计算公式为:【解析】式中xi为各组指标值,fi为各组指标值的频数。当各组指标值都扩大2倍而频数减少为原来的1/3时,7某市国内生产总值的平均增长速度:20012003年为12%,20042006年为9%,则这6年的平均增长速度为()。ABCDA【答案】设这六年的平均增长速度为x,2004年的国内生产总值为a,则有:【解析】a(1x)6a(112%)3(19%)3解得故选A。8在计算增长率的平均数时,通常采用()。A简单平均数B几何平均数C算术平均数D调和平均数B【答案】几何平均数是N项标志值的连乘积的N次方根。几何平均数一般应用于具有等比趋势数列的平均数,因为这时标志值总量等于各标志值的连乘积。在社会经济现象中,许多现象变化的总比率或总速度常常是各项比率或各项速度的连乘积,所以要用几何平均数计算平均比率或平均发展速度。【解析】9各变量值与其()的离差之和等于零。A中位数B众数C均值D标准差C【答案】均值是一组数据相加后除以数据的个数得到的结果,计算公式为【解析】各变量与其均值的离差之和为10 下列数字特征中,度量随机变量取值的离散程度的是()。A期望值B方差C协方差D相关系数B【答案】数据的离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用的测度值,根据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以及测度相对离散程度的离散系数等。【解析】11 一本书排版后,一校时出现的平均错误处数为200,标准差为400。随机抽取排版后的一本书稿,出现错误的处数不超过230的概率为()。A0.93B0.80C0.85D0.85A【答案】用随机变量X表示出错的处数,假定服从正态分布,即XN(200,400),出现错误的处数不超过230的概率为【解析】所以出现错误数不超过230的概率为0.93。【说明】本题题干中应该为方差为400,而非标准差。12 以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的是()。A95%的置信区间比90%的置信区间宽B样本容量较小的置信区间较小C相同置信水平下,样本容量大的区间宽D样本均值越小,区间越大A【答案】当总体服从正态分布且2已知时,样本均值x的抽样分布均为正态分布,其数学期望为总体均值,方差为2/n。样本均值经过标准化以后的随机变量则服从标准正态分布,总体均值在1置信水平下的置信区间为,1称为置信水平;z/2是标准正态分布右侧面积为/2时的Z值。置信水平越大置信区间越宽;样本容量越大置信区间越窄;置信区间的宽度与样本均值的大小无关。【解析】13 在线性回归方程Yi48.532.87Xi中,2.87说明()。AX每增加一个单位,Y肯定会增加2.87个单位BX每增加一个单位,Y平均会增加2.87个单位CX平均增加一个单位,Y会增加2.87个单位DX平均增加一个单位,Y肯定会增加2.87个单位B【答案】一元线性回归方程的形式为:E(y)01x,一元线性回归方程的图示是一条直线,因此也称为直线回归方程。其中0是回归直线在y轴上的截距,是当x0时y的期望值;1是直线的斜率,它表示x每变动一个单位时,y的平均变动值。【解析】14 回归方程的可决系数数值越大,则回归线()。A越接近Y的总体平均值B越接近Y的样本观察值C越接近Y的预测值D越接近于Y的估计值B【答案】可决系数是指回归平方和在总变差中所占的比重。可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。【解析】15 要通过移动平均法消除季节变动,则移动平均项数N()。A应选择奇数B应选择偶数C应和季节周期长度一样D可以任意取值C【答案】移动平均法的主要特点有:移动平均时距项数N为奇数时,只需一次移动平均,其移动平均值作为移动平均项数的中间一期的趋势代表值;而当移动平均项数N为偶数时,移动平均值代表的是这偶数项的中间位置的水平,无法对正某一时期,则需要在进行一次相临两项平均值的移动平均,这才能使平均值对正某一时期,这称为移正平均,也称为中心化的移动平均数;当序列包含季节变动时,移动平均时距项数N应与季节变动长度一致,才能消除其季节变动;若序列包含周期变动时,平均时距项数N应和周期长度基本一致,才能较好的消除【解析】周期波动。二、填空题(10题,每小题3分,计30分)1设袋中有50个乒乓球,其中20个是黄球,30个是白球,现在有两人依次随即从袋中取一个球,取后不放回,则第二个人取得的是黄球的概率_。0.4【答案】设事件A1表示“第一个人取得黄球”,事件A2表示“第一个人取得白球”,事件B表示“第二个人取得黄球”,则由全概率公式有:【解析】故第二个人取得的是黄球的概率是0.4。2在3次独立实验中,事件A出现的概率相等,若已知A至少出现一次的概率为19/27,则事件A在一次试验中出现的概率为_。1/3【答案】设事件A出现的概率为p,事件B表示“3次独立实验中A至少出现一次”,则P(B)1P(B)1(1p)319/27,解得p1/3。【解析】3假设随机变量X服从均值为2,方差为2的正态分布,且P2X40.3,则Px0_。0.2【答案】由题意可知XN(2,2),则P(2X4)P(22)/X(42)/(2/)(0)0.3,因为(0)0.5,故(2/)0.8,所以P(X0)P(X2)/(02)/(2/)1(2/)0.2,故P(X0)0.2。【解析】4一组样本数据为3,3,1,5,13,12,11,9,7这组数据的中位数是_。7【答案】将这组样本数据排序,结果为:1、3、3、5、7、9、11、12、13。一共有9个数据,数据个数是奇数,排在第(n1)/2(91)/25位的是中位数,故中位数是7。【解析】5为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法是_。分层抽样【答案】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,最后将各层的样本结合起来,对总体的目标量进行估计。本题中先按照性别特征将学生分为男、女两层,然后在男学生、女学生中抽取样本,属于分层抽样。【解析】6已知总体的均值为50,标准差为8,该总体中随机抽取容量为64的样本,则样本均值的数学期望和抽样分布的标准差为_。50;1【答案】根据中心极限定理:设从均值为、方差为2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值x的抽样分布近似服从均值为、方差为2/n的正态分布。本题中x的数学期望为50,抽样分布的标准差为【解析】7在组距数列中,表示各组界限的变量值称为_,各组上限与下限之间的中点值称为_。组限;组中值【答案】组限指在组距式分组中,表示各组变动范围的两端的数值,其中,每组的最小值称为下(组)限,每组的最大值称为上(组)限,组限一般是决定事物性质的数量界限。组距分组掩盖了各组内的数据分布状况,为反映各组数据的一般水平,我们通常用组中值作为该组数据的一个代表值。组中值是每一组中下限值与上限值中间的值,即组中值(下限值上限值)/5。【解析】8增长量是报告周期水平与基期水平之差,由于基期的不同增长量可分为_增长量和_增长量。逐期;累计【答案】增长量是指时间数列中两个不同时期的发展水平之差,反映社会经济现象报告期比基期增加或减少的数量,即增长量报告期水平一基期水平。由于采用的基期不同,增长量有以下两种:逐期增长量,它是报告期水平与前一期水平之差,说明报告期比前一时期增长的【解析】绝对数量;累计增长量,它是报告期水平与某一固定时期水平之差,它说明本期比某一固定时期增长的绝对数量,也说明在某一较长时期内总的增长量。二者的关系是:逐期增长量之和等于相应时期的累计增长量。9平均发展速度是对各期_速度求平均的结果,计算方法有_和累计法。环比发展;方程式法【答案】平均发展速度是一定时期内各个环比发展速度的平均数,它说明某种现象在一个较长时期内逐期平均发展变化的程度。平均增长速度是各个环比增长速度的平均数,但它不是根据各环比增长速度计算的,而是根据平均发展速度计算的。它说明某种现象在一个较长时期内逐期平均增长变化的程度。目前计算平均发展速度通常采用方程式法和累计法。【解析】10 已知某产品产量2007年与2006年相比增长了5%,2008年与2006年相比增长了12%,则2008年与2007年相比增长了_。6.67%【答案】设该产品2006年的产量为a,则2007年的产量为(15%)a,2008年的产量为(112%)a,【解析】故2008年与2007年相比增长了6.67%。三、简答题(共4题,每题6分,计24分)1什么是相对指标?有哪些相对指标(至少举出4例)?各有什么作用?答:相对指标是运用对比的方法,来反映某些相关事物之间数量联系程度的综合指标。相对指标按其作用不同可划分为六种|:结构相对指标、比例相对指标、强度相对指标、动态相对指标、比较相对指标和计划相对指标。(1)结构相对指标结构相对指标总体的某一部分与总体数值相对比求得的比重或比率指标,通常用来反映总体的结构和分布状况等。实际经济工作中常用的恩格尔系数、贡献率、城市化程度、中间投入率、增加值率、消费率、合格率、市场占有率等都是结构相对数。(2)比较相对指标又称比较相对数或同类相对数。同类指标在不同空间进行静态对比形成的相对指标。可以比较不同国家、不同地区、不同单位等经济实力、发展水平和工作优劣。(3)比例相对指标又称比例相对数或比例指标。反映总体中各组成部分之间数量联系程度和比例关系的相对指标。(4)强度相对指标又称强度相对数。有一定联系的两种性质不同的总量指标相比较形成的相对指标。通常以复名数、百分数、千分数表示。(5)动态相对指标动态相对指标又称“动态相对数”或“时间相对指标”,就是将同一现象在不同时期的两个数值进行动态对比而得出的相对数,借以表明现象在时间上发展变动的程度。通常以百分数或倍数表示,也称为发展速度。(6)计划完成程度指标又称计划完成百分数。以计为比较标准,将实际完成数与计划规定数相比较,用以表明计划完成情况的相对指标,通常用百分数表示。2什么是数量指标?什么是质量指标?分别举例说明。答:数量指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标,用绝对数表示。其数值大小一般随总体范围的大小而增减,如商品销售量、工业产品产量等;质量指标是反映社会经济现象相对水平或平均水平的统计指标,用平均数或相对数表示,比如劳动生产率、单位面积产量、单位产品成本等。3什么是时间序列?举例说明。时间序列的构成因素有几种?测定时间序列的长期趋势有哪几种方法?答:(1)时间序列是同一现象在不同时间上的相继观察值排列而成的序列。经济数据大多数以时间序列的形式给出,比如20102012年我国的国内生产总值就是时间序列。(2)时间序列的成分可以分为4种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。(3)时间序列的趋势可以分为线性趋势和非线性趋势两大类,如果这种趋势能够延续到未来,就可以利用趋势进行外推预测。有趋势序列的预测方法主要有线性趋势预测、非线性趋势预测和自回归模型预测等。4什么是指数因素分析?有哪几种指数因素分析?因素分析的一般步骤。答:因素分析法是利用统计指数体系分析现象总变动中各个因素影响程度的一种统计分析方法,包括连环替代法、差额分析法、指标分解法等。因素分析的一般步骤包括:(1)确定分析对象,并计算出实际与目标数的差异;(2)确定该指标是由哪几个因素组成的,并按其相互关系进行排序(排序规则是:先实物量,后价值量;先绝对值,后相对值);(3)以目标数为基础,将各因素的目标数相乘,作为分析替代的基数;(4)将各个因素的实际数按照上面的排列顺序进行替换计算,并将替换后的实际数保留下来;(5)将每次替换计算所得的结果,与前一次的计算结果相比较,两者的差异即为该因素对成本的影响程度;(6)各个因素的影响程度之和,应与分析对象的总差异相等。四、计算分析题(共3题,每小题12分,计36分)1设连续随机变量X的密度函数为(1)求常数C;(2)求随机变量X的取值落在(1/2,1/2)内的概率。解:(1)由密度函数的性质有:解得C1/。(2)由第一问的计算结果可知X的密度函数为:故2某种生产线上的感冒冲剂规定每包重量为12克,超重或者是过轻都会产生严重的后果。从过去的资料得知是0.6克,质检员每两小时抽取25包冲剂称重检测,并作出是否停工的决策。假定产品质量服从正态分布。(1)建立适当的原假设和备择假设;(2)在0.05时,该检验的决策准则是什么;(3)若x12.25克,质检员将采取什么行动;(4)若x11.95克,质检员将采取什么行动。解:(1)原假设H0:12备择假设H1:12(2)0.05,有z/21.96,计算出统计量的值,比较|z|与z/2的大小,若|z|z/2则拒绝原假设,否则接受原假设。(3)已知x12.25,计算检验统计量:所以拒绝原假设,质检员将做出停工的决策。(4)已知x11.95,计算检验统计量:因为|z|z/21.96,所以接受原假设,质检员将做出不停工的决策。3已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农副产品收购价格总指数为105%试考虑,1998年比1997年相比:(1)农民因农副产品共增加多少收入;(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3)由于农副产品收购价格提高了5%农民又增加了多少收入?(4)验证以上三个方面分析得出的结论是否一致。解:(1)1998年收购总额为360(112%)403.2(亿元),因此增加收入为403.236043.2(亿元)。(2)总指数价格指数销售量指数,即403.2/360105%x,解得x106.67%,农副产品收购量增加了6.67%。故kqq1p0/q0p0106.67%,即q1p0384,38436024(亿元),农民因此增加了24亿元的收入。(3)由题意有p1q1/p0q1105%,解得p0q1384,403.238419.2(亿元),故农民又增加了19.2亿元的收入。(4)因为43.22419.2,故以上三个方面分析得出的结论一致。2013年安徽大学432统计学专业硕士考研真题2013年安徽大学432统计学专业硕士考研真题及详解一、单项选择题(共30小题,每小题2分,计60分)1为了调查某校学生的生活费用开支,从男生中抽取50名学生调查,从女生中抽出50名学生调查,这种抽样方法属于()。A简单随机抽样B整群抽样C系统抽样D分层抽样D【答案】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。本题中先根据性别分为男女两层,再在各层中独自抽取样本,属于分层抽样。【解析】2统计表的横行标题写在表的()。A上方B左方C右方D下方B【答案】统计表一般由五个部分组成,即表头、行标题、列标题、数字资料和表外附加构成。表头应该放在表的上方,它说明的是表的主要内容;行标题和列标题一般放在表的第一列和第一行,它表示的是所研究问题类别的名称和指标名称;表的其余部分是具体的数字资料:表外附加通常放在统计表的下方,用来说明资料来源、指标注释和必要的说明等内容。【解析】3某地区商品零售总额比上年增长20%,扣除价格因素,实际增长为11%,依此计算该地区的物价指数为()。A9%B8.1%C109%D108.1%D【答案】居民消费价格指数商品零售名义总额/商品零售实际总额,设去年的商品零售总额为1,则CPI(120%)/(111%)108.1%。【解析】4统计调查表中的代表性误差()。A只在抽样调查中存在B只在典型调查中存在C只在重点调查中存在D存在于所有的非全面调查中D【答案】统计调查误差,是指调查结果所得的统计数字与调查总体实际数量之间的离差。统计调查误差可分为登记性误差和代表性误差。登记性误差是由于错误登记事实而发生的误差,不管是全面调查或是非全面调查都会产生登记性误差。代表性误差,只有非全面调查中才有,全面调查不存在这类误差。非全面调查由于只对调查现象总体的一部分单位进行观察,并用这部分单位算出的指标来估计总体的指标,而这部分单位不能完全反映总体的性质,它同总体的实际指标会有一定差别,这就发生了误差。【解析】5抽样平均误差(抽样标准误差)是指样本指标与总体指标之间的()。A实际误差B可能误差范围C平均误差程度D全部误差C【答案】抽样误差是指抽样方法本身所引起的误差。当由总体中随机地抽取样本时,任意一个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。抽样误差有三种表现形式:抽样实际误差,它是指在一次具体的抽样调查中,由于随【解析】机因素引起的样本指标与总体指标之间的离差;抽样平均误差,它是指抽样平均数的标准差或抽样成数的标准差,是反映抽样误差的一般水平的一个指标;抽样极限误差,它是指样本指标与总体指标之间的误差范围。6某市国内生产总值的平均增长速度:20052007年为12%,20082010年为9%,则这6年的平均增长速度为()。ABCDD【答案】设这六年的平均增长速度为x,2004年的国内生产总值为a,则有:【解析】a(1x)6a(112%)3(19%)3解得故选D项。7为了估计全国高中学生的平均身高,从30个城市中选取了100所中学进行调查。在该研究中,研究者最感兴趣的变量是()。A100所中学的学生数B30个城市的中学数C全国高中学生的身高D全国的高中学生数C【答案】研究者做调查的最终目的是得到全国高中学生的平均身高,中间过程中抽取的样本只是为总体的推断服务的,并不是研究者感兴趣的根本。【解析】8只能归类于某一类别的非数字型数据称为()。A分类数据B顺序数据C数值型数据D数值型变量A【答案】按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;顺序数据是只能归于某一有序类别的非数字型数据,顺序数据虽然也是类别,但这些类别是有序的;数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。【解析】9为比较多个样本间的相似性,适合采用的图形是()。A环形图B茎叶图C雷达图D箱线图C【答案】当有两个或两个以上变量时,可以采用多变量的图示方法,常见的有散点图、气泡图、雷达图。雷达图是显示多个变量的常用图示方法,也称为蜘蛛图,其在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外利用雷达图也可以研究多个样本之间的相似程度。【解析】10 一组数据的离散系数为0.6,标准差为30,则平均数为()。A50B1.7C18D0.02A【答案】离散系数是一组数据的标准差与其相应的平均数之比。其计算公式为:vss/x,即xs/vs,将数据代入计算得x30/0.650。【解析】11 两组数据的平均数不等,但标准差相等,则()。A平均数小的,离散程度大B平均数大的,离散程度大C平均数小的,离散程度小D两者数据的离散程度相同A【答案】标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,另一方面受不同计量单位的影响。对于平均水平不同的变量值,可以通过离散系数来比较变量的离散程度。离散系数是一组数据的标准差与其相应的平均数之比。其计算公式为vss/x。由题意标准差相等,则平均值小的离散程度大。【解析】12 在置信水平不变的条件下,要缩小置信区间,则()。A增加样本量B减少样本量C保持样本量不变D需要改变统计样本量的抽样标准差A【答案】当样本量给定时,置信区间的宽度随着置信系数的增大而增大,从直觉上说,区间比较宽时,才会使这一区间有更大的可能性包含参数的真值;当置信水平固定时,置信区间的宽度随样本量的增大而减小,换言之,较大的样本所提供的有关总体的信息要比较小的样本多。【解析】13 下面对相关系数的陈述哪一个是错误的()。A度量两个变量之间的线性关系强度的统计量B一个随机变量C绝对值不会大于一D不会取负值D【答案】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,当样本观测值不同时,统计量的值也不相同,故相关系数也是一个随机变量。相关系数r的取值范围是1,1。若0r1,表明x与y之间存在正线性相关关系;若1r0,表明x与y之间存在负线性相关关系;若r1,表明x与y之间为完全正线性相关关系;若r1,表明x与y之间为完全负线性相关关系。可见当|r|1时,y的取值完全依赖于x,二者之间即为函数关系;当r0时,说明y的取值与x无关,即二者之间不存在线性相关关系。【解析】14 时间序列呈现出的非固定长度的周期性波动称为()。A趋势B季节变动C循环变动D随机变动C【答案】循环变动是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。循环变动不同于趋势变动,它不是朝着单一方向的【解析】持续运动,而是涨落相间的交替波动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。15 众数是指()的数据。A特别出众的B出现次数最多的C出现次数最少的D离群的B【答案】众数是一组数据中出现次数最多的变量值,主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中趋势的测度值。【解析】16 某班学生的平均成绩是80分,标准差是10分,若已知该班学生的考试分数呈现对称分布,可以判断出考试分数在60到100分之间的学生大约占()。A95%B89%C68%D99%A【答案】根据3原则:数值分布在(,)中的概率为0.6826;数值分布在(2,2)中的概率为0.9544;数值分布在(3,3)中的概率为0.9974。60100分落入平均分数的2域即(2,2)内,故考试分数在60100分之间的学生大约占95%。【解析】17 已知总体的均值为100,标准差为16,从该总体中随即抽取样本容量为64的样本,则样本均值的数学期望和抽样分布的标准误差分别为()。A100,16B100,1C100,2D100,4C【答案】已知EX100,DX162,根据样本均值的抽样分布可知,EX100,DXDX/n162/64,其标准误差为【解析】18 在回归分析中,因变量的预测区间估计是指()。A对于自变量x的一个给定值x0,求出因变量y的平均值的区间B对于自变量x的一个给定值x0,求出因变量y的个别值的区间C对于因变量的一个给定值y0,求出自变量x的平均值的区间D对于因变量一个给定值y0,求出自变量x的平均值的区间B【答案】区间估计有两种类型:一是置信区间估计,它是对x的一个给定值x0,求出y的平均值的估计区间,这一区间称为置信区间;二是预测区间估计,它是对x的一个给定值x0,求出y的一个个别值的估计区间,这一区间称为预测区间。【解析】19 如果时间序列的逐期观测值按一定的增长率增长或者衰减,则适合的预测模型()。A移动平均模型B指数平均模型C线性模型D指数模型D【答案】指数模型用于预测以几何级数递增或递减的现象,即时间序列的观察值Yt按指数规律变化,或者说时间序列的逐期观察值按一定的增长率增长或衰减。指数平均模型通过对过去的观察值加权平均来进行预测。【解析】20 雷达图的主要用途是()。A反映一个个体或者是总体的结构B比较多个总体的构成C反映一组数据的分布D比较多个样本的相似性D【答案】雷达图是显示多个变量的常用图示方法,也称为蜘蛛图。雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外,利用雷达图也可以研究多个样本之间的相似程度。【解析】21 90%的置信水平区间是指()。A总体参数落在一个特定的样本所构造的区间内的概率为90%B总体参数落在一个特定的样本所构造的区问内的概率为10%C在用同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为90%D在用同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为10%C【答案】一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。【解析】22 在假设检验中,如果所计算的P值越小,则说明检验的结果()。A越显著B越不显著C越真实D越不真实A【答案】P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。而在假设检验中,原假设为不显著。故P值越小说明检验的结果越显著。【解析】23 在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是()。A一个样本观测值之间误差的大小B全部观测值误差的大小C各个样本均值之间的误差大小D各个样本方差之间的误差大小C【答案】组间平方和是各组均值x(i1,2,k)与总均值 的误差平方和,反映各样本均值之间的差异程度,因此又称为因素平方和。【解析】24 在进行多元线性回归分析时,如果回归模型中存在多重共线性,则()。A整个回归模型的线性关系不显著B肯定有一个回归系数不能通过显著性检验C肯定又导致某个回归系数的符号与预测的相反D可能导致某些回归系数不能通过显著性检验D【答案】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量的回归系数t检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量间存在多重共线性。【解析】25 在某一次考试中,抽取49个应试者,得到平均考试成绩为78分,标准差为12分该次考试中所有应试者的平均成绩95%的置信区间为()。A781.96B783.36C780.48D784.52B【答案】在大样本条件下,总体均值的抽样分布为:【解析】本题中,总体标准差未知,故用样本标准差代替。因而,该次考试中所有应试者的平均成绩的95%的置信区间为:故选B。26 设A、B为任意两个事件,则(AB)(AB)表示()。A必然事件BA与B恰有一个发生C不可能事件DA与B不同时发生B【答案】由题意,(AB)(AB)AABBBAABBAAB,BAAB表示A发生B不发生或者B发生A不发生,即AB恰有一个发生。【解析】27 从5双不同的鞋了中任意取出4只,这4只鞋子中至少有2只能配成对的概率为()。A10/21B11/21C12/21D13/21D【答案】设事件A表示“4只鞋子中至少有2只能配成一对”,则A“能配成一对”或“能配成两对”,故【解析】28 已知随机变量的概率密度函数为f(x)Ae|x|,则A等于()。A1B2C1/2D1/3C【答案】根据概率密度函数的性质:【解析】有解得A1/2。29 设随机变量X服从(2,5)上的均匀分布,先对进行3次独立观察的试验则至少有两次观察值大于3的概率为()。A20/27B21/27C22/27D23/27A【答案】由题意可知X的概率密度函数为【解析】因此X大于3的概率是设事件A表示“3次独立试验得到的观察值至少有2次大于3”,则A“3次独立试验得到的观察值有2次大于3”或“3次独立试验得到的观察值有3次大于3”,所以30 设随机变量X服从N(0,1),且Y2X1,则Y服从()。AN(0,1)BN(1,1)CN(1,2)DN(1,4)D【答案】因为X服从正态分布,Y是X的一个线性变换,故Y也服从正态分布。EX0,DX1,由期望和方差的性质有:E(2X1)2E(X)11,D(2X1)22D(X)4,故YN(1,4)。【解析】二、简答题(共4小题,每题10分,计40分)1试叙述度量统计数据分布集中趋势的指标并解释各自含义。答:集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。度量统计数据分布集中趋势的指标有众数、中位数、平均数。(1)众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。(2)中位数是一组数据排序后处于中间位置上的变量值。中位数主要用于测度顺序数据的集中趋势,当然也适用于测度数值型数据的集中趋势,但不适用于分类数据。(3)平均数也称为均值,它是一组数据相加后除以数据的个数得到的值。平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。2简述时间序列分析的预测程序。答:时间序列分析的一个主要目的就是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性等。对于一个具体的时间序列,它可能只含有一种成分,也可能同时含有几种成分。含有不同成分的时间序列所用的预测方法是不同的。因此,在对时间序列进行预测时,通常包括以下几个步骤:第1步:确定时间序列所包含的成分,也就是确定时间序列的类型;第2步:找出适合此类时间序列的预测方法;第3步:对可能的预测方法进行评估,以确定最佳预测方案;第4步:利用最佳预测方案进行预测。3什么是统计学?它的研究对象和性质是什么?答:(1)统计学的概念统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。(2)统计学的研究对象和性质一般来说,统计学的研究对象是自然、社会客观现象总体的数量关系。统计学研究对象的性质有如下几点:数量性数量性是统计学研究对象的基本特点,因为数字是统计的语言,数据资料是统计的原料。一切客观事物都有质和量两个方面,事物的质与量总是密切联系、共同规定着事物的性质。总体性统计的数量研究是对总体普遍存在着的事实进行大量观察和综合分析,得出反映现象总体的数量特征和资料规律性。对于每个个体来说,具有一定的随机性质,而对于有足够多个体的总体来说又具有相对稳定的共同趋势,显示出一定的规律性。(3)具体性统计研究对象是自然、社会经济领域中具体现象的数量方面。即它不是纯数量的研究,是具有明确的现实含义的。统计学研究的数量是客观存在的、具体实在的数量表现。(4)变异性统计研究对象的变异性是指构成统计研究对象的总体各单位,除了在某一方面必须是同质的以外,在其他方面又要有差异,而且这些差异并不是由某种特定的原因事先给定的。4设A、B工厂的产品次品率分别为1%和2%,现在从由工厂A和工厂B的产品分别占60%和40%的产品中随机抽取一件,发现是次品,则该次品属于工厂A生产的概率为多少?答:设事件A表示“产品来自于A工厂”,事件B表示“产品来自于B工厂”,事件C表示“随机抽取的产品是次品”,根据题意有P(C|A)1%,P(C|B)2%,P(A)60%,P(B)40%,根据贝叶斯公式有:故该次品属于工厂A生产的概率为3/7。三、计算和分析题(共3题,1、2题每题20分,第3题10分,共50分)1已知某厂某天生产的工人加工的零件的数据如下表。表一某企业工厂工人日产零件数(1)计算众数、中位数(6分)(2)计算平均数和标准差(8分)(3)对工人加工零件的分布进行综合分析(6分)解:(1)众数是一组数据中出现次数最多的变量值,用Mo表示。由表一可看出,日产零件数为23件的工人数最多,为27人。故众数为23。中位数是将总体各个单位按其标志值的大顺序排列,处于数列中点的那个单位的标志值,用Me表示。本题是单项式分组,已经将资料的标志值序列化,确定中位数位置的方法要通过累计次数计算。310142740,31014275440,故中位数应该是工人数为27所对应的日产零件数,为23。(2)本题的数据已经分组,并已知次数分布的条件。此时计算平均数需先将各组标志值乘以相应的次数,求得各组的标志总量。计算公式为:式中fi为各组标志值出现的次数。代入数据计算得:x(1732010268)/801820/8022.75分组情况下标准差的计算公式为:代入数据计算得(3)集中趋势根据结果可知,xMeMo,说明数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,即数据是左偏分布的。离散程度根据结果可知,工人加工零件的标
展开阅读全文