1、目录2017年华中农业大学理学院432统计学专业硕士考研真题2016年华中农业大学理学院432统计学专业硕士考研真题2015年华中农业大学理学院432统计学专业硕士考研真题2015年华中农业大学理学院432统计学专业硕士考研真题及详解2017年华中农业大学理学院432统计学专业硕士考研真题2016年华中农业大学理学院432统计学专业硕士考研真题2015年华中农业大学理学院432统计学专业硕士考研真题2015年华中农业大学理学院432统计学专业硕士考研真题及详解一、单项选择题(本题包括l-25题共25个小题,每小题2分,共50分。在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填
2、在答题纸上)。1设A、B是概率不为0的不相容事件,下列结论中正确的是()。A与相容B与不相容CP(AB)P(A)P(B)DP(AB)P(B)【答案】D【解析】A与B互不相容,则BAB,即P(BA)P(B)。A项当A与B不对立时成立;B项当A与B对立时成立;互不相容与相互独立不是等价的,C项只有在A与B相互独立时才成立。2甲、乙两人各自独立向指定目标射击一次,命中率分别是0.7和0.8,目标被射中的概率为()。A0.94B0.56C0.7D0.8【答案】A【解析】从对立事件角度出发,目标被射中的对立事件为目标未被射中,甲乙两人均未射中目标的概率等于(10.7)(10.8)0.30.20.06,所
3、以目标被射中的概率为10.060.94。36个乒乓球中有4个新球,第一次比赛时任取两个,用完放回,第2次比赛时又任取两个,第2次取出的2个都是新球的概率为()。ABC0.8D0.4【答案】B【解析】设第一次取出0个新球为事件A0、1个新球为事件A1、2个新球为A2,第二次取出两个球均为新球为事件B,则由条件概率公式:4若函数是某连续随机变量的概率密度函数,则区间a,b为()。A0,1B0,2C1,2D【答案】D【解析】由概率密度函数的性质知则解得0.5(b2a2)1,故只有D项符合条件。5设E(X)D(X)1,则随机变量X不可能服从的分布为()。A二项分布B泊松分布C指数分布D正态分布【答案】
4、A【解析】二项分布E(X)np,D(X)np(1p),其中0p1,1p1,所以E(X)D(X)1不可能成立,即随机变量X不可能服从二项分布。6设总体,是来自总体的简单随机样本,为样本平均,则下列结果中正确的是()。ABCD【答案】B【解析】设XN(,2),根据一般正态分布转化为标准正态分布的公式得7若Y4X3N(3,22),则X服从的分布为()。AXN(9,82)BXN(9,162)CXN(1.5,0.52)DXN(1.5,0.252)【答案】C【解析】由Y4X3得X0.25(Y3),由于正态变量经过线性变换得到的变量仍服从正态分布,则X仍服从正态分布,且E(X)E0.25(Y3)1.5,D0
5、.25(Y3)0.25,则8设随机变量X,Y的方差都存在,若D(XY)D(XY),则()。AX与Y不相关BD(X)D(Y)0CX与Y相互独立DD(Y)0【答案】A【解析】由D(XY)D(XY)得COV(X,Y)0,所以X与Y不相关,但是不相关与相互独立不等价,只有当X与Y均服从正态分布时,X与Y才相互独立。9设(X,Y)是二维随机变量,方差D(X)4,D(Y)1,相关系数0.6,则方差D(3X2y)为()。A35.4B17.6C45.2D25.6【答案】D【解析】由方差的计算公式得:D(3X2Y)9D(X)4D(Y)232Cov(X,Y)944121.225.6。10设随机变量服从二项分布,下
6、列描述中,不正确的是()。A对任意的,B对任意的,C对任意区间,D若独立且服从同一分布则结论(B)可改为【答案】B【解析】由棣莫弗-拉普拉斯知,正态分布是二项分布的极限分布,当充分大时,可以利用正态分布概率来计算二项分布的概率。即对任意11下列哪种分类结果属于非顺序数据()。A产品质量按等级分类B人口按男女性别分类C考核结果按优秀、良好、合格、不合格分类D学历按小学、初中、高中、大专、本科、硕士及以上分类【答案】B【解析】顺序数据是只能归于某一有序类别的非数字型数据,顺序数据虽然也是类别,但这些类别是有序的。ACD三项均属于顺序数据。B项,人口按男女性别分类只能归于某一类别,属于分类数据。12
7、为调查微积分课程学习情况,从186个教学班中抽取35个班,对所抽班级学生的微积分考试成绩进行分析,这种抽样方法属于()。A简单随机抽样B分层抽样C系统抽样D整群抽样【答案】D【解析】整群抽样是将总体中若干个单位合并为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查的抽样方法。题中,从186个班中抽取35个班并对所有学生进行调查,这种抽样方法属于整群抽样。1315位同学的某门课程考试成绩中,70分出现3次,80分出现4次,85分出现6次,90分出现2次,则他们成绩的众数为()。A80B85C81.3D90【答案】B【解析】众数是一组数据中出现次数最多的变量值。题中,85分出现次数最多,
8、故成绩的众数为85分。141000名学生参加某课程的考试,平均成绩是82分,标准差是8分,从学生中随机抽取l 00个同学作为样本,则样本均值的数学期望和抽样分布的标准差分别为()。A82,8B82,0.8C82,64D86,1【答案】B【解析】由中心极限定理得,在大样本条件下,样本均值的抽样分布近似服从均值为方差为的正态分布。故该样本均值的数学期望为82,标准差为8/100.8。15设总体X服从正态分布,其中已知,2未知,为其样本,n2,则下列式子中为统计量的是()。ABCD【答案】D【解析】设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn)
9、,不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量。由于方差未知,所以ABC三项均不可称为统计量。16关于总体参数的置信水平为95%的置信区间,下列描述中正确的是()。A取样计算获得的一个具体的置信区间将以95%的概率包含B取样计算获得的一个具体的置信区间将以5%的概率包含C任何一个具体的置信区间绝对包含D若重复取样计算获得l 00个置信区间,其中大约95个包含【答案】D【解析】对于置信水平为95%的置信区间的理解为:用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联
10、系的一定置信水平下的置信区间由于总体参数的真值是固定的未知的,取样所构造的置信区间要么包含要么不包含总体均值。17对正态总体的数学期望进行假设检验,若在显著水平0.05下接受H0:0,那么在显著水平0.01下,下列结论正确的是()。A可能接受假设,也可能拒绝假设B拒绝假设C接受假设D不接受假设,也不拒绝假设【答案】C【解析】在显著性水平0.05下接受H0,说明根据样本计算的结果p值大于0.05,所以同样的样本在显著性水平0.01下,p值大于0.01,所以接受原假设。18原假设为H0,备择假设是H1,犯第一类错误是指()。AH0不真,接受H0BH0为真,接受H1CH0不真,接受H1DH0为真,接
11、受H0【答案】B【解析】假设检验中的第一类错误又称弃真错误,是指原假设H0为真却被拒绝了,即H0为真,接受H1。19下面关于方差分析及其基本假定的描述中,不正确的是()。A检验多个总体均值是否相等的统计方法称为方差分析B各总体都服从正态分布C各总体的方差相等D观测值不必是独立的【答案】D【解析】方差分析中的基本假定:每个总体都应服从正态分布;各个总体的方差必须相同;观测值是独立的。20在方差分析中,数据的误差是用平方和来表示的,其中组内平方和反映的是()。A随机误差的大小B全部观测值误差的大小C不同水平的样本均值之间误差大小D各个样本方差之间误差的大小【答案】A【解析】组内平方和是每个水平或组
12、的各样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况,该平方和反映了随机误差的大小。21下列关于相关系数的描述中,不正确的是()。A相关系数是反映两个变量之间线性关系的度量B相关系数具有对称性C计量尺度改变不影响相关系数D相关系数是两个变量间因果关系的度量【答案】D【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,相关系数具有以下的特点:r的取值范围是1,1;r具有对称性;改变x和y的数据原点及计量尺度,不改变r的数值大小;r是两个变量之间线性关系的一个度量,不意味着x与y一定有因果关系。22设一元线性回归模型的估计形式为下列描述中错误的是()。Ax是
13、随机变量Bx是自变量而非随机变量C是随机变量,且D 是随机变量,且【答案】A【解析】一元线性回归模型的假定有:因变量y与自变量x之间具有线性关系;在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。23多元线性回归分析中,如果F检验表明线性关系显著,则意味着()。A至少有一个自变量与因变量之间的线性相关系著B所有的自变量与因变量之间的线性关系都显著C至少有一个自变量与因变量之间的线性关系不显著D所有的自变量与因变量之间的线性关系都不显著【答案】A【解析】线性关系F检验主要是检验因变量同多个自变量的线性关系是否显著,在k个自变量中,只要有一个自变量与因变量的线性关系显著,F检验就能通过,但
14、这不一定意味着每个自变量与因变量的关系都显著。24以样本统计量估计总体参数时,要求估计量的数学期望等于被估计的总体参数,这一数学性质称为()。A无偏性B有效性C一致性D期望性【答案】A【解析】无偏性是指估计量抽样分布的数学期望等于被估计的总体参数;有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效;一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。25多元线性回归分析中,t检验是用来检验()A总体线性关系的显著性B各回归系数的显著性C样本线性关系的显著性D【答案】B【解析】一元线性回归中,线性关系的检验(F检验)与回归系数的检验(t检验)是等价的,在多元回归中
15、,这两种检验不再等价回归系数检验则是对每个回归系数分别进行单独的检验,t检验主要用于检验每个自变量对因变量的影响是否都显著。二、简要回答下列问题(本题包括l8题共8个小题,每小题5分,共40分。)1简述互不相容事件、对立事件及其区别。答:(1)互不相容事件和对立事件的定义互不相容事件又叫互斥事件,指两个事件不能同时发生,即事件A和B的交集为空。对立事件指事件A与事件B必有一个发生且只有一个发生。(2)互不相容事件和对立事件的区别互补相容事件和互斥事件的区别主要是:对立事件是互斥事件的特例,所以对立事件一定事互斥事件;但互斥事件不一定是对立事件,当且仅当两个互斥事件必有一个发生时,它们同时又是对
16、立事件。2简述一维随机变量分布函数的性质。答:一维随机变量分布函数主要分为离散型随机变量函数的分布和连续型随机变量函数的分布两种。具有如下三条基本性质:(1)单调性是单调非减函数,即对任意的;(2)有界性对任意的x,有且(3)右连续性是x的右连续函数,即对任意的,有即3什么是二维随机变量(X,Y)的边缘分布?就离散型说明如何由联合分布计算边缘分布。答:(1)边缘分布函数若二维随机变量(X,Y)的联合分布函数为F(x,y),则称为X的边缘分布;称为Y的边缘分布。(2)离散型随机变量边缘分布计算对于二位离散型随机变量(X,Y),设X和Y的联合分布函数为:则(X,Y)关于X的边缘分布为:(X,Y)关
17、于Y的边缘分布为:4在测量一物体长度时,一般采用多次测量结果的平均值作为长度的估计值。试用重复独立实验(随机变量序列)的数字特征给出合理的解释。答:设在相同条件下对某一物理量x进行n次重复独立测量,其测量值分别为。各次测量的随机误差为将随机误差相加即用 表示测量值的算术平均值故有根据随机误差的抵偿特征,即于是。5简述统计总体和总体单位及其关系。答:(1)统计总体和总体单位的概念统计总体统计总体是根据一定的目的和要求,统计所需要研究的客观事物的全体,简称总体。总体必须具备大量性、同质性、变异性三个特性。统计总体可以分为自然总体和测量总体。所谓自然总体就是由客观存在的具有相同性质的许多个别事物构成
18、的整体;自然总体中的个体通常都具有多种属性,我们把个体所具有某种共同那个属性的数值的整体称为一个测量总体。总体单位总体单位是组成总体的每一个事物,简称个体;总体单位是各项统计数字最原始的承担者。(2)统计总体和总体单位的关系总体和总体单位是相对而言的。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系。总体和总体单位是可以相互转化的。随着统计研究目的及范围的变化,统计总体和总体单位可以相互转化,同一事物在不同情况下,可以作为总体,也可以作为总体单位。6简述极大似然法的基本思想。答:极大似然法,又称为最大似然法,是一种概率论在统计学的应用,
19、它是参数估计的方法之一。极大似然估计的思想为:已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。若已知某个参数能使这个样本出现的概率最大,则不会再去选择其他小概率的样本,所以将此参数作为估计的真实值。求极大似然函数估计值的一般步骤为:(1)写出似然函数;(2)对似然函数取对数,并整理;(3)求导数;(4)解似然方程得到极大似然估计值。7什么是P值,利用P值和利用统计量检验有什么不同?答:P值是当原假设为真时所得到的样本观察结果或更极端结果出现的概率,即观察到的(实例的)显著性水平,是拒绝原假设的最小显著性水平。一般以P
20、0.05为显著,P0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。利用P值和利用统计量检验的不同点在于:(1)利用统计量检验,是根据已知的显著性水平,确定相应的拒绝域,然后将样本统计量与拒绝域比较进行决策。其好处是进行决策的界限清晰,但进行决策面临的风险是笼统的。(2)利用P值进行决策,是将检验统计量对应的P值与显著性水平比较进行决策。其长处是它反映了观察到的实际数据与原假设之间不一致的概率值,与传统的拒绝域范围相比,P值提供了更多的信息,精确地反映决策的风险度。8简述回归分析的一般过程。答:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析
21、方法,进行回归分析的一般过程为:(1)明确预测的具体目标,确定变量(2)建立预测模型依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程。(3)进行相关分析回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。(4)计算预测误差回归预测模型是否可用于实际预测,取决
22、于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。(5)确定预测值利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。三、计算与分析题(本题包括l6题,共6个小题,每小题10分,共60分。)1一商场销售的某种产品来自甲、乙、丙三家工厂,分别占总量的25%、35%和40%,若三家工厂所生产产品的次品率依次为5%、4%和2%,现从混合后的产品中任取一件,试求:(1)所取产品为次品的概率;(2)若取到的为次品,分别求它来自甲厂、乙厂和丙厂的概率。解:设取得产品为次品为事件B,产品来自甲乙丙三家工厂的概率为A1,A
23、2,A3,则P(A1B)5%,P(A2B)4%,P(A3B)2%;(1)由全概率公式求得所取产品为次品的概率为:P(B)P(BA1)P(BA2)P(BA3)25%5%35%4%40%2%3.45%(2)由贝叶斯公式得:该次品来自甲厂的概率:P(A1B)P(A1B)P(A1)/P(B)0.36;该次品来自乙厂的概率:P(A2B)P(A2B)P(A2)/P(B)0.41;该次品来自丙厂的概率:P(A3B)P(A3B)P(A3)/P(B)0.23。2设连续性随机变量X的分布密度函数为试求:(1)常数K;(2)P(1X3);(3)P(X1)。解:(1)由概率密度性质得:解得k3/8。(2)(3)3设总
24、体X的分布密度为其中0,是未知参数,是来自X的样本,求的极大似然估计量。解:由X的分布密度p(x)构造极大似然函数为:对数极大似然方程为:将该方程对求导,并令导数为零,得:因而,解得的极大似然估计量为:4某企业生产的袋装食品采用自动打包机包装,每袋标准重量为72克。现从某天生产的一批产品中取10包进行检查,测得每包重量(克)如下:67,78,54,68,66,70,70,67,69,65设产品重量服从正态分布,试求(1)该天自动打包机是否工作正常?(0.05,t0.025(9)2.2622);(2)确定该天食品平均重量95%的置信区间。解:由样本数据得:n10,67.4,s5.62。(1)该假
25、设检验问题为:,即该天自动打包机工作正常;,即该天自动打包机工作不正常。由于总体方差未知,故构造t检验统计量如下:由于|t|,故应拒绝原假设,即该天自动打包机工作不正常。(2)该天食品平均重量95%的置信区间为:5设有三台机器,用来生产规格相同的铝合金薄板。取样测量薄板的厚度(厘米),相关数据的分析表如下:假定各机器生产的铝合金薄板服从等方差的正态分布。(1)将方差分析表中的所缺数值补齐;(2)三台机器生产的产品是否有显著的差异?(F0.95(2,12)3.89)。解:(1)补全的方差分析表如下:(2)由于F统计量32.9186,故方差分析检验结果显著,即可以认为三台机器生产的产品有显著的差异
26、。6一家大型商业银行有25家分行,为研究不良贷款(y)与贷款余额(x)之间的关系,搜集到25个分行的相关数据(原始数据单位为亿元),并获得相应的数据分析表(0.05):方差分析表参数估计表(1)将方差分析表中的所缺数值补齐;(2)写出回归方程,并解释回归系数的意义;(3)检验回归方程的线性关系是否显著?(F0.05(4,20)2.87)解:(1)补全的方差分析表如下:方差分析表(2)由参数估计表,可得回归方程如下:y0.8295210.037895x其中,回归系数0.037895表示贷款余额每增加1亿元,不良贷款平均增加0.037895亿元。(3)由方差分析表可看出,F统计量56.7627,且P值1.18349E070.05,故回归方程线性关系检验结果显著。