资源描述
《数量方法(二)》(代码00994)自学考试复习提纲
第一章 数据的整理和描述
⊙基本知识点:
一、 数据的分类:
按照描述的事物分类:
1. 分类型数据:描述的是事物的品质特征,本质表现是文字形式;
2. 数量型数据:事物的数量特征,用数据形式表示;
3. 日期和时间型数据。
按照被描述的对象与时间的关系分类:
1. 截面数据:事物在某一时刻的变化情况,即横向数据;
2. 时间序列数据:事物在一定的时间范围内的变化情况,即纵向数据;
3. 平行数据:是截面数据与时间序列数据的组合。
二、 数据的整理和图表显示:
1. 组距分组法:
1) 将数据按上升顺序排列,找出最大值max和最小值min;
2) 确定组数,计算组距c;
3) 计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi (个数)和频率(),形成频率分布表;
4) 唱票记频数;
5) 算出组频率,组中值;
6) 制表。
2. 饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100%;比例必须于扇形区域的面积比例一致。
3. 条形图:用来对各项信息进行比较。当各项信息的标识(名称)较长时,应当尽量采用条形图。
4. 柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。
5. 折线图:明显表示趋势的图示方法。简单、容易理解,对于同一组数据具有唯一性。
6. 曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。
7. 散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。
8. 茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观的显示出了数据的分布。
三、 数据集中趋势的度量:
1. 平均数:容易理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”;缺点是它对极端值十分敏感。
平均数=
2. 中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。
3. 众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。
4. 分组数据的平均数(加权平均):
,为组数,vi为第i组频数,yi为第i组组中值。
5.平均数,中位数和众数的关系:
数据分布是对称分部时:众数=中位数=平均数
数据分布不是对称分部时:左偏分布时:众数<中位数<平均数
右偏分布时:众数>中位数>平均数
四、 数据离散趋势的度量:
1. 极差R=最大值max-最小值min
2. 四分位点:第二四分位点就是整个数据集的中位数;第一四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个的平均);第三四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个的平均)。四分位极差=-,它不像极差R那么容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息地缺点。
3. 方差:离平均数地集中位置地远近;
是频数,是组中值,即数据的个数,即用分组数据计算的平均数。
4. 标准差:。
变异系数:表示数据相对于其平均数的分散程度。
⊙基本运算方法:
1、一组数据3,4,5,5,6,7,8,9,10中的中位数是( )
A.5 B.5.5
C.6 D.6.5
解析:按从小到大排列,此九个数中,正中间的是6,从而答案为C。
2、某企业30岁以下职工占25%,月平均工资为800元;30—45岁职工占50%,
月平均工资为1000元;45岁以上职工占25%,月平均工资1100元,该企业全
部职工的月平均工资为( )
A.950元 B.967元
C.975元 D.1000元
解析:25%*800+50%*1000+25%*1100=975,故选C。
3、有一组数据的平均数和标准差分别为50、25,这组数据的变异系数为( )
A.0.2 B.0.4
C.0.5 D.0.7
解析:变异系数=,故选C。
4、若两组数据的平均值相差较大,比较它们的离散程度应采用( )
A.极差 B.变异系数
C.方差 D.标准差
解析:考变异系数的用法,先B。
5、一组数据4,4,5,5,6,6,7,7,7,9,10中的众数是( )
A.6 B.6.5 C.7 D.7.5
解析:出现最多的数为众数,故选C。
6、对于峰值偏向左边的单峰非对称直方图,一般来说( )
A.平均数>中位数>众数 B.众数>中位数>平均数
C.平均数>众数>中位数 D.中位数>众数>平均数
解析:数据分布是对称分部时: 众数=中位数=平均数
数据分布不是对称分部时:左偏分布时:众数<中位数<平均数
右偏分布时:众数>中位数>平均数
需要记住提,峰值偏向左边的单峰非对称直方图称为右偏分布,峰值偏向右边的单峰非对称直方图称为左偏分布,从而此题答案为B。
第二章 随机事件及其概率
⊙基本知识点:
一、 随机试验与随机事件:
1. 随机试验:
a) 可以在相同的条件下重复进行;
b) 每次试验的可能结果可能不止一个,但是试验的所有可能的结果在试验之前是确切知道的;
c) 试验结束之前,不能确定该次试验的确切结果。
2. 样本空间:
a) 所有基本事件的全体所组成的集合称为样本空间,是必然时间;
b) 样本空间中每一个基本事件称为一个样本点;
c) 每一个随机事件就是若干样本点组成的集合,即随机事件是样本空间的子集;
d) 不包含任何样本点的随机事件就是不可能事件。
3. 样本空间的表示方法:
a) 列举法:如掷骰子
b) 描述法:若掷骰子出现可描述为:掷骰子出现奇数点。
二、 事件的关系和运算
1. 事件的关系:
a) 包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必然导致事件B的发生,成为事件B包含事件A,记做。若则称事件A与事件B相等,记做A=B。
b) 事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并,记做。
c) 事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做。
d) 互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。。
e) 对立事件:一个事件B若与事件A互斥,且它与事件A的并是整个样本空间Ω,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是,。
f) 事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做A-B。
2.运算律:
a) 交换律:
b) 结合律:
c) 分配律:
:
d) 对偶律:。
三、 事件的概率与古典概型:
1. 事件A发生的频率的稳定值 称为事件A发生的概率,记做:,。
2. 概率的性质:
a) 非负性:;
b) 规范性:;
c) 完全可加性:;
d) ;
e) 设A,B为两个事件,若,则有,且;
3. 古典概型试验与古典概率计算:
a) 古典概型试验是满足以下条件地随机试验:
① 它的样本空间只包含有限个样本点;
① 每个样本点的发生是等可能的。
b) 古典概率的计算:;
c) 两个基本原理:
① 加法原理:假如做一件事情有两类办法,在第一类办法中有m种不同方法,而在第二类办法中有n种不同方法,那么完成这件事情就有m+n种不同方法。加法原理可以推广到有多类办法的情况;
① 乘法原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。乘法原理也可以推广到多个步骤的情形。
4. 条件概率:在事件B发生的条件下(假定P(B)>0),事件A发生的概率称为事件A在给定事件B下的条件概率,简称A对B的条件概率,记做:;
5. 概率公式:
a) 互逆:对于任意的事件A,;
b) 广义加法公式:对于任意的两个事件A和B,
,
广义加法公式可以推广到任意有限个事件的并的情形,特别地:
c) 减法公式:
——→;
d) 乘法公式:P(AB)=P(A)P(B|A),P(A)≠0;
e) 事件独立:若,则相互独立。
f) 全概率公式:设事件A1,A2,…, An两两互斥,A1+A2+……+An=Ω(完备事件组),且P(Ai)>0,i=1,2,…,n则对于任意事件B,有:
;
g) 贝叶斯公式:条件同上, 则对于任意事件B,如果P(B)>0,有:
;
⊙基本运算方法:
1、事件的表示:
例1、设A、B、C是三个随机事件,用A、B、C的运算关系表示事件:A不发生但B与C发生为( )
A. B.
C. D.
解析:本题考察事件的表示方法,选B。
例2、对随机事件A、B、C,用E表示事件:A、B、C三个事件中至少有一个事件发生,则E可表示为( )
A.AUBUC B.Ω-ABC
C. D.
解析:选A。
2、古典概型
例1、正方体骰子六个面点数分别为2、4、6、8、10、12,掷二次所得点数之和大于等于4的概率为( )
A. B.
C. D.1
解析:样本空间中样本点一共有36个,两次掷得点数和不可能小于4,从而选D。
例2、在一次抛硬币的试验中,小王连续抛了3次,则全部是正面向上的概率为
( )
A. B.
C. D.
解析:样本空间一共有8个样本点,全部正面向上只有一次,故选B。
例3、某夫妇按国家规定,可以生两胎。如果他们每胎只生一个孩子,则两胎全
是女孩的概率为( )
A. B.
C. D.
解析:生两胎,样本空间共有4个样本点,故选C。
3、加法公式、减法公式、条件概率
例1、设A、B为两个事件,P(A)=0.4,P(B)=0.3。如果BÌA,则P(AB)=( )
A.0.1 B.0.3
C.0.4 D.0.7
解析:BÌA,则P(AB)=P(B),故选B。
例2、设A、B为两个事件,P(A)=0.4,P(B)=0.8,P()=0.5,则P(B│A)=( )
A.0.45 B.0.55
C.0.65 D.0.375
解析:由P()=P(B)-P(),从而P()=0.3,P(B│A)= =0.375,
故选D。
例3、事件和B相互独立,且P()=0.7,P(B)=0.4,则P(AB)=( )
A.0.12 B.0.21
C.0.28 D.0.42
解析:事件和B相互独立知事件A与B独立,从而P(AB)=P(A)P(B)=0.12,A。
例4、事件A,B相互独立,P(A)=0.3,P(B|)=0.6,则P(A)+P(B)=( )
A.0. B.0.3
C.0.9 D.1
解析:由事件A,B相互独立知P(B|)= P(B)=0.6,从而选C。
4、事件的互斥、对立、独立关系:
例1、A与B为互斥事件,则A为( )
A.AB B.B
C.A D.A+B
解析:A与B为互斥事件,即AB,从而选C。
例2、事件A、B相互对立,P(A)=0. 3,P(B)=0.7,则P(A-B)=( )
A.0 B.0.2
C.0.3 D.1
解析:由事件A、B相互对立知AB,从而P(A-B)=P(A)=0.3,选C。
例3、事件A、B相互独立,P(A)=0.2,P(B)=0.4,则P(A+B)=( )
A.0.50 B.0.51
C.0.52 D.0.53
解析:P(A+B)=P(A)+P(B)-P(AB),由A、B相互独立知P(AB)=P(A)P(B),从而
P(A+B)=P(A)+P(B)- P(A)P(B)=0.52,选C。
例4、事件A、B互斥,P(A)=0.3,P(B|)=0.6,则P(A-B)=( )
A.0 B.0.3
C.0.9 D.1
解析:事件A、B互斥有AB,从而P(A-B)=P(A)-P(AB)=P(A)=0.3,选B。
5、全概率公式和贝叶斯公式:
例1、在厂家送检的三箱玻璃杯中,质检部门抽检其中任一箱的概率相同。已知第一箱的次品率为0.01,第二箱的次品率为0.02,三箱玻璃杯总的次品率为0.02。求第三箱的次品率。若从三箱中任抽一只是次品,求这个次品在第一箱中的概率。
解析:设表示抽到第箱,=1,2,3. B表示次品,则
,,
,从而,即第三箱的次品率为0.03.
即从三箱中任抽一只是次品,这个次品在第一箱中的概率为1/6。
例2、实战演习中,在甲、乙、丙三处射击的概率分别为0.2,0.7,0.1,而在甲、乙、丙三处射击时命中目标的概率分别为0.8,0.4,0.6。若最终目标被命中,求目标是由乙处射击命中的概率。
解析:设表示在甲处射击,表示在乙处射击,表示在丙处射击,B表示命中,则,
,,
从而目标是由乙处射击命中的概率为0.56.
第三章 随机变量及其分布
⊙基本知识点:
一、 离散型随机变量:取值可以逐个列出
1. 数学期望:
1) 定义:,以概率为权数的加权平均数;
2) 性质:E(C) =C (常数期望是本身)
E(aX) =aE(X) (常数因子提出来)
E(aX+b) =aE(X)+b (一项一项分开算)
E(aX+bY)=aE(X)+bE(Y) (线性性)
2. 方差:
1) 定义:;
2) 性质:D(c) =0 (常数方差等于0)
D(aX) =a2D(X) (常数因子平方提)
D (aX+b) =a2D(X)
3) 公式:(方差=平方的期望-期望的平方);
3. 常用随机变量:
1) 0-1分布:
a) 随机变量X只能取0,1这两个值;
b) X~B(1,p);
c) E(X)=p D(X)=p(1-p)
2) 二项分布:
a) 分布律:;
b) X~B(n,p)
c) E(X)=np
d) D(X)=np(1-p)
e) 适用:随机试验具有两个可能的结果A或者,且P(A)=p,
P()=1-p,将试验独立重复n次得到n重贝努里试验。
3) 泊松分布:
a) 分布律:,λ>0
b) X~P(λ)
c) E(X)=λ
d) D(X)=λ
e) 适用:指定时间内某事件发生的次数。
二、 连续型随机变量:
1. 设X是一个连续型随机变量:
1) X的均值,记做μ,就是X的数学期望,即 μ=EX;
2) X的方差,记做D(X)或,是的数学期望,即:
3) X的标准差,记做σ,是X的方差的算术平方根,即;
2. 常用连续型随机变量:
名称
分布律或密度
记法
E(X)
D(X)
均匀分布
指数分布
,λ>0
正态分布
μ
标准正态分布
X~N(0,1)
0
1
3. 正态分布的密度曲线y=P(x)是一条关于直线x=μ的对称的钟形曲线,在x=μ处最高,两侧迅速下降,无限接近X轴;σ越大(小),曲线越矮胖(高瘦)。
4. 标准正态分布的密度曲线y=φ(x),是关于Y轴对称的钟形曲线。
5. 随机变量的标准化 (减去期望除标差)。
6. 标准化定理:设。
三、 二维随机变量:
1. 用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。
2. X,Y的协方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E (XY)-EXEY,cov(X,Y)>0说明X与Y之间存在一定程度的正相关关系,cov(X,Y)=0称X与Y不相关,cov(X,Y)<0说明X与Y存在一定程度的负相关关系;
3. X,Y的相关系数:,取值范围是,越接近1,表明X与Y之间的正线性相关程度越强,越接近于-1,表明X与Y之间的负线性相关程度越弱,当等于0时,X与Y不相关。
4. 随机变量的线性组合:
1) E(aX+bY)=aE(X)+bE(Y);
2)
四、 决策准则与决策树:
1. 对不确定的因素进行估计,从几个方案中选择一个,这个过程称为决策;
2. 决策三准则:
1) 极大极小原则:将各种方案的最坏结果(极小收益)进行比较,从中选择极小收益最大的方案;
2) 最小期望损失原则:选择期望损失最小的方案;
3) 最大期望收益原则:选择期望收益最大的方案。
3. 决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。
⊙基本运算方法:
1、随机变量的含义:
例1、某一事件出现的概率为1/4,试验4次,该事件出现的次数将是( )
A.1次 B.大于1次
C.小于1次 D.上述结果均有可能
解析:答案为D,此题考察对随机变量的理解。
2、六种常见分布
例1、某企业出厂产品200个装一盒,产品分为合格与不合格两类,合格率为99%,
设每盒中的不合格产品数为X,则X通常服从( )
A.正态分布 B.泊松分布
C.均匀分布 D.二项分布
解析:将任一个合格品记为0,不合格记为1,则X~B(200,0.01),选D。
例2、一般正态分布N(μ,σ2)的概率分布函数F(x)转换为标准正态分布N(0,1)的概率分布函数时表示为( )
A.Φ(x) B.Φ
C.Φ(x-μ) D.Φ
解析:本题考察正态分布的标准化,选B.
例3、掷一枚不均匀硬币,正面朝上的概率为,将此硬币连掷3次,则恰好2
次正面朝上的概率是( )
A. B.
C. D.
解析:记X表示正面向上的次数,则X~B(3,),, C。
例4、若随机变量X服从正态分布,则随机变量Y=aX+b(a≠0)服从( )
A.正态分布 B.二项分布
C.泊松分布 D.指数分布
解析:本题考察正态分布的线性组合仍为正态分布,选A。
例5、某电梯一星期发生故障的次数通常服从( )
A.两点分布 B.均匀分布
C.指数分布 D.泊松分布
解析:选D,泊松分布描述不常发生的事情。
例6、一个服从二项分布的随机变量,其方差与期望之比为1/3,则该二项分布的参数P为( )
A.1/3 B.2/3
C.1 D.3
解析:此题考察二项分布的方差与期望,,从而选B。
例7、设随机变量X的概率密度函数为(x)=(-)则X的
方差D(X)=( )
A.1 B.2
C.3 D.4
解析:此题考察正态分布的密度函数,选D。
例8、随机变量X分布律为P(x=k)=,k=0,1,2,3,…则X的方差D(X)=( )
A.0.4 B.2
C.2.5 D.3
解析:此题考察泊松分布的方差,选A。
例9、据调查,某单位男性员工中吸烟者的比例为20%,在一个由10人组成的该单位男性员工的随机样本中,恰有3人吸烟的概率是多少?
解析:设X表示10人中抽烟的人数,则X~B(10, 0.2),从而
(自行用计算器计算出概率)。
例10、某零件的寿命服从均值为1200小时,标准差为250小时的正态分布。随机地抽取一个零件,求它的寿命不低于1300小时的概率。((0.3)=0.6179, (0.4)=0.6554, (0.5)=0.6915)
解析:设某零件的寿命为X,则X~N(1200, ),从而
=1- (0.4)=0.3446
3、随机变量期望、方差及协方差的运算和性质:
例1、设X和Y为两个随机变量,D(X)=10,D(Y)=1,X与Y的协方差为-3,
则D(2X-Y)为( )
A.18 B.24
C.38 D.53
解析:由知,答案为D。
例2、设X和Y是两个相互独立的随机变量,已知D(X)=60,D(Y)=80,则
Z=2X-3Y+7的方差为( )
A.100 B.960
C.1007 D.1207
解析:由于常数方差为0,且由X和Y独立知其协方差为0,从而由公式
知答案为B。
例3、设X为随机变量,E(X)=2,D(X)= 6,则E(X2)为( )
A.5 B.10
C.20 D.30
解析:由方差的等价定义:D(X)=E(X2)-E2 (X)知,答案为B。
例4、若已知,则X与y相关系数r为
A.0.2 B.0.6
C.0.7 D.0.8
解析:由相关系数计算公式知答案为C。
例5、设X、Y为随机变量,D(X)=6,D(Y)=7,Cov(X,Y)=1,试计算D(2X-3Y).
解析:由知
D(2X-3Y)=4D(X)-12Cov(X,Y)+9D(Y)=75。
4、概率分布、密度函数:
例1、离散型随机变量X只取-1,0,2三个值,已知它取各个值的概率不相等,且三个概率值组成一个等差数列,设P(X=0)=α,则α=( )
A.1/4 B.1/3
C.1/2 D.1
解析:由于三者成等差数列,故设X取-1的概率为α-d, 取2的概率为α+d,而三者相加为1,从而α=1/3,答案为B。
例2、设随机变量X的概率密度函数为P(x)=则x的数学期望E(X)=( )
A.1 B.1.25
C.1.5 D.2
解析:显然,从概率密度函数知X~U(1,1.5),从而期望为1.25,答案为B。
第四章 抽样方法与抽样分布
⊙基本知识点:
一、 抽样基本概念:
1. 总体:研究对象的全体;
2. 个体:组成总体的每一个个体;
3. 抽样:从总体中抽取一部分个体的过程;
4. 样本:从总体中抽出的一部分个体构成的集合;
5. 样本值:在一次试验或观察以后得到一组确定的值;
6. 随机样本:
1) 个体被抽到的可能性相同;
2) 相互独立;
3) 同分布。
二、 抽样方法:
1. 简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得所有可能的样本都有同样的机会被抽中。有放回抽样的样本个数为;无放回抽样的样本个数为。
2. 系统抽样(等距抽样):将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔一定的间距抽取样本单元。
3. 分层抽样:在抽样之前将总体划分为互不交叉重叠的若干层,然后从各个层中独立地抽取一定数量的单元作为样本。
4. 整群抽样:在总体中由若干个总体单元自然或人为地组成的群体称为群,抽样时以群体为抽样单位,对抽中的各群的所有总体单元进行观察。
三、 抽样中经常遇到的三个问题:
1. 抽样选取不当;
2. 无回答:
处理无回答常用的方法:
1) 注意调查问卷的设计和加强调查员的培训;
2) 进行多次访问;
3) 替换无回答的样本单元;
4) 对存在无回答的结果进行调整。
3. 抽样本身的误差。
四、 抽样分布与中心极限定理:
1. 不包含任何未知参数的样本函数称作统计量;
2. 常用的统计量:
1) 样本均值:;
2) 样本方差:;
3) 样本标差:。
3. 统计量的分布叫做抽样分布,当样本容量n增大时,不论原来的总体是否服从正态分布,其样本均值都将趋向于正态分布,当n≥30时,样本均值就可以近似的服从正态分布。
4. 中心极限定理:
设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,;==μ;
1) 设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,,则;;
2) 设随机变量X1,X2,……Xn独立同(0,1)分布,则,且。
五、 常用的抽样分布
1. 样本均值的抽样分布:
总体均值、方差
抽样方式
样本的期望
样本方差
有限总体
重复抽样
μ
有限总体
不重复抽样
μ
无限总体
任意
μ
若有限总体不重复抽样<5%时,其修正系数近似为1,样本均值的方差可以简化为。
2. 样本比例的抽样分布:
总体比例
抽样方法
EP
DP
无限总体
任意
有限总体
有放回抽样
有限总体
无放回抽样
若有限总体无放回抽样<5%时,其修正系数近似为1,样本比例的方差可以简化为。
六、 三种小样本的抽样分布:
名称
统计量
记法
上α分位点
χ2分布
χ1,χ2……χn分布
χ2~χ2(n)
分布
X~N(0,1),Y~χ2(n)
X,Y相互独立
F分布
,
U,V相互独立,
七、 几种重要统计量的分布:
设X~N(μ,σ2),X1,X2,……Xn是X的样本,样本均值,样本方差:
1. 分布:
;
2. χ2分布:;
3. 设X1,X2,……Xn是的样本,Y1,Y2,……Yn是的样本,并且都相互独立,则:
;;
⊙基本运算方法:
1、基本概念及抽样方法:
例1、如果抽选10人作样本,在体重50公斤以下的人中随机抽选2人,50~65
公斤的人中随机选5人,65公斤以上的人中随机选3人,这种抽样方法称作( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.整群抽样
解析:本题考察概率抽样方法的分类,答案为C。
例2、将总体单元按某种顺序排列,按照规则确定一个随机起点,然后每隔一定的
间隔逐个抽取样本单元。这种抽选方法称为( )
A.系统抽样 B.简单随机抽样
C.分层抽样 D.整群抽样
解析:本题考察概率抽样方法的分类,答案为A。
2、抽样分布与中心极限定理:
例1、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量
的增大,样本均值将逐渐趋向于( )
A.泊松分布 B.分布
C.F分布 D.正态分布
解析:本题考察中心极限定理,答案为D。
例2、在简单随机抽样中,如果将样本容量增加9倍,则样本均值抽样分布的标
准误差将变为原来的( )
A.1/9倍 B.1/3倍
C.3倍 D.9倍
解析:由于D()=, 从而标准误差为,答案为B。
例3、对于容量为N的总体进行不重复抽样(样本容量为n),样本均值的方差为( )
A. B.
C. D.
解析:本题考察样本均值的抽样分布,答案为A。
例4、设X1,X2,…,Xn是从正态总体N(μ,σ2)中抽得的简单随机样本,
其中μ已知,σ2未知,n≥2,则下列说法中正确的是( )
A.是统计量 B.是统计量
C.是统计量 D.是统计量
解析:本题考察的是统计量的概念,不能含有未知参数,故答案为D。
例5、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量的增大,样本均值逐渐趋向正态分布,这一结论是( )
A.抽样原理 B.假设检验原理
C.估计原理 D.中心极限定理
解析:本题考察的是中心极限定理的内容,答案为D。
3、三种小样本分布与几种重要统计量的分布
例1、从总体X~N()中抽取样本,……,计算样本均值,
样本方差,当n<30时,随机变量服从( )
A.分布 B.F分布
C.t分布 D.标准正态分布
解析:本题考察的是几种重要统计量的分布中的t分布,答案为C。
例2、从总体X~N()中重复抽取容量为n的样本,则样本均值标准差为( )
A. B.
C. D.
解析:本题考察的仍然是样本均值的抽样分布,由D()=知答案为D。
第五章 参数估计
⊙基本知识点:
一、 参数估计
1. 参数点的估计:设总体分布中含有未知参数θ,从总体中抽取一个样本X1,X2,……Xn,用来估计未知参数θ的统计量(X1,X2,……Xn)称为参数θ的一个估计量,若X1,X2,……Xn是样本的一组观察值,则(X1,X2,……Xn)称为参数θ的一个点估计值。
2. 估计量的评价标准:
1) 无偏性:设是总体中未知参数θ的估计量,若则称是θ的无偏估计量。样本均值是总体均值μ的无偏估计量,;样本方差S2是总体方差σ2的无偏估计量,ES2=σ2。
2) 有效性:θ的方差最小的无偏估计量称为θ的有效估计量;正态总体的样本均值是总体均值μ的有效估计量。(以上两种情况在样本容量固定的情况下发生;当样本容量增大是越来越接近真值。)
3) 一致性:若当样本容量增大时,估计量的值越来越接近未知参数θ的真值,则称是θ的一致估计量。样本均值方差是总体均值方差的一致估计量。
二、 总体均值的区间估计:
1. 设θ是总体分布中的未知参数,X1,X2,……Xn是总体的一个样本,若对给定的α(0<α<1),参在两个估计量1(X1,X2,……Xn)和2(X1,X2,……Xn),使,则称随即区间(1,2)位参数θ的置信度位1-α的置信区间。α称为显著水平。
2. 意义:随机区间(1,2)包含θ真值的概率是1-α。
3.
4. 总体均值的置信区间(置信度1-α)
总体分布
样本量
σ已知
σ未知
正态分布
大样本
正态分布
小样本
非正态分布
大样本
三、 总体比例的区间估计:
总体比例的置信区间(置信度1-α)
样本量
抽样方式
置信区间
大样本
有放回抽样
无放回抽样
四、 两个总体均值之差的置信区间(置信度1-α)
总体分布
样本量
σ已知
σ未知
正态分布
大样本
用S1代替σ1
用S2代替σ2
正态分布
小样本
非正态分布
大样本
用S1代替σ1
用S2代替σ2
五、 大样本,两个总体比例之差()的置信区间,置信度(1-α):
六、 样本容量的确定(置信度1-α):
抽样方式
置信区间
允许误差
样本容量
有放回抽样
(或抽样比<5%)
总体均值
总体比例
不放回抽样
总体均值
先算出有放回抽样的样本容量n0;然后:
总体比例
⊙基本计算方法:
1、参数估计及评价标准:
例1、估计量的无偏性是指( )
A.估计量的数学期望等于总体参数的真值
B.估计量的数学期望小于总体参数的真值
C.估计量的方差小于总体参数的真值
D.估计量的方差等于总体参数的真值
解析:本题考察估计量的无偏性这一概念,答案为A。
例2、若T1、T2均是θ的无偏估计量,且它们的方差有关系DT1>DT2,则称( )
A.T1比T2有效 B.T1是θ的一致估计量
C.T2比T1有效 D.T2是θ的一致估计量
解析:本题考察估计量的有效性这一概念,答案为C。
例3、设总体X服从正态分布N(μ,σ2),μ和σ2未知,(X1,X2,…,Xn)是
来自该总体的简单随机样本,其样本均值为,则总体方差σ2的无偏估计量是
( )
A. B.
C. D.
解析:本题考察一个重要结论——样本方差是总体方差的无偏估计,答案为A。
2、区间估计:
例1、若置信水平保持不变,当增大样本容量时,置信区间( )
A.将变宽 B.将变窄
C.保持不变 D.宽窄无法确定
解析:答案为B。
例2、置信系数1-表示区间估计的( )
A.精确性 B.显著性
C.可靠性 D.准确性
解析:本题考察置信系数的概念,答案为C。
例3、设总体X服从正态分布N(,),已知,用来自该总体的简单随机
样本X1,X2,…,Xn建立总体未知参数的置信水平为1-的置信区间,以L表示
置信区间的长度,则( )
A.越大L越小 B.越大L越大
C.越小L越小 D.与L没有关系
解析:由于总体方差已知,从而L=2*,越大L越小,故选A。
例4、对于成对观测的两个正态总体均值差的区间估计,可以采用的统计量是( )
A.t统计量 B.Z统计量
C.统计量 D.F统计量
解析:本题考察不同条件下,选取不同统计量进行区间估计,答案为A。
例5、在小样本情况下,如果总体服从正态分布且方差未知,则总体均值的置信度为1-α的置信区间( )
A. B.
C. D.
解析:本题考察不同条件下,选取不同统计量进行区间估计,答案为C。
例6、假设某单位员工每天用于阅读书籍的时间服从正态分布,现从该单位随机
抽取了16名员工,已知他们用于阅读书籍的平均时间为50分钟,样本标准差为
20分钟,试以95%的置信度估计该单位员工用于阅读书籍的平均时间的置信区
间。(
解析:本题是正态总体,总体方差未知,小样本,显然采用下面公式计算:
(以下具体计算略)
例7、某餐馆欲估计每位顾客午餐的平均消费数额,依据以往的经验,顾客午餐消费的标准差为15元。假设中午在该餐馆就餐的顾客非常多,现要以95%的置信度估计每位顾客午餐的平均消费数额,并要求允许误差不超过3元,应抽取多少位顾客作为样本?(Z0.05=1.645,Z0.025=1.96)
解析:题设条件是总体分布未知,大样本,其区间估计公式为,,
从而允许误差为(以下具体计算略)
例8、某企业采用两种不同的促销方式进行销售。使用甲促销方式进行销售的30天里,日均销售额为50万元,样本标准差为5万元;使用乙促销方式进行销售的30天里,日均销售额为40万元,样本标准差为4万元。求使用甲、乙促销方式进行销售的日均销售额之差的置信度为95%的置信区间。(Z0.05=1.645,Z0.025=1.96)
解析:本题显然是双总体均值之差的区间估计,采用公式:
(以下具体计算略)
例9、某市场调查机构对某品牌家电进行市场调查,一共随机调查了1000名顾客,其中有700人表示喜欢该品牌家电。试以95%的可靠性估计喜欢该品牌家电的顾客比例P的置信区间。(Z0.05=1.645,Z0.025=1.96)
解析:本题考察的是比例的区间估计,应用公式
(以下具体计算略)
第六章 假设检验
⊙基本知识点:
一、 假设检验的基本概念:
1. 小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。
2. 对总体参数的取值所作的假设,称为原假设(或零假设),记做H0;原假设的对立假设称为备选假设(备择假设),记做H1。
3. 犯“H0为真,但拒绝H0”这种错误的概率α称为显著水平;这种错误称为第一类错误(弃真错误);
4. “H0不成立,但接受
展开阅读全文