资源描述
黑带考试辅导系列·6
51. M公司生产垫片。在生产线上,随机抽取 100片垫片,发现其厚度分布均值为2.0mm,标准差为0.2mm。取 10片叠起来,则这 10片垫片叠起来后总厚度的均值和方差为:
A.均值2.0mm;方差0.2
B.均值20mm;方差0.04
C.均值 20mm;方差 0.4
D.均值 20mm;方差 4
C 解析,十片叠加均值变成十倍。根据方差可加性,得0.2*0.2*10=0.4
52. M车间负责测量机柜的总电阻值。由于现在使用的是自动数字式测电阻仪,不同的测量员间不再有什么差别,但在测量时要先设定初始电压值 V,这里对 V可以有 3种选择方法。作测量系统分析时,使用传统方法,对 10个机柜,都用 3种不同选择的 V值,各测量 2次。在术语“测量系统的重复性(Repeatability)”和“测量系统的再现性(Reproducibility)”中,术语“再现性”应这样解释:
A. 不使用不同的测量员,就不再有“再现性”误差了。
B. 不同的设定的 V值所引起的变异是“再现性”误差。
C. 同一个设定的 V值,多次重复测量同样一个机柜所引起的变异是“再现性”误差。
D. 在不同时间周期内,用此测电阻仪测量同一个机柜时,测量值的波动是“再现性”误差。
B 解析,GR&R是一直存在的,这里的Reproducibility是指设定不同的初始值,导致的测量误差。
53. 在箱线图(Box-Plot)分析中,已知最小值=-4;Q1=1;Q3=4;最大值=7;则正确的说法是:
A.上须触线终点为:7;下须触线终点为:-3.5
B.上须触线终点为:8.5;下须触线终点为:-3.5
C.上须触线终点为:7;下须触线终点为:-4
D.上须触线终点为:8.5;下须触线终点为:-4
A 解析须点是厢式图中两根线的端点,一般不是最大最小值,但也肯定不会超过最大值最小值(C砍掉,BD砍掉)。也可以计算上须点=Q3+1.5(Q3-Q1)=4+1.5*3=8.5=7(超过最大值,采用最大值),下须点=Q1-1.5(Q3-Q1)=1-1.5*3=-3.5
54. 强力变压器公司的每个工人都操作自己的 15台绕线器生产同种规格的小型变压器。原定的变压之电压比为 2.50,但实际上的电压比总有些误差。为了分析究竟是什么原因导致电压比变异过大,让 3个工人,每人都操作自己任意选定的 10台绕线器各生产 1台变压器,对每台变压器都测量了 2次电压比数值,这样就得到了共 60个数据。为了分析电压比变异产生的原因,应该:
A.将工人及绕线器作为两个因子,进行两种方式分组的方差分析(Two-Way ANOVA),分别计算出两个因子的显著性,并根据其显著性所显示的P值对变异原因作出判断。
B.将工人及绕线器作为两个因子,按两个因子交叉(Crossed)的模型,用一般线性模型(General LinearModel)计算出两个因子的方差分量及误差的方差分量,并根据这些方差分量的大小对变异原因作出判断。
C.将工人及绕线器作为两个因子,按两个因子嵌套(Nested)的模型,用全嵌套模型(Fully NestedANOVA)计算出两个因子的方差分量及误差的方差分量,并根据这些方差分量的大小对变异原因作出判断。
D.根据传统的测量系统分析方法(GageRR Study- Crossed),直接计算出工人及绕线器两个因子方差分量及误差的方差分量,并根据这些方差分量的大小对变异原因作出判断。
C 解析,数据排列为工人A对应十个绕线器,每个绕线器对应2个数据,属于嵌套数据而不是交叉数据。故采用嵌套方差分析。
55. 对于两总体均值相等性检验,当验证了数据是独立的且为正态后,还要验证二者的等方差性,然后就可以使用双样本的T检验。这时是否可以使用单因子的方差分析(ANOVA)方法予以替代,这里有不同看法。正确的判断是:
A. 两总体也属于多总体的特例,因此,所有两总体均值相等性T检验皆可用ANOVA方法解决。
B. 两总体虽属于多总体的特例,但两总体均值相等性 T检验的功效(Power)比 ANOVA方法要高,因而不能用 ANOVA方法替代。
C. 两总体虽属于多总体的特例,但两总体均值相等性T检验的计算比ANOVA方法要简单,因而不能用 ANOVA方法替代。
D. 两总体虽属于多总体的特例,但两总体均值相等性T检验可以处理对立假设为单侧(例如“大于”)的情形,而 ANOVA方法则只能处理双侧(即“不等于”)的问题,因而不能用 ANOVA
方法替代。
D ANOVA方法比T要高级,在可以用T的检验中,一般都可用ANOVA代替。虽然ANOVA诚如D所言,但是一旦判别P值存在显出差异后,可以通过比较均值大小判断单侧问题。但是本题标准答案是D,估计是考虑到A选项中的说法过于绝对。实际应用中ANOVA可以替代T检验。
56. M公司中的Z车间使用多台自动车床生产螺钉,其关键尺寸是根部的直径。为了分析究竟是什么原因导致直径变异过大,让3个工人,并随机选择 5台机床,每人分别用这5车床各生产10个螺钉,共生产150个螺钉,对每个螺钉测量其直径,得到 150个数据。为了分析直径变异产生的原因,应该:
A. 将工人及螺钉作为两个因子,进行两种方式分组的方差分析(Two-Way ANOVA),分别计算出两个因子的显著性,并根据其显著性所显示的P值对变异原因作出判断。
B. 将工人及螺钉作为两个因子,按两个因子交叉(Crossed)的模型,用一般线性模型(GeneralLinear Model)计算出两个因子的方差分量及误差的方差分量,并根据这些方差分量的大
小对变异原因作出判断。
C. 将工人及螺钉作为两个因子,按两个因子嵌套(Nested)的模型,用全嵌套模型(Fully NestedANOVA)计算出两个因子的方差分量及误差的方差分量,并根据这些方差分量的大小对变异原因作出判断。
D. 根据传统的测量系统分析方法(GageRR Study- Crossed),直接计算出工人及螺钉两个因子方差分量及误差的方差分量,并根据这些方差分量的大小对变异原因作出判断。
C 解析,这组数据格式是每个人对应5个机器,每个机器对应10个产品,属于嵌套。因此选用Nested ANOVA分析。(原体有歧义,C答案是说3人每个人都随机5台机器,而不是随即5台机器,让这个3个人使用。但是原题中“这5台”另一种读法是随机了5台机器,如果去掉“这”字会更好)
57. 在选定 Y为响应变量后, 选定了 X1,X2,X3为自变量,并且用最小二乘法建立了多元回归方程。在MINITAB软件输出的ANOVA表中,看到 P-Value=0.0021。在统计分析的输出中,找到了对各个回归系数是否为0的显著性检验结果。由此可以得到的正确判断是:
A. 3个自变量回归系数检验中,应该至少有 1个以上的回归系数的检验结果是显著的(即至少有1个以上的回归系数检验的 P-Value 小于0.05),不可能出现3个自变量回归系数检
验的 P-Value 都大于 0.05的情况
B.有可能出现3个自变量回归系数检验的 P-Value 都大于0.05的情况,这说明数据本身有较多异常值,此时的结果已无意义,要对数据重新审核再来进行回归分析。
C.有可能出现3个自变量回归系数检验的 P-Value 都大于0.05的情况,这说明这3个自变量间可能有相关关系,这种情况很正常。
D.ANOVA表中的 P-VALUE=0.0021说明整个回归模型效果不显著,回归根本无意义。
C 解析P小于0.05说明回归方程是显著的,并且至少一个回归系数显著。但是不代表至少一个因子的回归系数显著,比如可能是X1X2乘积的回归系数显著(即交互作用显著)。
58. 已知一组寿命(Life Time)数据不为正态分布。现在希望用 Box-Cox变换将其转化为正态分布。
在确定变换方法时得到下图:
Lambda
Lower?CL Upper?CL
Lambda
0.221445
(using 95.0% confidence)
Estimate 0.221445
Lower?CL 0.060195
Upper?CL 0.396962
Best Value
Box-Cox Plot of Life time
从此图中可以得到结论:
A.将原始数据取对数后,可以化为正态分布。
B.将原始数据求其 0.2次方后,可以化为正态分布。
C.将原始数据求平方根后,可以化为正态分布。
D.对原始数据做任何 Box-Cox变换,都不可能化为正态分布。
B 介绍原图无法贴出,仅作介绍,当数据不正态后要用BOX转换,变成正态数据才能分析。转换方式就是在所有的数做“Lambda”次方。
59. 为了研究轧钢过程中的延伸量控制问题,在经过2水平的4个因子的全因子试验后,得到了回归方程。其中,因子A代表轧压长度,低水平是50cm,高水平为 70cm。响应变量 Y为延伸量(单位为cm)。在代码化后的回归方程中, A因子的回归系数是 4。问,换算为原始变量(未代码化前)的方程时,此回归系数应该是多少?
A. 40
B. 4
C. 0.4
D. 0.2
C 解析代码化之后,50=-1,70=1,即60=0。代码中回归系数是4,即A每变化1(10cm),A引起的Y变化4;那么那么未代码的时候,A每变化1cm(原来的1/10),A引起的Y变化就是4/10=0.4。即A回归系数0.4
60. 为了判断两个变量间是否有相关关系,抽取了 30对观测数据。计算出了他们的样本相关系数为0.65,对于两变量间是否相关的判断应该是这样的:
A.由于样本相关系数小于0.8,所以二者不相关
B.由于样本相关系数大于0.6,所以二者相关
C.由于检验两个变量间是否有相关关系的样本相关系数的临界值与样本量大小有关, 所以要查样本相关系数表才能决定
D.由于相关系数并不能完全代表两个变量间是否有相关关系,本例信息量不够,不可能得出判定结果
C 解析相关系数的检验符合P(r>ra)=α。这个函数是跟自由度(n-2)值有关的函数。自由度越大(样本越大)满足相关性所需要的相关系数就越小
61. 响应变量Y与两个自变量(原始数据)X 1及X2建立的回归方程为: y =2.2 + 30000x1 + 0.0003x2 由此方程可以得到结论是:
A. X1对 Y的影响比 X 2对 Y的影响要显著得多
B. X1对 Y的影响比 X 2对 Y的影响相同
C. X2对 Y的影响比 X 1对 Y的影响要显著得多
D.仅由此方程不能对X 1及X2对Y影响大小作出判定
D 解析回归方程仅能说明X1,X2的单位变化对Y的影响,但不能说明哪个影响显著。首选X1 X2的变化程度不能确定,可能X1的变化非常微小,而X2的变化很大。
62. 为了判断改革后的日产量是否比原来的 200 (千克)有所提高,抽取了 20次日产量,发现日产量平均值为 201(千克)。对此可以得到判断:
A.只提高1千克,产量的提高肯定是不显著的
B.日产量平均值为201(千克),确实比原来200(千克)有提高
C.因为没有提供总体标准差的信息,因而不可能作出判断
D.不必提供总体标准差的信息,只要提供样本标准差的信息就可以作出判断
D 根据假设检验的计算公式,仅凭均值尚不足以判断是否显著。一般情况下需要知道样本的标准偏差。然后用Z=(u-X)/σ,查表才能判断是否显著。
63. 六西格玛团队分析了历史上本车间产量(Y)与温度(X1)及反应时间(X2)的记录。建立了Y 对于 X1及 X2的线性回归方程,并进行了ANOVA、回归系数显著性检验、相关系数计算等,证明我们选择的模型是有意义的,各项回归系数也都是显著的。下面应该进行:
A.结束回归分析,将选定的回归方程用于预报等
B.进行残差分析,以确认数据与模型拟合得是否很好,看能否进一步改进模型
C.进行响应曲面设计,选择使产量达到最大的温度及反应时间
D.进行因子试验设计,看是否还有其它变量也对产量有影响,扩大因子选择的范围
B 解析假设检验是:1、验证数据正态;2、等方差检验;3、ANOVA分析显著性;4、计算相关系数;5、残差分析验证结论;6、给出结论
64. 回归方程 Y = 30-X 中,Y的误差的方差的估计值为 9,当 X=1 时,Y的95%的近似预测区间是
A. (23,35)
B. (24,36)
C. (20,38)
D. (21,39)
A 解析X=1,Y=29,近似区间左右对称,σ=3, 精度(即偏离均值的程度,一般用正负d表示)估计d=2S/根号n=2*3/1=6,故A。
95%的置信区间代表着2σ,所以计算结果为:
; @8 m, Q2 x9 o1 L9 J(30-1)± 2σ = 29 ± 2*3 ! \" o0 t4 r1 s) f8 o' b
答案为 A
65. 某工序过程有六个因子A、B、C、D、E、F,工程师希望做部分因子试验确定主要的影响因素,准备采用2 6-2设计,而且工程师根据工程经验判定AB、BC、AE、DE之间可能存在交互作用,但是MINITAB给出的生成元(Generators)为 E = ABC, F = BCD,为了不让可能显著的二阶交互作用相互混杂,下列生成元可行的是:
A. E=ABD, F=ABC
B. E=BCD, F=ABC
C. E=ABC, F=ABD
D. E=ACD, F=BCD
D 解析交互作用中ABC肯定不行,因为ABC可分解为AB BC,这本身就是交互的,不能代表三阶元E。
66. 下列哪项设计是适合作为改进阶段开始的筛选实验(Screening Experiment):
A. 8因子的全因子实验
B. 8因子的部分因子实验
C.中心复合设计(CCD)
D. Box-Behnken 设计
B 解析,开始阶段,为了节约成本和提高效率,一般采用部分因子DOE。 中心复合和Box设计等均是后期为了准确提供准确参数而使用的。
67. 在4个因子A、B、C、D的全因子设计中,增加了3个中心点的试验。分析试验结果,用MINITAB软件计算,其结果如下:
Factorial Fit: y versus A, B, C, D
Analysis of Variance for y (coded units)
Source DF Seq SS Adj SS Adj MS F P
Main Effects 4 8.16108 8.16108 2.04027 22.87 0.000
2-Way Interactions 6 0.67659 0.67659 0.11276 1.26 0.369
Residual Error 8 0.71361 0.71361 0.08920
Curvature 1 0.02558 0.02558 0.02558 0.26 0.626
Lack of Fit 5 0.40463 0.40463 0.08093 0.57 0.735
Pure Error 2 0.28340 0.28340 0.14170
Total 18 9.55127
在正交试验中,假定数据在拟合线性模型后,试验数据的残差有共同的方差,对于方差的估计量应该
是MSE(Mean Square Error,即平均误差均方和),在本题中是:
A. 0.08920
B. 0.14170
C. 0.71361
D. 0.28340
A 解析残差即residual,在minitab15版以后不会再出这个问题。因为是中文的。
68. 下列哪种响应曲面设计肯定不具有旋转性(Rotatability)
A.CCD(中心复合设计,Central Composite Design)
B.CCI(中心复合有界设计,Central Composite Inscribed Design)
C.CCF(中心复合表面设计,Central Composite Face-Centered Design)
D.BB(BB设计,Box-Behnken Design)
C 解析表面设计不具有旋转型。其他几个都具备。
69. 经过团队的头脑风暴确认,影响过程的因子有 A、B、C、D、E及 F共六个。其中除因子的主效应外,还要考虑 3个二阶交互效应AB、AC及DF,所有三阶以上交互作用可以忽略不计。由于试验成本较高,限定不可能进行全面的重复试验,但仍希望估计出随机误差以准确检验各因子显著性。在这种情况下,应该选择进行:
A.全因子试验
B.部分实施的二水平正交试验,且增加若干中心点
C.部分实施的二水平正交试验,不增加中心点
D. Plackett-Burman设计
B 解析全因子实验成本很高。一般采用部分因子试验,为了提高准确性可以通过增加中心点的方法。
70. 在部分实施的因子试验设计中,考虑了A,B,C,D,E及F共 6个因子,准备进行16次试验。在计算机提供的混杂别名结构表(Alias Structure Table)中,看到有二阶交互作用效应 AB与 CE相混杂(Confounded),除此之外还有另一些二阶交互作用效应相混杂,但未看到任何主效应与某二阶交互作用效应相混杂。此时可以断定本试验设计的分辩度(Resolution)是
A. 3
B. 4
C. 5
D. 6
B 解析,可以通过查表得知分辨率是4.(原题中有表)或者:因为主效应与二阶效应不混杂,二阶效应混杂,故分辨率是4
31. 为调查呼吸阻塞症在中国发病率,发了 5000份问卷。由于呼吸阻塞症与嗜睡症有密切关系,问卷都是关于是否有嗜睡倾向的。后来,问卷只回收了约 1000份,对回答了问卷的人进行了检测,发现呼吸阻塞症患病率为12%。对此比率数值是否准确的判断应为:
A.可以认为此数是发病率的正确估计
B.由于未回收问卷较多,此值估计偏高
C.由于未回收问卷较多,此值估计偏低
D.1000份太少,上述发病率的估计无意义
B 解析,发放5000分只收回1/5,此值估计偏高
32. 对于一组共28个数据进行正态性检验。使用MINITAB软件,先后依次使用了 “Anderson-Darling”,“Ryan-Joiner(Similar to Shapiro-Wilk)”及“Kolmogorov –Smirnov”3种方法,但却得到了 3种不同结论: “Anderson-Darling”检验 p-value<0.005因而判数据“非正态”, “Ryan-Joiner(Similar toShapiro-Wilk)” 检验 p-value>0.10以及“Kolmogorov –Smirnov” 检验 p-value>0.15都判数据“正态”。这时候正确的判断是:
A.按少数服从多数原则,判数据“正态”。
B.任何时候都相信“最权威方法”。在正态分布检验中,相信 MINITAB软件选择的缺省方法“Anderson-Darling”是最优方法,判数据“非正态”。
C.检验中的原则总是“拒绝是有说服力的”,因而只要有一个结论为“拒绝”则相信此结果。因此应判数据“非正态”。
D.此例数据太特殊,要另选些方法再来判断,才能下结论。
C 解析,只要一种检测证明非正态,即非正态。
33. 已知化纤布每匹长 100米,每匹布内的瑕疵点数服从均值为 10的 Poisson分布。缝制一套工作服需要4米化纤布。问每套工作服上的瑕疵点数应该是:
A.均值为 10的 Poisson分布
B.均值为 2.5的 Poisson分布
C.均值为 0.4的 Poisson分布
D.分布类型已改变
C 解析泊松分布具有可加性,泊松分布的均值和方差相等。由100米变成4米,可看成100米是由25个4米组成的泊松分布。
34. 从平均寿命为 1000小时寿命为指数分布的二极管中,抽取 100件二极管,并求出其平均寿命。则
A.平均寿命仍为均值是1000小时的指数分布
B.平均寿命近似为均值是 1000小时,标准差为 1000小时的正态分布
C.平均寿命近似为均值是1000小时,标准差为100小时的正态分布
D.以上答案都不对。
C 解析指数分布均值等于标准偏差。指数分布不具备可加性,均值不会改变,标准偏差也不会改变。
由于该命题已经提到总体是指数分布的二极管,可以得出: 均值=标准差=1000
同时,从总体中抽样,根据中心极限定律的公式:均值(总体)=均值(样本);标准偏差(样本)=标准偏差(总体)/n^0.5
有以上的条件可以的出
样本均值=1000;样本标准偏差=1000/100^0.5=100.
35. 某供应商送来一批零件,批量很大,假定该批零件的不良率为1%,今从中随机抽取32件,若发现2个或2个以上的不良品就退货,问接受这批货的概率是多少?
A. 72.4%
B. 23.5%
C. 95.9%
D. 以上答案都不对
C 解析这是典型的二项式分布(概率已知,每次收取不对其他抽取产生影响,每次结果只有成功失败两种可能),则原题的概率是抽到0个不良和1个不良概率,C32~0* 0.01^0*0.99^32+C32~1*0.01^1*0.99^31=0.959.
36. 某企业用台秤对某材料进行称重,该材料重量要求的公差限为 500±15克。现将一个 500克的砝码,放在此台秤上去称重,测量20次,结果发现均值为510克,标准差为1 克。这说明:
A.台秤有较大偏倚(Bias),需要校准
B.台秤有较大的重复性误差,已不能再使用,需要换用精度更高的天平。
C.台秤存在较大的再现性误差,需要重复测量来减小再现性误差。
D.测量系统没有问题,台秤可以使用。
A 解析天平存在10g的偏倚,偏倚可以通过校准消除。P/T=5.15/30<30%,说明此天平的GR&R还行。
37. 在数字式测量系统分析中,测量人员间基本上无差异,但每次都要对初始状态进行设定,这时,再现性误差是指:
A.被测对象不变,测量人员不变,各次独立重复测量结果之间的差异;
B.被测对象不变,在不同初始状态的设定下,各次测量结果之间的差异;
C.同一测量人员,对各个被测对象各测一次,测量结果之间的差异;
D.以上都不是。
B 解析再现性是再次测定的情况下发生的误差,由于人不变,而每次都对设备进行设定,已经有了一个变化,所以B。
38. 车床加工轴棒,其长度的公差限为180±3毫米。在测量系统分析中发现重复性标准差为0.12毫米,再现性标准差为0.16毫米。从%P/T的角度来分析,可以得到结论:
A.本测量系统从%P/T角度来说是完全合格的
B.本测量系统从%P/T角度来说是勉强合格的
C.本测量系统从%P/T角度来说是不合格的
D.上述数据不能得到%P/T值,从而无法判断
B 解析P/T是5.15σ/Δ=5.15*0.2/6=1/6,大于10% 小于30%。所以勉强合格。
39. 在钳工车间自动钻空的过程中,取 30个钻空结果分析,其中心位置与规定中心点在水平方向的偏差值的平均值为 1微米,标准差为 8微米。测量系统进行分析后发现重复性(Repeatability)标准差为 3微米,再现性(Reproducibility)标准差为 4微米。从精确度/过程波动的角度来分析,可以得到结论:
A.本测量系统从精确度/过程波动比(R&R%)来说是完全合格的
B.本测量系统从精确度/过程波动比(R&R%)来说是勉强合格的
C.本测量系统从精确度/过程波动比(R&R%)来说是不合格的
D.上述数据不能得到精确度/过程波动比(R&R%), 从而无法判断
C 解析根据P/TV比,GR&R/σt=5/8>30%,所以测量系统不合格
40. 对于正态分布的过程,有关 Cp、Cpk和缺陷率的说法,正确的是:
A.根据Cp 不能估计缺陷率, 根据 C pk才能估计缺陷率
B.根据Cp 和C pk才能估计缺陷率
C.缺陷率与Cp 和C pk无关
D.以上说法都不对
B 解析有计算公式可知,仅靠Cpk只能得出缺陷的范围,联合Cp才能估算缺陷率。这也是为何常用Z值代替Cpk的原因。
21. 某生产线上顺序有3道工序,其作业时间分别是8分钟、10分钟、6分钟,则生产线的节拍是:
A. 8分钟
B. 10分钟
C. 6分钟
D. 以上都不对
B 解析节拍时间Takt是流程中单位时间内生产出一个产品或部件的时间,在多工序中,节拍时间是最长的哪个工序时间。比如本题,由于各个工序(假定ABC三工序)均是同步生产,所以480分钟内,A工序输出60个产品,B工序输出48个产品,C工序输出80个,能够在480分钟内输出的产品只有48个(B瓶颈工序)。
22. 下述网络图中,关键路径是?(时间单位:天)
1 6 9 103
4 7
2 5 8
3
4 1
2
2 3 1 2
3
3
1
41
6
A.①-③-⑥-⑧-⑩
B.①-③-⑥-⑨-⑩
C.①-④-⑥-⑧-⑩
D.①-④-⑥-⑨-⑩
C 原图无法贴出,仅作介绍,关键路径是路径时间最长的那条线。
23. 对于离散型数据的测量系统分析,通常应提供至少 30件产品,由 3个测量员对每件产品重复测量2次,记录其合格与不合格数目。对于 30件产品的正确选择方法应该是:
A.依据实际生产的不良率,选择成比例的合格及不合格样品
B.至少 10件合格,至少 10件不合格,这与实际生产状态无关
C.可以随意设定比率,因为此比率与测量系统是否合格是无关的
D.以上都不对
B
24.美国工程师的项目报告中提到,在生产过程中,当华氏度介于(70,90)之间时,产量获得率(以百分比计算)与温度(以华氏度为单位)密切相关(相关系数为0.9),而且得到了回归方程如下: Y = 0.9X + 32 黑带张先生希望把此公式中的温度由华氏度改为摄氏度。他知道摄氏度(C)与华氏度(F)间的换算关系是:
C = 5/9 ( F – 32)
请问换算后的相关系数和回归系数各是多少?
A.相关系数为0.9,回归系数为1.62
B.相关系数为 0.9,回归系数为 0.9
C.相关系数为 0.9,回归系数为 0.5
D.相关系数为 0.5,回归系数为 0.5
A 相关系数是变量间的关系,不随计量单位的变化而变化,依旧是0.9,公示中的系数是回归系数,将换算公式带入回归方程,可得Y=0.9*(9/5)X+b, 可见回归系数大于1,故A。
25. 对于流水线上生产的一大批二极管的输出电压进行了测定。经计算得知,它们的中位数为2.3V。从该批随机抽取了 400个二极管,对于它们的输出电压进行了测定。记 X为输出电压比2.3V大的电子管数,结果发现,X=258支。为了检测此时的生产是否正常。先要确定 X的分布。可以断言:
A. X近似为均值是 200,标准差是 20的正态分布。
B. X近似为均值是 200,标准差是 10的正态分布。
C. X是(180,220)上的均匀分布。
D. X是(190,210)上的均匀分布。
B 解析,因为中位数是2.3,所以大于和小于2.3的应该相同,所以400个二极管应该有200个大于2.3。对于每一次抽检,因为测量结果不对其他测量结果产生影响,并且每次度数只有大于或小于2.3V两种可能,检验了400次。这是一个典型的二项式分布,并且概率p=0.5,n=400.依据二项式分布函数,E=np=200,σ=根号np(1-p)=根号400*0.25=10.故此分布式均值200,标准差10的二项式分布(近似正态分布)。
26. 容易看到,在一个城市中不同收入者的住房面积相差悬殊,分布一般会呈现出严重的右偏倾向。为了调查S市的住房状况,随机抽取了 1000个住户,测量了他们的住房面积。在这种情况下,代表一般住房状况的最有代表性的指标应该是:
A.样本平均值(Mean)
B.去掉一个最高值,去掉一个最低值,然后求平均
C.样本众数(Mode),即样本分布中概率最高者。
D 样本中位数(Median)
D 财富分配只能用中位数,因为受两极极限数据影响太大。国家统计局的人因为基本都是“统计学学文盲”,所以采用平均数,让国民收入“被增长”。
27. 在起重设备厂中, 对于供应商提供的垫片厚度很敏感。垫片厚度的公差限要求为12 毫米±1毫米。供应商对他们本月生产状况的报告中只提供给出 Cp=1.33, Cpk=1.00 这两个数据。这时可以对于垫片生产过程得出结论说:
A.平均值偏离目标12 毫米 大约 0.25 毫米
B.平均值偏离目标12 毫米 大约 0.5 毫米
C.平均值偏离目标12 毫米 大约 0.75 毫米
D.以上结果都不对
A 解析Cp=1.33说明过程潜在能力尚可,但是过程能力指数Cpk=1.00 说明不足。根据Cp和Cpk的计算公式可知,样本均值=基准值的时候,Cp=Cpk,当 偏离基准值的时候Cpk<Cp. 依据公式3σ=13-均值, 6σ*1.33=2,所以,13-均值=3σ=1/1.33=0.75,所以均值=12.25(或11.75),即偏离目标值0.25
28.下表是一个分组样本分组区间 (35, 45] (45, 55] (55, 65] (65, 75] 频数 3 8 7 2 ,则其样本均值 X近似为
A. 50
B. 54
C. 62
D. 64
B 解析第二组和第三组的数据多,所以X近似值应该在 50~60之间,只有B。也可以根据样本分组估算公式计算。
29. 在某快餐店中午营业期间内,每分钟顾客到来人数为平均值是 8的泊松(Poisson)分布。若考虑每半分钟到来的顾客分布,则此分布近似为:
A.平均值是8的泊松(Poisson)分布
B.平均值是4的泊松(Poisson)分布
C.平均值是2的泊松(Poisson)分布
D.分布类型将改变。
B 泊松分布的特性是均值=方差,而且n个泊松分布相加依旧是柏松分布,一分钟的泊松分布可看成2个半分钟泊松分布的相加。
30. 一批产品分一、二、三级,其中一级品是二级品的二倍,三级品是二级品的一半,若从该批产品
中随机抽取一个,此产品为二级品的概率是
A. 1/3
B. 1/6
C. 1/7
D. 2/7
解析a=2b,b=2c,则,a=4c,则,a b c分别为4c 2c c,所以a占4/7,b占2/7,c占1/7. 随机抽取b,概率为2/7
1. 对于流水线上生产的一大批二极管的输出电压进行了测定。经计算得知,它们的中位数为2.3V 。 从该批随机抽取了400 个二极管,对于它们的输出电压进行了测定。记X 为输出电压 比2.3V 大的电子管数,结果发现,X=258 支。为了检测此时的生产是否正常。先要确定X 的分布。可以断言:
A. X 近似为均值是200, 标准差是20 的正态分布。
B. X 近似为均值是200, 标准差是10 的正态分布。
C. X 是(180,220 )上的均匀分布。
D. X 是(190,210 )上的均匀分布。
B. X 近似为均值是200, 标准差是10 的正态分布。
理由, 该题目注意信息(经计算得知,它们的中位数为2.3V ) 那么既然中位数是2.3那么小于2.3的概率就为0.5 那么利用2项分布的公式套进去就可以了 平均值=400*0.5 方差=400*0.5*(1-0.5)=100, 标准差=10
2. 在起重设备厂中, 对于供应商提供的垫片厚度很敏感。垫片厚度的公差限要求为12 毫米±1 毫
米。供应商对他们本月生产状况的报告中只提供给出 Cp=1.33, Cpk=1.00 这两个数据。这时可以对
于垫片生产过程得出结论说:
A. 平均值偏离目标12 毫米 大约 0.25 毫米
B. 平均值偏离目标12 毫米 大约 0.5 毫米
C. 平均值偏离目标12 毫米 大约 0.75 毫米
D. 以上结果都不对
A. 平均值偏离目标12 毫米 大约 0.25 毫米
理由, 利用公式CP=(uSL-LSL)/6S 和CPK=MIN( (USL-MEAN)/3s, (mean-lsl)3S) ,然后就属于小学的问题了
4. 在某快餐店中午营业期间内,每分钟顾客到来人数为平均值是8 的泊松(Poisson)分布。若考
虑每半分钟到来的顾客分布,则此分布近似为:
A. 平均值是8 的泊松(Poisson)分布
B. 平均值是4 的泊松(Poisson)分布
C. 平均值是2 的泊松(Poisson)分布
D. 分布类型将改变。
:B. 平均值是4 的泊松(Poisson)分布
理由,一分钟 数学期望=均值=8, 半分钟当然是4了
瓷砖厂在1~3月份生产的某类瓷砖中了抽取1000块,检验发现了200个瑕疵,瑕疵的出席那是完全随即的。则估计该类瓷砖的初检合格率是多少
lamda=200/1000=0.2
根据泊松分布求缺陷为零的概率
所以合格率=exp(-0.2)=81.87%
置信区间是由样本数据向总体数据进行推断的时候为了确保推断不失真,而诞生的一个统计学概念。它表示在这个区间发生的概率较大,凡是在这个区间的数据都认为是可以接受的。
1、由两个独立样本计算得到两个总体均值的置信区间,以下说法正确的是 ( )
A.如果两个置信区间有重叠,可认为两样本均值差别无统计显著意义
B.如果两个置信区间有重叠,可认为两样本均值差别有统计显著意义
C.如果两个样本均值差别无统计显著意义,两个总体均值之差的置信区间包含0
D.如果两个样本均值差别无统计显著意义,两个总体均值之差的置信区间不包含0
AC所以置信区间有重叠,表示两个均值都可能发生在一个数值上,也就是无差别A.而一旦连个均值无统计显著意义,也就是说置信区间有重合,所以差值也就是包含0,即C
2、一个部门有30个人,依据以往的出勤纪录,其平均缺席率为20%,现人事部门想要了解该部门缺席率95%的置信区间。某人事助理算出了以下区间,正确的是( )
6% ~ 34%
8% ~ 32%
13% ~ 27%
17% ~ 23%
A置信区间可以由区间估计来计算,本题中属于比率的区间估计,根据比率区间估计公式得知:
置信区间为:20%+/- 1.96*根号(0.2*0.8/30),约+/- 7%,再乘1.96,约14%,所以A。
3、下面哪一个术语
展开阅读全文