抽样技术第四版习题答案.doc-资源下载-咨信网-让知识获取变得高效

抽样技术第四版习题答案.doc

1、第2章解：这种抽样方法是等概率的。在每次抽取样本单元时，尚未被抽中的编号为1～64的这些单元中每一个单元被抽到的概率都是。这种抽样方法不是等概率的。运用这种方法，在每次抽取样本单元时，尚未被抽中的编号为1～35以及编号为64的这36个单元中每个单元的入样概率都是，而尚未被抽中的编号为36～63的每个单元的入样概率都是。这种抽样方法是等概率的。在每次抽取样本单元时，尚未被抽中的编号为20 000～21 000中的每个单元的入样概率都是，所以这种抽样是等概率的。解：项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本，然后定义

2、样本均值为。抽样理论中样本是从有限总体中按放回的抽样方法得到的，样本中的样本点不会反复；而数理记录中的样本是从无限总体中运用有放回的抽样方法得到的，样本点有也许是反复的。性质 (1) 样本均值的盼望都等于总体均值，也就是抽样理论和数理记录中的样本均值都是无偏估计。 (2) 不管总体本来是何种分布，在样本量足够大的条件下，样本均值近似服从正态分布。 (1) 抽样理论中，各个样本之间是不独立的；而数理记录中的各个样本之间是互相独立的。 (2) 抽样理论中的样本均值的方差为，其中。在数理记录中，，其中为总体的方差。解：一方面估计该市居民日用电量的95%的置信区间

3、根据中心极限定理可知，在大样本的条件下，近似服从标准正态分布，的的置信区间为。而中总体的方差是未知的，用样本方差来代替，置信区间为。由题意知道，，并且样本量为，代入可以求得。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。下一步计算样本量。绝对误差限和相对误差限的关系为。根据置信区间的求解方法可知根据正态分布的分位数可以知道，所以。也就是。把代入上式可得，。所以样本量至少为862。解：总体中参与培训班的比例为，那么这次简朴随机抽样得到的的估计值的方差，运用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中，样本量足够大，从

4、而可得的的置信区间为。而这里的是未知的，我们使用它的估计值。所以总体比例的的置信区间可以写为，将代入可得置信区间为。解：运用得到的样本，计算得到样本均值为，从而估计社区的平均文化支出为144.5元。总体均值的的置信区间为，用来估计样本均值的方差。计算得到，则，，代入数值后计算可得总体均值的95%的置信区间为。解：根据样本信息估计可得每个乡的平均产量为1 120吨，该地区今年的粮食总产量的估计值为（吨）。总体总值估计值的方差为，总体总值的的置信区间为，把代入，可得粮食总产量的的置信区间为。解：一方面计算简朴随机抽样条件下所需要的样本量，把带入公式，最后可得。

5、假如考虑到有效回答率的问题，在有效回答率为70%时，样本量应当最终拟定为。解：去年的化肥总产量和今年的总产量之间存在较强的相关性，并且这种相关关系较为稳定，所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。运用去年的化肥总产量，今年的化肥总产量的估计值为吨。解：本题中，简朴估计量的方差的估计值为=37.17。运用比率估计量进行估计时，我们引入了家庭的总支出作为辅助变量，记为。文化支出属于总支出的一部分，这个重要变量与辅助变量之间存在较强的相关关系，并且它们之间的关系是比较稳定的，且所有家庭的总支出是已知的量。文化支出的

6、比率估计量为，通过计算得到，而，则，文化支出的比率估计量的值为（元）。现在考虑比率估计量的方差，在样本量较大的条件下，，通过计算可以得到两个变量的样本方差为，之间的相关系数的估计值为，代入上面的公式，可以得到比率估计量的方差的估计值为。这个数值比简朴估计量的方差估计值要小很多。所有家庭的平均文化支出的的置信区间为，把具体的数值代入可得置信区间为。接下来比较比估计和简朴估计的效率，，这是比估计的设计效应值，从这里可以看出比估计量比简朴估计量的效率更高。解：运用简朴估计量可得，样本方差为，，样本均值的方差估计值为。运用回归估计的方法，在这里选取肉牛的原重量为辅助变量。选择原重

7、量为辅助变量是合理的，由于肉牛的原重量在很大限度上影响着肉牛的现在的重量，两者之间存在较强的相关性，相关系数的估计值为，并且这种相关关系是稳定的，这里肉牛的原重量的数值已经得到，所以选择肉牛的原重量为辅助变量。回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为，代入数值可以得到。回归估计量的方差为，方差的估计值为，代入相应的数值，，显然有。在本题中，由于存在肉牛原重量这个较好的辅助变量，所以回归估计量的精度要好于简朴估计量。第3章 3.1 解：在分层随机抽样中，层标志的选择很重要。划分层的指标应当与抽样调查中最关心的调查变量存在较强的相

8、关性，并且把总体划分为几个层之后，层应当满足：层内之间的差异尽也许小，层间差异尽也许大。这样才干使得最后获得的样本有很好的代表性。对几种分层方法的判断如下： (1)选择性别作为分层变量，是不合适的。一方面，性别这个变量与研究最关心的变量(不同职务，职称的人对分派制度改革的态度)没有很大的相关性；另一方面，用性别作为分层变量后，层内之间的差异仍然很大，相反，层之间的差异不是很大，由于男性和女性各自内部的职务，职称也存在很大的差别；最后，选择性别作为分层变量后，需要一方面得到男性和女性的抽样框，这样会更加麻烦，也会使抽样会变得更加复杂。 (2)按照教师、行政管理人员和职工进行分层，是合适的。这

9、种分层的指标与抽样调查研究中最关心的变量高度相关，并且按照这种方法分层后，可以看出层内对于分派制度改革的态度差异比较小，由于他们属于相同的阶层，而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。 (3)按照职称（正高、副高、中级、初级和其他）分层，也是合理的。理由与（2）相同，这样进行分层的变量选择与调查最关心的变量是高度相关的，分层后的层满足分层的规定。所以，按照职称进行分层是合理的。 (4)按照部门进行分层，是合理的。由于学校有很多院、系或者所，直接进行简朴随机抽样，有也许样本不能很好地代表各个院系，最关心的变量与部门也存在一定的相关性。这样分层后，每个层的总体数目和

10、抽取的样本量都较小，最终的样本的分布比较均匀，比简朴随机抽样更加方便实行。 3.2 解：设计的方案如下：第一种方案：可以按照不同的专业进行分层，但是考虑到假如在每层都抽取，不能保证每个新生的入样概率相等，由于每个专业的人数比例未知，8个人的样本量无法在每个层之间进行分派。所以采用如下方法：对所有的新生按照专业的先后顺序进行编号，使得每个专业的人的编号在一起，然后随机选取出一个号码，然后选取出这个号码所在的专业，选取出这个专业，再在这个专业的所有新生中按照简朴随机抽样的方法选取出8个人。这样就可以保证每个人入选的概率是相等的。第二种方案：也可以按照性别进行分类，对他们进行编号，为1～

11、800，使得男生的编号都在一起，女生的编号也都在一起，然后随机选取出一个号码，然后看这个号码所相应的性别，然后从这个性别的所有人中按照简朴随机抽样的方法选取出8个新生。这样就可以保证所有的新生的入样概率是相同的。第三种方案：随机地把所有的人提成8组，并且使得每组的人都是100个人，这样分组完毕后，每个组的新生进行编号为1～100，然后随机抽取出一个号码，再从所有的小组中抽取出号码所相应的新生，从而抽取出8个人。 3.3 解：(1) 一方面计算出每层的简朴估计量，分别为，其中，，则每个层的层权分别为；则运用分层随机抽样得到该社区居民购买彩票的平均支出的估计量，代入数值可以得到。

12、购买彩票的平均支出的的估计值的方差为，此方差的估计值为，根据数据计算可以得到每层的样本方差分别为：其中，代入数值可以求得方差的估计值为，则估计的标准差为。 (2)由区间估计可知相对误差限满足所以，。样本均值的方差为，从而可以得到在置信度为，相对误差限为条件下的样本量为。 ①对于比例分派而言，有成立，那么，把相应的估计值和数值代入后可以计算得到样本量为，相应的在各层的样本量分别为。 ②按照内曼分派时，样本量在各层的分派满足，这时样本量的计算公式变为，把相应的数值代入后可得，在各层中的分派情况如下：。 3.4 解：(1) 一方面计算得到每层中在家吃年夜饭的样本比例为，

13、那么根据每一层的层权，计算得到该市居民在家吃年夜饭的样本比例为。每一层中在家吃年夜饭的样本比例的方差为，则该市居民在家吃年夜饭的比例的方差，在的条件下，，而其中每层的吃年夜饭的样本比例的方差的估计值为，则样本比例的方差的估计值为，把相应的数值代入计算可得方差的估计值为，从而可以得到该估计值的标准差为。 (2)运用上题的结果，，这里的方差是，在的条件下，近似有。 ①比例分派的条件下，有成立，那么，把相应的估计值和数值代入可以求得最终的样本量应当是，样本量在各层的分派是，，。 ②内曼分派条件下，，则，代入相应的估计值和数值可以计算得到样本量为，在各层中样本量的分派为。 3.

14、5 解：总体总共分为10个层，每个层中的样本均值已经知道，层权也得到，从而可以计算得到该开发区居民购买冷冻食品的平均支出的估计值为。下一步计算平均支出的95%的置信区间，一方面计算购买冷冻食品的平均支出的估计值的方差，其中，但是每层的方差是未知，则样本平均支出的方差的估计值为，每个层的样本标准差已知，题目中已经注明各层的抽样比可以忽略，计算可以得到。则这个开发区的居民购买冷冻食品的平均支出置信区间为代入数值后，可得最终的置信区间为。 3.6 解：一方面计算简朴随机抽样的方差，根据各层的层权和各层的总体比例可以得到总体的比例为，则样本量为100的简朴随机样本的样本比例的方差为

15、不考虑有限总体校正系数，，其中，在的条件下，通过简朴随机抽样得到的样本比例的方差为通过度层抽样得到的样本比例的方差为，但是由于不考虑有限总体校正系数，并且抽样方式是比例抽样，所以有成立，样本比例的方差近似为。对于每一层，分别有，在的条件下，近似的有成立，有样本量应当满足，同时这里规定分层随机抽样得到的估计的方差和简朴抽样的方差是相同的，，层权分别为，代入数值，可以计算得到最终的样本量为。 3.7解：事后分层得到的总体均值的估计量和估计量的方差分别为，估计量的方差的估计值。对于几种说法的判断如下：（1）事后分层比简朴随机抽样产生更加

16、精确的结果，这个说法是错误的。从事后分层得到估计量的方差的估计值来看，它的方差不一定比简朴随机抽样的要小，并且从事后分层得到的样本是运用简朴随机抽样的方法得到的，只是在计算估计量和估计量的方差时是按照分层随机抽样来解决，并且事后分层规定层权是已知的，但是当层权未知从而运用样本来估计层权时，就会产生偏差，事后分层不见得比简朴随机抽样产生更精确的结果。（2）事后分层比按比例分派产生更精确的结果，这个说法是错误的。从事后分层得到的估计量的方差的估计值可以看出，它的第一项就是按照比例分层抽样得到的估计量方差的估计值，公式中的第二项表达的是按事后分层时各层样本量与按照比例分层时各层样本量发生偏差所引

17、起的方差的增量。（3）事后分层的最优分派产生更精确的结果，这种说法是错误的。事后分层在样本量足够大的条件下是与比例分层相称的，但是在一般条件下，事后分层的精度仍然低于比例分层的，那么事后分层的精度也会高于最优分派的精度。（4）在抽样时不能得到分层变量，这个说法是对的的。事后分层在抽样时，是运用简朴随机抽样的方法，在抽样时不涉及按照变量进行分层，至于按变量进行分层，是在抽样完毕后，然后根据具体的变量来对样本进行分层。（5）它的估计量的方差与真正按照比例分层随机抽样的方差差不多，只有在样本量足够大的条件下才成立。在样本量足够大的条件下，从事后分层的方差的计算公式可以看出，它的第二项会趋

18、于0，这时事后分层的估计量的方差和分层随机抽样的方差差不多。 3.8 解：（1）根据简朴随机抽样的公式，登记原始凭证的差错率的估计值为，在考虑到的条件下，登记的原始凭证的差错率的估计量的方差近似为则估计量的方差的估计值为，计算得，则原始凭证的差错率的估计的标准差为。（2）这里，每个层的层权是事先知道的，那么运用事后分层来计算登记原始凭证的差错率的估计值为，在这里。运用事后分层得到的原始凭证的差错率的估计量的方差的估计值为，在不考虑有限校正系数的条件下，又可以写为，其中，可以得到，则相应的标准差为。 3.9 解：（1）所

19、有也许的样本的数量为，所有的样本如下：（2）我们用9个样本中的一个来计算，假定抽中的样本为。一方面按照分别比估计来估计，一方面可以得到分层后的辅助变量的总体均值分别为。在这个样本中，经计算得到，，并且，则根据分别比估计可得的估计值为。运用联合比估计时，一方面计算得到辅助变量的总体均值，然后运用样本得到的重要变量和辅助变量的样本均值为，则运用联合比估计得到的的估计值为。在计算分别比估计和联合比估计的偏差，这里的方法是运用所有也许的样本，然后计算出比估计和联合估计的估计值，按照与上面相同的计算方法，计算得到其他样本时比估计和联合估计值(按照上面的样本的排列顺序)为：

20、分别计算可得，并且可以计算得到，。总体的实际均值为。则分别比估计和联合比估计的偏差分别为。，所以联合比估计的偏差比分别比估计的偏差要小。接下来计算分别比估计和联合比估计的均方误差。在这里样本量很小，不可以运用教材中的近似公式。 (3)从分别比估计和联合比估计的偏差和均方误差可以看出，联合比估计的偏差和均方误差都要小于分别比估计，也就是说在本题中，联合比估计要比分别估计好。在本题中，各层的比率和总体的比率相差基本差不多，从整个样本出发进行的联合比估计比基于每层的分别比估计更好一些，偏差更小，均方误差也更小。第4章 4.1解:由题意知,平均每

21、户家庭的订报份数为: (份) 总的订报份数为: (份) =0.358 333 所以估计方差为: =0.008 869 =141 900 4.2解: 单位总人数赞成人数赞成比例 1 51 42 0.823 529 2 62 53 0.854 839 3 49 40 0.816 327 4 73 45 0.616 438 5 101 63 0.623 762 6 48 31 0.645 833 7 65 38 0.584 615 8 49 30 0.612 245 9 73 54 0.739 72

22、6 10 61 45 0.737 705 11 58 51 0.879 31 12 52 29 0.557 692 13 65 46 0.707 692 14 49 37 0.755 102 15 55 42 0.763 636 (1) =60.733 33 所以该系统批准这一改革人数的比例为: =70.91% 其估计的方差为: =0.001 37 所以其估计的标准误为: =3.7% (2) =8% =0.006 4 得n=6.2，所以应抽取7个单位作样本。 4.3解:该集团办公费用总支出额为: =48

23、/10×(83+62+…+67+80)=3 532.8(百元) =72 765.44 =269.750 7(百元) 所以其置信度为95%的置信区间为:[3 004.089 , 4 061.511] 4.4解:=52.3 所以整个林区树的平均高度为: =5.9(米) 其估计的方差为: =0.06 所以其估计的标准误为: =0.246(米) 其95%的置信区间为:[5.42 ,6.38] 4.5解:拍摄过艺术照的女生比例为: =9/30=30% 其估计的方差为: =0.005 891 其估计的标准差为: =7.68% 4.6 解: 其中，所以最优的样

24、本学生数为2。代入得到所以最优的样本宿舍数为20。 4.7解:(1)简朴估计: 居民总的锻炼时间为: =1 650 居民平均天天用于锻炼的时间为: =3.3（即33分钟） =0.163 421 其估计的标准差为: =0.404 254 (2)比率估计: 居民总的锻炼时间为: 居民平均天天用于锻炼的时间为: =3.95（即39.5分钟） =0.071 509 其估计的标准差为: =0.267 411 (3)简朴估计下的相对误差为: r=0.404 254/3.3=12.25% 比估计下的相对误差为：

25、 r=0.267 411/3.95=6.77% 所以比估计的估计效果好。第5章 5.1解：（1）代码法列出下表： PUS Zi Zi ×1 000 000 累计 Zi ×1 000 000 代码 1 0.000 110 110 110 1～110 2 0.018 556 18 556 18 666 111～18 666 3 0.062 999 62 999 81 665 18 667～81 665 4 0.078 216 78 216 159 881 81 666～159 881 5 0.075 245 75 245

26、 235 126 159 882～235 126 6 0.073 983 73 983 309 109 235 127～309 109 7 0.076 580 76 580 385 689 309 110～385 689 8 0.038 981 38 981 424670 385 690～424 670 9 0.040 772 40 772 465 442 424 671～465 442 10 0.022 876 22 876 488 318 465 443～488 318 11 0.003 721 3 721 492 039 48

27、8 319～492 039 12 0.024 971 24 971 517 010 492 040～517 010 13 0.040 654 40 654 557 664 517 011～557 664 14 0.014 804 14 804 572 468 557 665～572 468 15 0.005 577 5 577 578 045 572 469～578 045 16 0.070 784 70 784 648 829 578 046～648 829 17 0.069 635 69 635 718 464 648 830～7

28、18 464 18 0.034 650 34 650 753 114 718 465～753 114 19 0.069 492 69 492 822 606 753 115～822 606 20 0.036 590 36 590 859 196 822 607～859 196 21 0.033 853 33 853 893 049 859 197～893 049 22 0.016 959 16 959 910 008 893 050～910 008 23 0.009 066 9 066 919 074 910 009～919 074

29、 24 0.021 795 21 795 940 869 919 075～940 869 25 0.059 185 59 185 1 000 054 940 870～1 000 054 表中，Zi不是整数，乘以1 000 000使其变为整数，这样就可以赋予每个单元与其相等的代码数。先在[1,1 000 054]中产生第一个随机数为825 011，其相应的单元为20号，则得到第一个入样单元20；把单元20去掉，剩余的24个单元，累计代码数为1 000 054-36 590=963 464，在[1,963464]中产生第二个随机数为456 731，得到第二个入样单元

30、9；再把单元9去掉，剩余的23个单元，累计代码数为963 464-40 772=922 692，在[1, 922 692]中产生第三个随机数为857 190，得到第三个入样单元24；依此类推，直至抽出所需的样本。最后抽得的10个入样单元为20,9,24,3,4,25,21,16,7,5。（2）“拉希里法”。令，，在[1,25]和[1, 0.078 216]中分别产生随机数，，第6号单元入样；把单元6去掉，剩余的24个单元，依旧等于0.078 216，在[1,24]和[1, 0.078 216]中分别产生随机数，，第10号单元不入样，重新抽取随机数；依此类推

31、直至抽出所需的样本。最后抽得的10个入样单元为6,9,18,4，1,5,19,21，16,13。 5.2.解：一方面计算出各PSU单元的入样概率,。 PSU 1 5 0.2 3,5,4,6,2 20 2 4 0.16 7,4,7,7 25 3 8 0.32 7,2,9,4,5,3,2,6 38 4 5 0.2 2,5,3,6,8 24 5 3 0.12 9,7,5 21 由可得所有也许样本的：样本 1,2 0.068 091 128.125 1,3 0.192 926 109.375

32、 1,4 0.090 434 110 1,5 0.048 549 137.5 2,3 0.147 531 137.5 2,4 0.068 091 138.125 2,5 0.036 286 165.625 3,4 0.192 926 119.375 3,5 0.106 617 146.875 4,5 0.048 549 147.5 霍维茨-汤普森估计量的方差为。 5.3解:代码法列出下表： i Zi Zi ×1 000 累计Zi ×1 000 代码 1 0.104 104 104 1～104 2 0.192

33、 192 296 105～296 3 0.138 138 434 297～434 4 0.062 62 496 435～496 5 0.052 52 548 497～548 6 0.147 147 695 549～695 7 0.089 89 784 696～784 8 0.038 38 822 785～822 9 0.057 57 879 823～879 10 0.121 121 1 000 880～1 000 表中，Zi不是整数，乘以1 000使其变为整数，这样就可以赋予每个单元与其相等的代码数。

34、在[1,1 000]之间产生三个随机数659，722，498，则它们所相应的第6，7，5号单元被抽中，即得到的n=3的PPS样本涉及单元6、单元7和单元5。 5.4解:由题意知n=3, 总体总量的估计为：总量估计的标准差为： 5.5解：由题意知，，，每个单元的入样概率。 1 2 0.086 956 52 0.173 913 2 9 0.391 304 35 0.782 609 3 3 0.130 434 78 0.260 87 4 2 0.086 956 52 0.173 913 5 1 0.043 478 26

35、0.086 957 6 6 0.260 869 57 0.521 739 所有也许的样本及每对单元入样概率为：样本 1,2 0.104 607 65.805 56 1,3 0.015 383 86.25 1,4 0.009 686 63.25 1,5 0.004 612 109.25 1,6 0.039 624 82.41 667 2,3 0.160 757 71.555 56 2,4 0.104 607 48.555 56 2,5 0.051 266 94.555 56 2,6 0.361 371 67.722

36、22 3,4 0.015 383 69 3,5 0.007 346 115 3,6 0.062 88.166 67 4,5 0.004 612 92 4,6 0.039 624 65.166 67 5,6 0.019 12 111.166 7 以实例验证式（5.5）、式（5.6）：设分别为7，20，12，4，6，22，当入样单元为单元1和单元2时，由式（5.5）可得。若由式（5.30）进行计算，有。两者的计算结果是一致的。当入样单元为其他情况时，计算过程同上，两者结果仍保持一致，从而验证了式（5.5）。由式（5.6）可得。若直接进行计算，有

37、两者计算结果不一致，可见式（5.6）不合用于π抽样的情况。 5.6 解：(1) 简朴随机抽样简朴估计量为：10,9,5,2,4。均方误差为： (2) 简朴随机抽样比估计为： ①联合比估计：联合比估计估计量为：，因此均方误差为： ②分别比估计：分别比估计估计量为：12.453 33，8.895 238，5.337 143，1.779 048，3.558 095，因此，均方误差为：（3）pps抽样。 10 7 0.388 889 9 5 0.277 778 5 3 0.166 667 2 1 0.

38、055 556 4 2 0.111 111 PPS抽样汉森-赫维茨估计量：5.142 857，6.48，6，7.2，7.2，因此均方误差为：通过以上计算可以看出，PPS抽样汉森-赫维茨估计量的均方误差最小；另一方面是简朴估计量的均方误差；两种比估计的均方误差相差不大，但都要大于汉森-赫维茨和简朴估计量的均方误差。 5.7解：设5个部门的职工总人数为150。由题意得：，，，，由于该样本为自加权的，则由于，，估计的方差为：估计的标准差为：则该公司职工上班交通平均所需的时间为34分钟，估计的标准差为6分钟。 5.8解：由题意得：，。

39、一方面计算出抽中的10个单位的概率：。单位编号车辆数单位运量总和平均每车运量 1 5 0.026 882 14 230 2 846 2 8 0.043 011 21 336 2 667 3 5 0.026 882 13 650 2 730 4 4 0.021 505 11 568 2 892 5 6 0.032 258 15 216 2 536 6 9 0.048 387 23 049 2 566 7 5 0.026 882 13 650 2 730 8 3 0.016 129 7 443

40、2 481 9 7 0.037 634 16 723 2 389 10 3 0.016 129 8 391 2 797 根据汉森-赫维茨估计量的计算公式可得即全集团的季度总运量为495 299.4吨。方差估计量的估计为：其95%的置信区间为：。第6章 6.1 解：（1）系统抽样设计原理：见教材第164页定义6.1。（2）系统抽样与整群抽样、分层抽样的关系：系统抽样按行来看，可看作一种特殊的整群抽样；将每一行的单元视为群，则总体由k个群组成，每个群的大小都是n，即系统抽样可看作从k个群中随机抽取1个群的特殊整群抽样。系

41、统抽样按列来看，可看作一种特殊的分层抽样；将每一列单元视为一层，则总体由n个层组成，每个层的大小都是k，则系统抽样可看作从n个层中随机抽取一个单元的特殊分层抽样。 6.2解：见教材第170页定理6.2的证明。 6.3解：将40个人依次编号为1～40号，且将这些编号当作首尾相接的一个环。已知总体容量N=40，样本量n=7。由于N/n=5.7，取最接近5.7的整数6，则抽样间距k=6。由于随机起点r=5，则其余样本点依次为11，17，23，29，35，1。因此，用循环等距抽样方法抽出的样本单元序号为5，11，17，23，29，35，1。 6.4解：对于总体，容量N=

42、360，汉族住户总数A=81，汉族比重P=A/N=0.225。对于样本，抽样间距k=8，样本量n=N/k=45。简朴随机抽样：系统抽样：则。其中 “系统样本” 随机起点号码r “系统样本” 的单元组成 “系统样本”中汉族住户总数 “系统样本”中汉族住户比例 1 2 3 4 5 6 7 8 略（样本量45） 7 13 10 10 12 9 10 10 7/45 13/45 10/45 10/45 12/45 9/45 10/45 10/45 6.5解：（1）估计汉族所占比例，采用等距抽样效果最佳。

43、理由：系统抽样可看作一种特殊的整群抽样，则希望系统抽样抽取的样本能更好地体现总体性质。由于三个民族的居民居住地紧邻，采用等距抽样能使样本中三个民族的分布与总体分布类似，即差异较小。若采用简朴随机抽样，也许出现的情况是，抽取的样本中有过多的汉族居民，而等距抽样会避免该现象的发生。（2）估计男性所占比例，采用简朴随机抽样效果最佳。理由：由题意知，每户人口登记顺序为：丈夫、妻子、孩子、其别人，且平均每户有5口人。若采用等距抽样，由于抽样间距k=5，若随机起点号码为1，则第一户抽取丈夫，第二胡抽取丈夫的也许性较大，依此类推，抽取的样本中，丈夫所占的比重较大，估计时误差会很大。而简朴

44、随机抽样会避免该情况的发生。（3）估计孩子所占比例，理由同（2）。 6.6解：（1）估计男性所占比例。已知总体容量N=50，男性总数A=24，男性所占比例P=A/N=0.48。抽样间距k=5，样本量n=N/k=10。简朴随机抽样：系统抽样：则。其中 “系统样本” 随机起点号码r “系统样本”的单元组成 “系统样本” 中男性总数 “系统样本” 中男性比例 1 2 3 4 5 M M M F f M F F f M F F F M M F m m M F f f m F F f f M F f m

45、 m f m f f m F f M f f M m m M M m m F 5 5 2 5 7 0.5 0.5 0.2 0.5 0.7 （2）估计孩子所占比例。已知总体容量N=50，孩子总数A=24，孩子所占比例P=A/N=0.48。简朴随机抽样：系统抽样：则。（3）估计职业住户中人员所占比例。已知总体容量N=50，职业住户总数A=19，职业住户所占比例P

46、A/N=0.38。简朴随机抽样：系统抽样：则。 6.7解：已知总体容量N=15，总体均值。样本量n=3，抽样间距k=N/n=5。简朴随机抽样：系统抽样：其中 “系统样本” 随机起点号码r “系统样本” 的单元组成 “系统样本” 样本均值 1 2 3 4 5 1，6，11 2，7，12 3，8，13 4，9，14 5，10，15 6 7 8 9 10 6.8解：书稿平均错字数抽样方差的估计如下：（1）合并层方法估计抽样方差为：（2）连续差方法估

47、计抽样方差为：（3）交叉子样本方法估计抽样方差为：第7章 7.1解:根据表中数据,可计算各层的权重: =0.17, =0.25, =0.28, =0.22, =0.08 全县棉花的种植面积为: =0.17×90/17+0.25×1 806/25 +0.28×4 423/28+0.22×5 607/22+0.08×4 101/8 =164.27 根据式(7.4), 的抽样方差为: =14.578 5+25.141 46 =39.719 96 所以全县棉花种植面积的抽样标准误的估计为: 12 604.75 7.2 解:(1) 由题意

48、知，，，，，根据公式（7.10）有根据公式（7.8），有 ≈ ≈0.000 667 (2)调查总费用为3 000元，每一个抽样单元的调查费用为10元，采用简朴随机抽样，样本量可以达成300，估计量的方差为：则有由此可知二重抽样效率更高。 7.3 解:由题知=602,由表内数据计算得 =568.583 3 ,=568.25,1.000 587，=256 154.9 ,=278 836.9 ,=256 262 根据式(7.11),该地区当年平均每村牛的年末头数为: 602(头) 所以该地区年末牛的总头数为： 745 713(头)

49、根据式(7.15), 的方差估计为: 所以该地区年末牛的总头数估计的标准差为: 46 398(头) 7.4 解：（1）根据公式（7.10），有根据公式（7.8），有即二重抽样的样本最优分派方案是第一层分派63个样本，第二层分派31个样本。（2）令c1/c2h=a,则c1/= c2h=a,若二重抽样的精度高于简朴随机抽样，则有 7.5解:由题意知: n1=300, n2=200, m=62,该保护区现有羚羊总数为: (头) 其抽样的标准误为: (头) 7.6 解:(1)由题意知: n1=7, n2=12

50、 m=4,该地区渔民总数为: (人) 其抽样的标准误为: (人) 其95%的置信区间为: =[12,28] (2) 由题意知: n1=16, n2=19, m=11,该地区渔民总数为: (人) 其抽样的标准误为: (人) 其95%的置信区间为: =[22,34] (3)计算这些估计时的前提假设: ①总体是封闭的——两次抽样间没有渔民进入或离开该地区，即对每次抽样而言,N是相同的。这规定渔民在两次抽样间不能离开该地区，其他渔民也不能进入，但这在实际中是很难做到的。 ②每个样本都是来自总体的简朴随机抽样，即该地区每个渔民都有同样的机会被找到。在实际中由于

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？