1、精品文档1、简答题1. 为什么分层抽样常在全国范围抽样调查中被采用?答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行推算。 (3分)(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。(3分)(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2分)(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。2. 整群抽样的优缺点是什么?答:整群抽样可以简化抽样框的编制。样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而不同
2、群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。3. 简述分层的原则及如何选择分层标志?答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差异小”。最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一个变量。4. 为什么多阶抽样常在大型抽样调查中被采用?答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时
3、又避免了对小单元过多调查造成的浪费,充分发挥抽样调查的优点。(2)由于多阶抽样是分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。所以多阶抽样常用于大范围的且抽样单元为各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。2、 简单随机抽样 【例1.1】 我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度为95的区间估计。如表 简单随机样本的指标值序号i123456789
4、1045204661508解:依题意。N=100,n=10,计算样本均值及样本方差为: 因此对总体平均水平的估计为:对的方差及标准差的估计为:由置信度对应的1.96,因此,可以以95的把握说总体平均水平大约在之间,即2.42957.570之间。【例1.2】(续例1.1)如果采取放回抽样,则相应结果为多少?解:由上例知,由置信度对应的,因此,可以以95的把握说总体平均水平大约在即2.2905,7.7095之间。【例1.3】某销售公司希望了解全部3 000家客户对该公司的综合满意程度,决定用电话来调查一个简单随机样本。这时,销售公司希望以95的把握保证客户满意的总体比例P在样本比例p10的范围内,
5、但对总体比例P无法给出一个大致的范围。这时,应该调查多少个客户,才能保证对总体比例估计的要求?(P30)解:由该问题给出的条件:N=3 000,d=10=0.1,置信度95,对应的,由于无法得到P的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的:【例1.4】某居民区共10000户,欲估计该居民区的用水量。采用简单随机抽样抽选了100户,得样本均值为12.5吨,样本方差为1252吨。(1)估计该居民区的总用水量的置信度95%的置信区间。(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20%,试问应抽多少户作样本?(P31)解:(1)或(2) 3、不等概率抽样【例2.1】
6、某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表6.3。已知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总头数某县养猪专业户年生猪出栏头数调查样本资料 (单位: 头)1234567891015239298312429131975134371524518513317374871112131415161718192040321726113625538422581866915649221145332
7、8830421222324252627281926372174318301241602151044933696177注: 表示养猪专业户样本编号,表示各专业户生猪上年末存栏数,表示各专业户调查年生猪出栏头数,其中第2、19号专业户被抽中两次.解:根据题中所给资料,(头)(P56 ,3.1.2)(头) (P58,3.1.5)4、分层随机抽样【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为
8、2546元。求全市年平均户收入的置信度为90%的置信区间。(P75) 【例3.2】在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。调查结果如表所示。试以95% 的置信度估计总体中会计算机者占的比例。(P75)计算机使用情况调查层人数入样人数样本中会使用计算机的人数30岁以下778171243035岁7497手工艺制品是我国一种传统文化的象征,它品种多样,方式新颖,制作简单,深受广大学生朋友的喜欢。当今大学生的消费行为表现在追求新颖,追求时尚。追求个性,表现自我的消费趋向:购买行为有较强的感情色彩,比起男生热衷于的网络游戏,极限运动,手工艺制品更得女生的喜欢。68随科技的迅速发展,
9、人们的生活日益趋向便捷、快速,方便,对于我国传统的手工艺制作,也很少有人问津,因此,我组想借此创业机会,在校园内开个DIY创意小屋。它包括编织、刺绣、串珠等,让我们传统的手工制作也能走进大学,丰富我们的生活。12在调查中我们注意到大多数同学都比较注重工艺品的价格,点面氛围及服务。3640岁(三)上海的文化对饰品市场的影响977989在大学生对DIY手工艺品价位调查中,发现有46% 的女生认为在十元以下的价位是可以接受;48% 的认为在10-15元;6% 的则认为50-100元能接受。如图1-2所示222003年,全年商品消费价格总水平比上年上升1%。消费品市场销售平稳增长。全年完成社会消费品零
10、售总额2220.64亿元,比上年增长9.1%。4145岁合计50100%4627(五)DIY手工艺品的“价格弹性化”421145岁以上合计50100%5366功能性手工艺品。不同的玉石具有不同的功效,比如石榴石可以促进血液循环,改善风湿和关节炎;白水晶则可以增强记忆力;茶晶能够帮助镇定情绪,缓解失眠、头昏等症状。顾客可以根据自己的需要和喜好自行搭配,每一件都独一无二、与众不同。504总计35050320解:由表中数据得到:5、样本量在各层的分配【例3.3】调查某地区的2850户居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为层,每层按简单随机抽样抽取户,调查数据如下,样
11、本量为40,若按比例分配和Neyman分配时,各层样本量应为多少? 样本户奶制品年消费支出层居民户总数样本户奶制品年消费支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025解:由表得各层样本均值及方差为按比例分配时,各层样本量为(P82)即各层样本量分别为3,6,10,21。对于Neyman分配,从而同理有即各层样本量分别为3,6,24,7。 【例3.4】 某高校欲了解在校学生用于课外进修(如各种考证辅导班、
12、外语辅导班等)的开支,在全校8 000名学生中抽出了一个200人的简单随机样本。根据学生科的统计,本科生人数为全校学生的70,调查最近一个学期课外进修支出(单位:元)的结果如表在校学生课外进修开支调查结果层()层权()样本量()/人样本均值()/元样本标准差()/元本科生0.7120253.4231.00研究生0.380329.4367.00合计1200276.2294.57试估汁全校学生用于课外进修的平均开支。解:全校学生用于课外进修的平均开支为: 估计量方差的样本估计为:(P75,4.1.8) 估计的标准差为:如果是采用简单随机抽样,则6、比率、回归与差估计【例4.1】某小区有1920户,
13、从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭人口,得数据:试对人均住房面积作点估计和置信度为95%的区间估计。解:由已知条件有: (P36,2.5.2)【例4.2】交通运输统计中有三个重要的指标,即运量、周转量与平均运距,三者关系如下:平均运距=周转量/运量。为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取32辆货车,记录每辆货车在一个月内的运量xi(单位吨)与周转量yi(单位吨公里),经计算得:试用比估计给出平均运距R估计和其标准差的估计。解:【例4.3】某地有规模以下工业企业127个工友固定资产价值6794.5万元,从中随机抽取20个企业调查工业产值和固定资产价值,资料如表所示。试估计该地区规模以下工业总产值。企业固定资产价值及工业产值(单位:万元)固定资产价值工业产值固定资产价值工业产值3532.05045.54340.27065.05047.56256.04041.55855.05551.05257.05853.46354.23833.86456.54542.85348.24745.65449.84240.85649.2解:由调查资料可以看出,工业产值与固定资产价值有线性相关关系,故可采用回归估计量对工业产值进行估计。经计算有(P49.2.6.10)故该地区规模以下工业总产值的回归估计为精品文档