1、应用抽样技术答案应用抽样技术答案第1页第二章抽样技术基本概念2.7(1)抽样分布:33.674.3355.676.3371/101/102/102/102/101/101/10(2)期望为5,方差为4/3(3)抽样标准误1.155(4)抽样极限误差2.263(5)置信区间(3.407,7.933)第2页第三章简单随机抽样第3页3.3为调查某中学学生每个月购书支出水平,在全校名学生中,用不放回简单随机抽样方法抽得一个样本。对每个抽中学生调查其上个月购书支出金额yi(如表1所表示)。(1)在95%置信度下预计该校学生该月平均购书支出额;(2)试预计该校学生该月购书支出超出70元人数;(3)假如要求
2、相对误差限不超出10%,以95%置信度预计该校学生该月购书支出超出70元人数百分比,样本量最少应为多少。第4页样本样本序号序号支出额支出额(元)(元)样本样本序号序号支出额支出额(元)(元)样本样本序号序号支出额支出额(元)(元)12345678910856242155039836532461112131415161718192020753441586395120195721222324252627282930494595362545128452984 表1 30名学生某月购书支出金额样本数据第5页3.3解:解:(1)依据题意和表依据题意和表1数据,有:数据,有:所以,对该校学生某月人均购书支
3、出额预计为56.07(元),因为置信度95%对应 t=1.96,所以,能够以95%把握说该学生该月人均购书支出额大约在56.071.965.115,即50.96-61.19元之间。,第6页(2)易知,N=1750,n=30,95%95%置信区间为置信区间为:95%95%置信区间为置信区间为:(159(159,776)776)第7页(3)N=1750(3)N=1750,n=30n=30,n n1 1=8,t=1.96,p=0.267,=8,t=1.96,p=0.267,q=1-0.267=0.733 q=1-0.267=0.733 由此可计算得:计算结果说明,最少应抽取一个样本量为659简单随机
4、样本,才能满足95%置信度条件下相对误差不超出10%精度要求。n=n0/1+(n01)/N=1054.64/1+1053.64/1750=658.2942=659第8页3.5要调查甲乙两种疾病发病率,从历史资料得知,甲种疾病发病率为8,乙种疾病发病率为5,求:(1)要得到相同标准差0.05,采取简单随机抽样各需要多大样本量?(2)要得到相同变异系数0.05,又各需要多大样本量?第9页3.5解:已知 P1=0.08,Q1=1-P1=0.92;P2=0.05,Q2=1P2=0.95;V(p)=0.05*0.05,(1)由得:由得:(2)第10页第四章第四章分层抽样分层抽样4.3解:解:(1),(2
5、)按百分比分配)按百分比分配 n=186n=186,n n1 1=57=57,n n2 2=92=92,n n3 3=37=37(3)Neyman分配分配 n=175,n1=33,n2=99,n3=434.5 ,置信区间(,置信区间(60.63,90.95)元。)元。第11页4.6解解已知已知W1=0.2,W2=0.3,W3=0.5,P1=0.1,P2=0.2,P3=0.4P=hWhPh=0.28,Q=1P=0.72n=100简单随机抽样预计方差:简单随机抽样预计方差:V(Psrs)(1f)/100PQ0.28*0.72/100=0.00按百分比分配分层抽样预计方差:按百分比分配分层抽样预计方
6、差:V(Pprop)hWh2(1fh)/nhPhQhn-1hWhPhQh=n-10.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6=0.186n-1故故n92.2693第12页4.8解解已知已知W1=0.7,W2=0.3,p1=1/43,p2=2/57(1)简单随机抽样)简单随机抽样Psrs=(1+2)/100=0.03V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937(2)事后分层)事后分层Ppst=hWhph=0.7*1/43+0.3*2/57=0.0268V(Ppst)=hWh2(1fh)/(nh1)phqh=0.72*1/42(1/43)(42
7、/43)+0.32*1/56(2/57)(55/57)=0.00031942第13页第五章比率预计与回归预计5.2 N,n36,10.95,t1.96,f=n/N0.018,0.000015359,0.003920.00392 置信区间为置信区间为40.93%,42.47%。第14页第五章比率预计与回归预计5.3当 时用第一个方法,当 时用第二种方法,当 时两种方法都可使用。这是因为:,若 则 0 0第15页5.45.4解解:V(YR)(1f)/nY2CY2+CX22rCYCX V(Ysrs)=(1f)/nSY2 =(1f)/n CY2Y2 故故 V(YR)/V(Ysrs)=12rCX/CYC
8、X2/CY2 =1-2*0.696*1.054/1.063-1.0542/1.0632 =1-0.397076 =0.602924第16页5.5证实:由(5.6)得:第17页5.65.6解解(1)简单预计简单预计:总产量总产量:Ysrs=(N/n)i=1n Yi=(140/10)1400+1120+480 =176400(斤斤)v(Ysrs)=N2(1f)/nSY2 =1402(110/140)/10*194911.1 =354738222 se(Ysrs)=18834.496第18页5.65.6解解(2)比率预计比率预计:R=i=1n Yi/i=1n Xi=12600/29.7 =424.2
9、424 YR=XR=460*424.2424 =195151.5(斤斤)v(YR)=N2(1f)/n*i=1n(yiRXi)2/(n-1)=1402(110/140)/90*124363.5 =25149054 se(Ysrs)=5014.883面积面积/亩亩产量产量/斤斤3 3140014002.52.5112011204.24.2171017103.63.6150015001.81.87207205.25.2198019803.23.2131013102.42.4108010802.62.6130013001.21.248048029.729.71260012600第19页5.65.6解解
10、(3)回归预计回归预计:回归系数回归系数 b=Sxy/Sxx2=370.5965 ylr=xb(xX)=1260370.5965*(2.97460/140)=1377.089 Ylr=Nylr=192792.47(斤斤)v(Ylr)=N2(1f)/n*i=1n yiyb(xix)2/(n-2)=1402(110/140)/80*89480.59 =20356834 se(Ylr)=4511.855第20页5.7解:故预计量 即使与 一样都是 无偏预计,但方差大于 方差,当 时 ,故 不优于 。第21页0.22390.25140.15480.05730.04870.10220.06760.098
11、1第六章不等概率抽样6.1假设对某个总体,事先给定每个单位与规模成百分比比值Zi,以下表,试用代码法抽出一个n=3PPS样本。表表1 总体单位规模比值总体单位规模比值第22页6.1解:令,则能够得到下表,从11000中产生n=3个随机数,设为108,597,754,则第二、第六和第七个单位入样。iMi累计累计Mi代码代码1234567898102572516748154223982002575085756237771000198992002012572585085095755766236277777781000M0=1000第23页2819541 0851 6292157989201 8345
12、6781 3536396506081 2387465125941234子企业序号子企业 序号6.3欲预计某大型企业年度总利润,已知该企业有8个子企业,下表是各子企业上年利润Xi 和当年利润Yi 数据,以Mi作为单位Xi大小度量,对子企业进行PPS抽样,设n=3,试与简单随机抽样作精度比较。表表2 某企业各子企业上年与当年利润(单位:万元)某企业各子企业上年与当年利润(单位:万元)第24页对子企业进行抽样,依据教材(对子企业进行抽样,依据教材(6.7)式:)式:第25页显然对 抽样,预计量精度有显著提升。假如对子企业进行简单随机抽样,一样样本量时假如对子企业进行简单随机抽样,一样样本量时简单简单
13、预计方差为:预计方差为:抽样设计效应是:第26页6.4解解(1)PPS样本抽样方法可采取代码法或拉希里法样本抽样方法可采取代码法或拉希里法.(2)若在时间长度若在时间长度2、8、1、7h中打入电话数量分别为中打入电话数量分别为8、29、5、28,则客户打入电话总数:,则客户打入电话总数:YHH=(35/4)8/2+29/8+5/1+28/7=145.46875(3)预计量方差预计预计量方差预计v(YHH)=n(n1)-1i=1n(yi/ziYHH)2=352/(4*3)(8/24.15625)2+(29/84.15625)2+(5/14.15625)2+(28/74.15625)2=106.4
14、697第27页6.5设总体设总体N=3,zi=1/2,1/3,1/6,Yi=10,8,5,采取采取n=2PS抽样,求抽样,求i,ij(i,j=1,2,3)。解:解:(1)(1)全部可能样本为:(全部可能样本为:(1010,8 8),(),(1010,5 5),(),(8 8,1010),(),(8 8,5 5),(),(5 5,1010),(),(5 5,8 8),其概率分别为:),其概率分别为:第28页所以:所以:第29页6.6解解(1)简单随机抽样简单预计简单随机抽样简单预计Y=2+3+6+8+11+14=44S2=(N1)-1i=1N(YiY)2=(2*322)2+(3*322)2+(6
15、*322)2+(8*322)2+(11*322)2+(14*322)2/(5*9)=322/15=21.4667总值预计方差预计总值预计方差预计V(Ysrs)=N2(1f)/nS2=36(12/6)/2322/15=1288/5=257.6第30页6.6解解(2)简单随机抽样比率预计简单随机抽样比率预计X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,R=44/36=11/9,f=2/6=1/3总值预计方差预计总值预计方差预计V(YR)N2(1f)/ni=1N(YiRXi)2/(N1)=36(12/6)/10(21*11/9)2+(32*11/9)2+(64*11/9)
16、2+(87*11/9)2+(119*11/9)2+(1413*11/9)2=(12/5)*(488/81)=14.46第31页6.6解解(3)PPS抽样汉森抽样汉森赫维茨预计赫维茨预计X=1+2+4+7+9+13=36,Y=2+3+6+8+11+14=44,取取Zi=Xi/X,(i=1,2,6)总值预计方差预计总值预计方差预计V(YHH)=(1/n)i=1NZi(Yi/ZiY)2=(1/nX)i=1NXi(XYi/XiY)2=(1/72)1*(36*2/144)2+2*(36*3/244)2+4*(36*6/444)2+7*(36*8/744)2+9*(36*11/944)2+13*(36*1
17、4/1344)2=24.96第32页第七章 整群抽样7.1(略)7.3解:不是 无偏预计,此因类似于 有 因为对群进行简单随机抽样,故 ,从而,若取则 第33页7.2样本样本耐用时数耐用时数1 1 10361036 10751075 11251125995995 10881088 10651065 10231023988988 100210029949942 2 10471047 11261126 11831183 10581058 11421142 10981098945945968968 103610369879873 3 10461046 11531153 10871087984984
18、12241224998998 10321032976976 110311039589584 4 11531153 10781078 10391039 10061006 12141214 10761076986986994994 10481048112611265 5 12161216 10941094 10961096 10351035 10041004 10531053 10041004 11221122 10801080115211526 6964964 11361136 11851185 10211021 10071007948948 10241024975975 10831083994
19、9947 7 11131113 10931093 10051005 10881088997997 10341034985985997997 10051005112011208 8 10471047 10971097 11361136989989 10731073 11021102976976984984 1004100410821082第34页样样本本耐用时数耐用时数均值均值标准差标准差1 110361036107510751125112599599510881088 10651065 1023102398898810021002994994 1039.11039.1 47.0990747.0
20、99072 21047104711261126118311831058105811421142 109810989459459689681036103698798710591059 78.4644378.464433 310461046115311531087108798498412241224998998 1032103297697611031103958958 1056.11056.1 85.6549385.654934 41153115310781078103910391006100612141214 1076107698698699499410481048 11261126107210
21、7273.932473.93245 51216121610941094109610961035103510041004 10531053 10041004 1122112210801080 11521152 1085.61085.666.573666.57366 696496411361136118511851021102110071007948948 1024102497597510831083994994 1033.71033.7 77.4453977.445397 711131113109310931005100510881088997997 1034103498598599799710
22、051005 11201120 1043.71043.7 53.6595253.659528 810471047109710971136113698998910731073 1102110297697698498410041004 1082108210491049 57.2809857.28098第35页y=(1/80)ijyij=1054.78,sb2=(10/7)i(yiy)2=3017.65V(y)=(1f)/(aM)sb2=(18/)/(8*10)*3017.65=37.5697Se(y)=6.1294(1)以每盒灯泡为群实施整群抽样以每盒灯泡为群实施整群抽样第36页y=(1/80)i
23、jyij=1054.78,s2=(1/79)ij(yijy)2=4628.667V(y)=(1f)/(aM)s2=(180/0)/(8*10)*4628.667=57.6269Se(y)=7.5912(2)以从以从0个灯泡中按简单随机抽样个灯泡中按简单随机抽样第37页y=(1/80)ijyij=1054.78,Sw2=(1/a)isi2=1/(a(M1)ij(yijyi)2=4721.0056r=(sb2sw2)/sb2+(M1)sw2=-0.04723Deff=V(y)/V(y)=1+(M1)r=0.66947.4对对7.2题群内相关系数进行预计题群内相关系数进行预计第38页7.5解:因为农
24、户是调查单位,故以村为抽样单位抽样是整群抽样,村即是群。对于村现有生猪存栏数,也有户数,所以在村大小不等整群抽样下,既可使用简单预计量预计生猪存栏数,也能够户数为辅助指标结构比率预计和回归预计来预计生猪存栏数。(1)简单预计量(2)以户数为辅助变量比率预计量314.452,98880,365.718,1337500.934 第39页(3)以户数为辅助变量回归预计量 1080000.803(100000200475)11显然以户数为辅助变量结构回归预计量效果最好。此因各村显然以户数为辅助变量结构回归预计量效果最好。此因各村生猪存栏数与村规模(户数)有高度相关性,生猪存栏数与村规模(户数)有高度相
25、关性,r r0.9340.934,故,故采取回归预计量精度最高。采取回归预计量精度最高。第40页企业企业已婚女职员人数/人Mi平均理想婚龄平均理想婚龄/岁岁 y yi i1 149549524.124.12 21020102022.822.83 384484425.525.54 41518151824.624.65 563563525.825.86 639439423.723.77 72346234624.524.57.6第41页7.6(1)按简单随机抽样抽取按简单随机抽样抽取,简单预计量预计简单预计量预计y=(1/7)iMiyi=25321.1571M=35680/35=1019.4286Y
26、=y/M=24.8386v(y)=(1f)/(a(a1)M2)i(yiy)2=(17/35)/(42*1019.42862)*1711911436=31.3768Se(y)=5.6015第42页7.6(2)按简单随机抽样抽取按简单随机抽样抽取,采取比率预计量预计采取比率预计量预计YR=iyi/iMi=177248.1/7252=24.4413v(y)=(1f)/(a(a1)m2)i(yiYmi)2=(17/35)/(42*1019.42862)*4536349.45=0.0831445Se(y)=0.2883第43页7.6(3)按按PPS抽样抽取抽样抽取,抽样概率与企业女职员人数成百分比抽样概
27、率与企业女职员人数成百分比YHH=iyi/a=24.4286v(Y)=1/(a(a1)i(yiy)2=(1/42)*6.3542857=0.15129se(Y)=0.38896第44页7.7证实分别以 记整群抽样、简单随机抽样预计量:第45页7.8市县编号市县编号社会从业人员数社会从业人员数/万人万人 m mi i第三产业从业人员数第三产业从业人员数/万人万人 t ti i181837.60 37.60 7.00 7.00 323241.30 41.30 7.39 7.39 434334.40 34.40 6.30 6.30 656528.90 28.90 4.97 4.97 878757.60 57.60 11.23 11.23 第46页pR=iti/imi=36.89/199.8=0.1846,7.8v(pR)=(1f)/(a(a1)m2)i(tipRmi)2=(15/110)/(20*39.962)*0.549388=0.00001642se(pR)=0.004052第47页