资源描述
抽样技术作业一(2.5——2.10)
袁闪闪 2120502119
2.5 解:这里=200,=20,由表中的数据可得:
因而该小区平均的文化支出的95%的近似置信区间为:
所以该小区平均的文化支出的估计为144.5元,其95%的置信区间为
(132.55元,156.45元)。
2.6解:有题意可得:=350,=50, =1120,=25600,
所以粮食总产量为:
代入数据得:
所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:=1000,=2,=0.05,=68,r=70%,
带入公式,可得初始样本量:
由于有效回答率为r=70%,,对样本容量进行再调整:
所以样本最终确定为88。
2.8解:由题意已知:=100,=10, =2135,=25,=22,
方法一:简单随机估计:
方法二:比估计:
由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。
总产量的估计值为:
(吨)
2.9解:这里=200,=20。由2.5可得简单估计量的均值和标准差估计:
引入了家庭的总支出()作为辅助变量,进行比率估计。由于文化支出属于总支出的一部分,主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的。
由题意可得:
全部家庭的总支出的平均:
样本家庭总支出的平均为:
文化支出的比率估计量为:
在样本量较大的条件:,
由计算可得两个变量的样本方差为:
之间的相关系数的估计值:,
代入比率估计量的方差的估计公式,可得:
这个数值比简单估计量的标准差估计值要小很多。
所以全部家庭的平均文化支出的的置信区间为
。
比较比估计和简单估计的效率,,可以看出比估计量比简单估计量的效率更高。
2.10解:这里=120,=10。由表中数据可得简单估计量的均值和标准差估计:
因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,而且这种相关关系是稳定的,所以利用回归估计的方法,对牛肉现在的重量进行估计。
由题意可得:
肉牛的原重量的平均数值为:
样本肉牛的原质量平均估计为:
两个随机变量相关系数的估计值为:,
样本肉牛的原质量方差估计为:
回归估计量精度最高的回归系数的估计值为:
到肉牛现重量的回归估计量为:。
回归估计量的方差估计为:。
比较回归估计和简单估计的效率,。
因为在本题中,存在肉牛原重量这个较好的辅助变量,所以不难理解回归估计量的精度要好于简单估计量,即回归估计量比简单估计量的效率更高。
Code:
#######抽样技术作业第二章2.5
library(survey)
income<-read.delim("income2.5.txt" ) #读入数据
N<-200
n<-20
mean<-mean(income[,1]);mean #求均值
s<-var(income);s #求样本方差
c<-sqrt(s*(1-n/N)/n);c #求估计量的方差估计
d<-qnorm(1-0.025);
d1<-mean-c*d;d1
d2<-mean+c*d;d2 #做置信区间
#######抽样技术作业第二章2.6
N<-350
n<-50
s<-25600
c<-N*sqrt(s*(1-n/N)/n);c
d<-qnorm(1-0.025);
d1<-392000-c*d;d1
d2<-392000+c*d;d2
#######抽样技术作业第二章2.7
N<-1000
d<-2
s<-68
r<-0.7
z<-qnorm(1-0.025);
n1<-(N*z^2*s)/(N*d^2+z^2*s);n1 #求样本量
n<-n1/r;n
#######抽样技术作业第二章2.8
y<-25
x<-22
X<-2135
Y<-X*y/x;Y
#######抽样技术作业第二章2.9
income<-read.delim("income2.5.txt");income
income1<-read.delim("income2.9.txt");income1
N<-200
n<-20
mean_X<-1600
mean_y<-mean(income[,1]);mean_y
mean_x<-mean(income1[,1]);mean_x
R<-mean_y/mean_x;R #求比率估计
mean_yr<-R*mean_X;mean_yr #利用比估计估计均值
s_y<-var(income);s_y
s_x<-var(income1);s_x
p<-cor(income,income1);p #求相关系数
f<-(1-n/N)/n;
c_yr<-sqrt(f*(s_y-2*R*p*sqrt(s_y)*sqrt(s_x)+R^2*s_x));c_yr#求比估计的方差估计
c_y<-sqrt(s_y*(1-n/N)/n);c
t<-c_yr/c_y;t
d<-qnorm(1-0.025);
d1<-mean_yr-c*d;d1
d2<-mean_yr+c*d;d2 #做置信区间
#######抽样技术作业第二章2.10 回归估计
weight1<-read.delim("weight2.10.txt");weight1
weight2<-read.delim("weight2.11.txt");weight2
N<-120
n<-10
X<-100
mean_y<-mean(weight2);mean_y
mean_x<-mean(weight1);mean_x
s_y<-var(weight2);s_y
s_x<-var(weight1);s_x
p<-cor(weight1,weight2);p
b<-p*sqrt(s_y/s_x);b #求回归系数估计
mean_ylr<-mean_y+b*(X-mean_x);mean_ylr #求回归估计量
fn<-(1-n/N)/n;
v_y<-s_y*fn;v_y
v_ylr<-fn*s_y*(1-p^2);v_ylr
t<-v_ylr/v_y;t #比较回归估计和简单估计的效率
展开阅读全文