1、
可化为线性模型的非线性模型(续)
这类非线性模型常见的几种形式:
(1)用于测度弹性的指数模型;
(2)用于测度增长率的幂函数模型;
(3)双曲线模型。
双曲线模型的应用
非线性回归模型的形式为
yi=β0+β11xi+εi
做法是:将非线性回归化为线性回归模型,令 xi*=1/xi,即
yi=β0+β1xi*+εi
例题:下表给出了1950年-1966年17年间,英国通货膨胀率(y)和失业率(x)之间的统计数据:
年份
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
196
2、1
1962
1963
1964
1965
1966
通胀率
1.4
1.1
1.5
1.5
1.2
1.0
1.1
1.3
1.8
1.9
1.5
1.4
1.8
2.1
1.5
1.3
1.4
失业率
1.8
8.5
8.4
4.5
4.3
6.9
8.0
5.0
3.6
2.6
2.6
4.2
3.6
3.7
4.8
4.3
4.6
试确定两者之间的关系。
注意:在经济学中有一个非常著名的曲线,称为菲利普斯曲线,它描述了通胀率或工资变化率与失业率之间的关系。此曲线为双曲线。
程序如下:
data p
3、hilips;
input inflat unemployment@@;
unemployment1=1/unemployment;
cards;
1.4 1.8 1.1 8.5 1.5 8.4 1.5 4.5 1.2 4.3 1.0 6.9
1.1 8.0 1.3 5.0 1.8 3.6 1.9 2.6 1.5 2.6 1.4 4.2
1.8 3.6 2.1 3.7 1.5 4.8 1.3 4.3 1.4 4.6
;
proc reg;
model inflat=unemployment1/r;
plot r.*unemployment1;
run;
程序说明:
程
4、序首先创建一个名为philips的数据集,其中,变量inflat代表通胀率,unemployment代表失业率;
而unemployment1则通过赋值语句计算unemployment的倒数。
线性回归模型, 其中model语句中的选项r要求输出每个观测的预测值、残差、标准化残差、COOK的D统计量;并画出了残差图。
REG过程在多元线性回归分析中的应用
例题:某大型家具厂过去两年中引进了14种新产品。市场调查部需要测定头一年的销售额与某个适当的自变量之间的关系,作为今后指定推销计划和广告计划之用。调查人员建立了一
5、个名为“顾客知悉率”的变量,用产品问世后3个月内听说过这种产品的顾客的百分比来测量,调查数据如下表:
产品
A
B
C
D
E
F
G
H
I
J
K
L
M
N
销售额
(千元)
82
46
17
21
112
105
65
55
80
43
79
24
30
11
顾客知
悉率(%)
50
45
15
15
70
75
60
40
60
25
50
20
30
5
广告费
(千元)
1.8
1.2
0.4
0.5
2.5
2.5
1.5
1.2
1.6
1.0
1.5
6、0.7
1.0
0.8
价格(元)
7.3
5.1
4.2
3.4
10.0
9.8
7.9
5.8
7.0
4.7
6.9
3.8
5.6
2.8
试分析产品销售额与顾客知悉率、广告费及价格之间的关系;
程序如下:
data quantity;
input sales ads expend price@@;
cards;
82 50 1.8 7.3 46 45 1.2 5.1 17 15 0.4 4.2
21 15 0.5 3.4 112 70 2.5 10.0 105 75 2.5 9.8
65 60 1.5 7.9 55 40 1.2
7、 5.8 80 60 1.6 7.0
43 25 1.0 4.7 79 50 1.5 6.9 24 20 0.7 3.8
30 30 1.0 5.6 11 5 0.8 2.8
;
proc reg;
model sales=ads expend price/selection=stepwise sls=0.05 sle=0.2 r;
plot student.*p.='*';
run;
model sales=ads expend price/selection=stepwise sls=0.05 sle=0.2 noint r;
plot student.*p.='*';
8、
run;
程序说明:
首先利用data步创建一个名为quantity的SAS数据集,其中,变量sales代表销售额,ads代表顾客知悉率,expend代表广告费用,price代表产品价格。
然后利用reg过程对变量ads、expend、price关于sales进行回归,其中选项“selection=stepwise”表示逐步回归(选元,并给出回归结果),“sls=0.05”表示变量保留在模型中的显著性水平为0.05,
而“sle=0.2”则表示变量选入到模型中的显著性水平为0.2 。
程序中,第一个model语句中包含截距项,而第二个model语句则不含有截距项,目的是为了比较两个模型的优劣。
plot语句画标准化残差与预测值的残差图。