资源描述
回归方程和独立性检验知识点讲解
回归分析和独立性检验
一、回归分析
1、回归直线方程 (叫做解释变量,叫做预报变量)
其中= (由最小二乘法得出,考试时给出此公式中的一个)
( 此式说明:回归直线过样本的中心点 ,也就是平均值点。 )
2、几条结论:
(1)回归直线过样本的中心点。
(2)b>0时,y与x正相关,散点图呈上升趋势;b<0时,y与x负相关,散点图呈下降趋势。
(3)斜率b的含义(举例):
如果回归方程为y=2.5x+2, 说明x增加1个单位时,y平均增加2.5个单位;
如果回归方程为y=-2.5x+2,说明x增加1个单位时,y平均减少2.5个单位。
(4)相关系数表示变量的相关程度。 范围:,即
越大,相关性越强。时,y与x正相关;时,y与x负相关。
(5)相关指数表示模型的拟合效果。 范围:
越大,拟合效果越好,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,
带状区域宽度越窄,拟合精度越高)。
表示解释变量对于预报变量变化的贡献率。
例如:,表明“解释了64%的变化”,或者说“的差异有64%是由引起的”。
(6)线性回归模型 , 其中叫做随机误差。(是由和共同确定的。)
二、独立性检验
1、原理:假设性检验(类似反证法原理)。
一般情况下:假设分类变量X和Y之间没有关系,通过计算值,然后查表对照相应的概率P,
发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1-P),
也就是“X和Y有关系”。(表中的就是的观测值,即)
2、22列联表:
总计
总计
(考试给出)
部分对照表(考试时会给出用到的一部分数据):
P
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
3、范围:; 性质:越大,说明变量间越有关系。
三、典型例题
3
4
5
6
2.5
3
4
4.5
例1、右表中是生产某种产品(吨)与相应消耗的煤(吨)记录数据:
(1)画出数据的散点图;
(2)求线性回归直线方程;
(3)估计生产7吨产品时,消耗的煤约为多少吨?
解:(1)散点图如右。从图中可以看出与正相关。
(2)(提示:把原数据表抄一遍,并且增加2行和1列,
计算出后面需要用到的数据)
设回归直线方程为
9
16
25
36
3
4
5
6
2.5
3
4
4.5
7.5
12
20
27
=0.7,
所以,回归方程为:
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
(3)当时, 所以,估计生产7吨产品时,消耗的煤约为5.25吨。
例2、为了考察某药物预防疾病的效果,现对105人进行试验调查,得到22列联表。试判断:服用药物和患病之间是否有关系?
解:,,,,
6.109>5.024 (提示:运算时尽量先约分化简,再计算)
所以,有1-0.025=97.5%的把握认为服用药物和患病之间有关系。
3 / 3
展开阅读全文