资源描述
独立性检验的步骤及应用
一、 独立性检验的思想及步骤
独立性检验的基本思想类似于数学上的“反证法”。要确认“两个分类变量有关系”这一结论成立的可信程度。首先假设结论不成立,即“这两个分类变量几乎没有关系”(“几乎独立”)成立,则, 此时,我们所构造的随机变量应当很小。假如由观测数据计算得到的k不是很小,则在确定程度上说明假设不合理。而且观测值k越大,说明假设(“几乎无关或独立”)不成立的可能性就越大,即两者有关的可能性越大,这样我们就可以由的观测值k并结合已往估算阅历值表定出我们有多大程度等等把握可以认为“两个分类变量有关系”。
这个阅历值表如下(有必要记住):
与的观测值k相应的参考值:
在假设“X与Y无关”的前提下毁灭=k概率:
P(=k)
考查结果=k与假设冲突的可能性,即可以认为“X与Y有关”的把握程度:
1-P(=k)
=10.828
0.001
99.9%(“有关”程度较高。“独立性”较弱)
=7.789
0.005
99.5%
=6.635
0.01
99%
=5.024
0.025
97.5%
=3.841
0.05
95%
=2.706
0.10
90%
超过0.15
85%以下(无明显理由认为“有关”,“独立性”较强)
二、 典例分析
例1、某校对同学课外活动内容进行调查,结果整理成2×2列联表如下:
体育
文娱
合计
男生
21
23
44
女生
6
29
35
合计
27
52
79
试分析“宠爱体育还是宠爱文娱”与“性别”之间三多大程度上有关?
解:将a=21,b=23,c=6,d=29,n=79代入,
得 即的观看值
假设宠爱体育还是宠爱文娱与性别没有关系,则的观看值k应当很小,且由阅历值表知,即在此假设成立的前提下毁灭的可能性只有0.005左右,而不毁灭的可能性约为99.5%,但在本调查中却得出的观看值
,超过了7.789,所以我们有99.5%的把握可以认为此假设不成立,即有99.5%的把握可以认为宠爱体育还是宠爱文娱与性别有关。
例2、调查在2~3级风时的海上航行中男女乘客的晕船状况,共调查了71人,其中女性34人,男性37人。女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船。
(1) 依据以上数据建立有关2×2的列联表;
(2) 推断晕船是否与性别有关系。
解:(1)2×2的列联表:
晕船状况
性别
晕船
不晕船
总计
女
10
24
34
男
12
25
37
总计
22
49
71
(2)计算
由于k<2.706,所以我们没有理由说“晕船与性别有关”。
例3、为了考查某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
患病
未患病
总计
服用药
10
45
55
没服用药
20
30
50
总计
30
75
105
请问有多大把握认为药物有效?
分析:本题考查回归的基本思想、方法及初步应用,会用残差分析推断回归模型的拟合效果。
解:,
由于,从而有97.5%的把握认为药物有效。
展开阅读全文