资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,.,*,独立性检验的基本思想及其初步应用,数学选修1-2,1.会列22列联表,,2.会从22列联表,直观粗略的判断出两个分类变量之间是否有关?,3.了解独立性检验的基本思想和步骤,弋阳二中,2011.11.4,.,独立性检验,一、两种变量及对应处理的问题,1、,2、,.,根据这些数据能否断定:患病与吸烟有关吗?,1、问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了,515,个成年人,其中吸烟者220人,不吸烟者,295,人,调查结果是:吸烟的220人中37人患,病,,183人不患,病,;不吸烟的,295,人中,21,人患,病,,,274,人不患,病,。,二、独立性检验,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,2、为了研究这个问题,我们将上述问题用下表表示:,在不吸烟者中患病的比重是,在吸烟者中患病的比重是,7.12%,16.82%,注.从列,22,联表分别计算患病在两类中的频率。,.,患病,不患病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,1、列出2,2列联表,2、引入一个随机变量,,卡方统计量:,3、由观测数据计算得到随机变量K,2,的观测值k;,4、以1-P(K,2,k)100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.,10.83,7.879,6.635,5.024,3.841,2.706,2.072,1.323,0.708,0.445,k,0.001,0.005,0.010,0.025,0.05,0.10,0.15,0.5,0.40,0.50,a.如果k2.706,就有90%的把握认为“X与Y有关系”;,b.如果k3.841,就有95%的把握认为“X与Y有关系”;,c.如果k6.635,就有99%的把握认为“X与Y有关系”;,二、独立性检验,.,例1 某医院,因为患心脏病而住院的665名男性病人中,有214人晕厥;而另外772名不是因为患心脏病而住院的男性病人中有175人晕厥。利用独立性检验方法判断秃顶与患心脏病是否有关系?,解:根据题目所给数据得到如下列2,2,联表:,患心脏病,不患心脏病,总计,晕厥,214,175,389,不晕厥,451,597,1048,总计,665,772,1437,根据列联表的数据,得到,所以有99%的把握认为“晕厥与患心脏病有关”。,三、例题分析,.,为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:,喜欢数学课程,不喜欢数学课程,总计,男,37,85,122,女,35,143,178,总计,72,228,300,解:在假设“性别与是否喜欢数学课程之间没有关系”的前提,下,K,2,应该很小,并且,例2.性别与喜欢数学课,由表中数据计算,K,2,的观测值k=4.513。在多大程度上可以认,为高中生的性别与是否喜欢数学课程之间有关系?为什么?,而我们所得到的,K,2,的观测值k=4.513超过3.841,这就意味着,“性别与是否喜欢数学课程之间有关系”这一结论错误的可能,性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程,之间有关系”。,三、例题分析,.,(1)列,出22列联表,(2)计算K,2,的观测值k(3)查表得结论,课堂小结:,二、独立性检验的步骤,2、利用随机变量K,2,来确定是否能以一定的把握认为“两个变量有关系”的方法,称为两个分类变量的独立性检验。,一、独立性检验,1、变量:,定量变量:数值可以连续变化的不同值,如身高。,分类变量:数值只可以取两种情况,如性别、是否吸烟。,a.如果k10.828,就有99.9%的把握认为“X与Y有关系”;,b.如果k7.879,就有99.5%的把握认为“X与Y有关系”;,c.如果k6.635,就有99%的把握认为“X与Y有关系”;,d.如果k5.024,就有97.5%的把握认为“X与Y有关系”;,e.果k3.841,就有95%的把握认为“X与Y有关系”;,f.如果k2.706,就有90%的把握认为“X与Y有关系”;,g.如果k=2.706,就认为没有充分的证据显示“X与Y有关系”.,.,有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。,笛卡尔,.,
展开阅读全文