1、独立性检验的基本思想及初步应用一基础概念的梳理与理解1分类变量的描述性说明:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种象这样的变量的不同值表示个体所属的不同类别的变量称为分类变量例如性别变量其取值为男女两种,吸烟变量其取值为吸烟与不吸烟两种;2两个分类变量:是否吸烟与患肺癌于否,性别男和女与是否宠爱数学课程等等,这是我们所要关怀的;3列联表:列出的两个分类变量和,它们的取值分别为和的样本频数表称为列联表1分类12总计12总计二两个分类变量是否有关的粗略估量 图1 1三维柱形图:假如列联表1的三维柱形图如下图由各小柱形表示的频数可见,对角线上的频数的积的差的确定值较大,说明两分类变量
2、和是有关的,否则的话是无关的 重点:一方面考察对角线频数之差,更重要的一方面是供应了构造随机变量进行独立性检验的思路方法。2二维条形图(相应于上面的三维柱形图而画)由深、浅染色的高可见两种状况下所占比例,由数据可知要比小得多,由于差距较大,因此,说明两分类变量和有关系的可能性较大,两个比值相差越大两分类变量和有关的可能性也越的否则是无关系的图2重点:通过图形以及所占比例直观地粗略地观看是否有关,更重要的一方面是供应了构造随机变量进行独立性检验的思想方法。3等高条形图(相应于上面的条形图而画)由深、浅染色的高可见两种状况下的百分比;另一方面,数据要比小得多,因此,说明两分类变量和有关系的可能性较
3、大,否则是无关系的图3重点:直观地看出在两类分类变量频数相等的状况下,各部分所占的比例状况,是在图2的基础上换一个角度来理解。三独立性检验的基本思想上面通过分析数据与图形,得出这个估量是粗略的,由于我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的但是上面的分析给了我们一种重要的思想方法下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法1基本思想与图形的联系假设两类分类变量是无关的,由上面的条形图2可知如下的比应差不多。(这里可以结合三位柱形图的对角线再加以理解)构造随机变量(其中)(此公式如何记住,其特点是什么
4、?结合列联表1理解)明显所构造的随机变量与大小具有全都性2独立性检验的思想方法假如的观看值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率大事发生);假如的观看值较小,此时接受假设,说明两分类变量是无关系的其思想方法类似于数学上的反证法。3得到的观看值常与以下几个临界值加以比较:假如,就有的把握由于两分类变量和是有关系;假如就有的把握由于两分类变量和是有关系;假如就有的把握由于两分类变量和是有关系;假如低于,就认为没有充分的证据说明变量和是有关系象这样利用随机变量来确定在多大程度上可以由于“两个分类变量有关系”的方法称为两个分类变量的独立性检验。例题:
5、在一次恶劣气候的飞行航行中调查男女乘客在机上晕机的状况如下表所示,据此资料你是否由于在恶劣气候飞行中男性比女性更简洁晕机?分类晕机不晕机合计男性233255女性92534合计325789解答;由公式由于21492706,我们没有理由说晕机与否跟男女性别有关解答评注:尽管这次航班中男性晕机的比例()比女性晕机的比例()高,但是我们不能由于在恶劣气候飞行中男性比女性更简洁晕机可见,这里只有的观看值才能精确地分析和解释两分类变量是否有关系,图形及比例一方面给出了随机变量构造的可行性及思路,另一方面,可以供我们对是否有关仅供参考教材中此节的内容前后联系性较强,体现了推理的规律性以及思想方法,寓意深刻,请同学们感悟其学问的形成(注:3841为妇女节与愚人节,6635为与少1,上面的数就不难记了)