资源描述
3.2 独立性检验
教学目标
(1)通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初步应用;
(2)经受由实际问题建立数学模型的过程,体会其基本方法.
教学重点、难点:独立性检验的基本方法是重点.基本思想的领悟及方法应用是难点.
教学过程
一.问题情境
5月31日是世界无烟日。有关医学争辩表明,很多疾病,例如:心脏病、癌症、脑血管病、慢性堵塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的其次号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:
1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
问题:依据这些数据能否断定“患呼吸道疾病与吸烟有关”?
二.同学活动
为了争辩这个问题,(1)引导同学将上述数据用下表来表示:
患病
未患病
合计
吸烟
37
183
220
不吸烟
21
274
295
合计
58
457
515
(2)估量吸烟者与不吸烟者患病的可能性差异:
在吸烟的人中,有的人患病,在不吸烟的人中,有的人患病.
问题:由上述结论能否得出患病与吸烟有关?把握有多大?
三.建构数学
1.独立性检验:
(1)假设:患病与吸烟没有关系.
若将表中“观测值”用字母表示,则得下表:
患病
未患病
合计
吸烟
不吸烟
合计
(近似的推断方法:设,假如成立,则在吸烟的人中患病的比例与
不吸烟的人中患病的比例应差不多,由此可得,即,因此,越小,患病与吸烟之间的关系越弱,否则,关系越强.)
设,
在假设成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估量人数用表示出来.
例如:“吸烟且患病”的估量人数为;
“吸烟但未患病” 的估量人数为;
“不吸烟但患病”的估量人数为;
“不吸烟且未患病”的估量人数为.
假照实际观测值与假设求得的估量值相差不大,就可以认为所给数据(观测值)不能否定假设.否则,应认为假设不能接受,即可作出与假设相反的结论.
(2)卡方统计量:
为了消退样本对上式的影响,通常用卡方统计量(χ2)来进行估量.
卡方χ2统计量公式:
χ2
(其中)
由此若成立,即患病与吸烟没有关系,则χ2的值应当很小.把代入计算得χ2,统计学中有明确的结论,在成立的状况下,随机大事“”
发生的概率约为,即,也就是说,在成立的状况下,对统计量χ2进行多次观测,观测值超过的频率约为.由此,我们有99%的把握认为不成立,即有99%的把握认为“患病与吸烟有关系”.
象以上这种用统计量争辩吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
说明:
(1)估量吸烟者与不吸烟者患病的可能性差异是用频率估量概率,利用χ2进行独立性检验,可以对推断的正确性的概率作出估量,观测数据取值越大,效果越好.在实际应用中,当均不小于5,近似的效果才可接受.
(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人确定患呼吸道疾病”.
(3)在假设下统计量χ2应当很小,假如由观测数据计算得到χ2的观测值很大,则在确定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).
2.独立性检验的一般步骤:
一般地,对于两个争辩对象Ⅰ和Ⅱ,Ⅰ有两类取值:类和类(如吸烟与不吸烟),Ⅱ也有两类取值:类和类(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:
Ⅱ
类
类
合计
Ⅰ
类
类
合计
推断“Ⅰ和Ⅱ有关系”的步骤为:
第一步,提出假设:两个分类变量Ⅰ和Ⅱ没有关系;
其次步,依据2×2列联表和公式计算χ2统计量;
第三步,查对课本中临界值表,作出推断.
3.独立性检验与反证法:
反证法原理:在一个已知假设下,假如推出一个冲突,就证明白这个假设不成立;
独立性检验(假设检验)原理:在一个已知假设下,假如一个与该假设冲突的小概率大事发生,就推断这个假设不成立.
四.数学运用
1.例题:
例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?
未感冒
感冒
合计
使用血清
258
242
500
未使用血清
216
284
500
合计
474
526
1000
分析:在使用该种血清的人中,有的人患过感冒;在没有使用该种血清的人中,有的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.
解:提出假设:感冒与是否使用该种血清没有关系.由列联表中的数据,求得
∵当成立时,的概率约为,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.
例2.为争辩不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.依据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?
有效
无效
合计
口服
58
40
98
注射
64
31
95
合计
122
71
193
分析:在口服的病人中,有的人有效;在注射的病人中,有的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有确定的差异,能否认为用药效果与用药方式确定有关呢?下面用独立性检验的方法加以说明.
解:提出假设:药的效果与给药方式没有关系.由列联表中的数据,求得
当成立时,的概率大于,这个概率比较大,所以依据目前的调查数据,不能否定假设,即不能作出药的效果与给药方式有关的结论.
说明:假如观测值,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“成立”,即Ⅰ与Ⅱ没有关系.
2.练习:练习第1、2、3题.
五.回顾小结:
1.独立性检验的思想方法及一般步骤;
2.独立性检验与反证法的关系.
六.课外作业:
展开阅读全文