收藏 分销(赏)

3.2独立性检验的基本思想及其初步应用课件.ppt

上传人:天**** 文档编号:5895144 上传时间:2024-11-22 格式:PPT 页数:39 大小:1.07MB
下载 相关 举报
3.2独立性检验的基本思想及其初步应用课件.ppt_第1页
第1页 / 共39页
3.2独立性检验的基本思想及其初步应用课件.ppt_第2页
第2页 / 共39页
3.2独立性检验的基本思想及其初步应用课件.ppt_第3页
第3页 / 共39页
3.2独立性检验的基本思想及其初步应用课件.ppt_第4页
第4页 / 共39页
3.2独立性检验的基本思想及其初步应用课件.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、*,3.2,独立性检验的基本思想及其初步应用,高二数学 选修,2-3,第三章 统计案例,独立性检验,本节研究的是,两个分类变量的独立性检验问题,。,在日常生活中,我们常常关心,分类变量之间是否有关系,:,例如,吸烟是否与患肺癌有关系?,性别是否对于喜欢数学课程有影响?等等。,吸烟与肺癌列联表,不患肺癌,患肺癌,总计,不吸烟,7775,42,7817,吸烟,2099,49,2148,总计,9874,91,9965,探究,:,为了调查,吸烟,是否对,肺癌,有影响,某肿瘤研究所随机地调查了,9965,人,得到如下结果(单位:人),列联表,分类变量,1,下面是一个,2,2,列联表:,y,1,y,2,总

2、计,x,1,a,21,73,x,2,2,25,27,总计,b,46,100,则表中,a,、,b,的值分别为,(,),A,94,、,96 B,52,、,50,C,52,、,54 D,54,、,52,C,吸烟与肺癌列联表,不患肺癌,患肺癌,总计,不吸烟,7775,42,7817,吸烟,2099,49,2148,总计,9874,91,9965,探究,:,为了调查,吸烟,是否对,肺癌,有影响,某肿瘤研究所随机地调查了,9965,人,得到如下结果(单位:人),列联表,在不吸烟者中患肺癌的比重是,在吸烟者中患肺癌的比重是,吸烟者和不吸烟者都可能患肺癌,吸烟者患肺癌的可能性较大,0.54%,2.28%,分类

3、变量,42/7817,通过图形直观判断两个分类变量是否相关:,等高条形图,在不吸烟者中患肺癌的比重是,在吸烟者中患肺癌的比重是,0.54%,2.28%,上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?,这需要用统计观点来考察这个问题。,现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,,为此先假设,H,0,:吸烟与患肺癌没有关系,.,不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,把表中的数字用字母代替,得到如下用字母表示的列联表,用,A,表示不吸烟,,B,表示不患肺癌,则“吸烟与患肺癌没有关

4、系”等价于“吸烟与患肺癌独立”,即假设,H,0,等价于,P(AB)=P(A)P(B).,因此,|ad-bc|,越小,说明吸烟与患肺癌之间关系越弱;,|ad-bc|,越大,说明吸烟与患肺癌之间关系越强。,不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,在表中,,a,恰好为事件,AB,发生的频数;,a+b,和,a+c,恰好分别为事件,A,和,B,发生的频数。由于频率接近于概率,所以在,H,0,成立的条件下应该有,不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,n=a+b+c+d,独立性,检验,在

5、不吸烟者中不患肺癌的比重是,在吸烟者中不患肺癌的比重是,H,0,:假设,吸烟,和,患肺癌,没有关系,独立性,检验,H,0,:假设,吸烟,和,患肺癌,没有关系,构造随机变量,(,卡方统计量,),作为检验在多大程度上可以认为,“,两个变量有关系,”,的标准。,若,H,0,(,吸烟,和,患肺癌,没有关系,),成立,则,K,2,应该很小,.,独立性,检验,H,0,:假设,吸烟,和,患肺癌,没有关系,吸烟与肺癌列联表,不患肺癌,患肺癌,总计,不吸烟,7775,42,7817,吸烟,2099,49,2148,总计,9874,91,9965,随机变量,-,卡方统计量,0.50,0.40,0.25,0.15,

6、0.10,0.05,0.025,0.010,0.005,0.001,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,临界值表,0.1%,把握认为,A,与,B,无关,1%,把握认为,A,与,B,无关,99.9%,把握认,A,与,B,有关,99%,把握认为,A,与,B,有关,90%,把握认为,A,与,B,有关,10%,把握认为,A,与,B,无关,即在 成立的情况下,,K,2,大于,6.635,概率非常小,近似为,0.01,现在的,K,2,56.632,的观测值远大于,6.635,,小概率事件的发生说明假设,H,0,不成立!,

7、0.50,0.40,0.25,0.15,0.10,0.05,0.025,0.010,0.005,0.001,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,临界值表,独立性,检验,H,0,:假设,吸烟,和,患肺癌,没有关系,所以,吸烟,和,患肺癌,有关!,1,对分类变量,X,与,Y,的随机变量,K,2,的观测值,k,,说法正确的是,(,),A,k,越大,,“,X,与,Y,有关系,”,可信程度越小,B,k,越小,,“,X,与,Y,有关系,”,可信程度越小,C,k,越接近于,0,,,“,X,与,Y,无关,”,程度越小,D,k

8、,越大,,“,X,与,Y,无关,”,程度越大,B,独立性检验基本的思想类似,反证法,(1),假设结论不成立,即,“,两个分类变量没有关系,”,.,(2),在此假设下随机变量,K,2,应该很能小,如果由观测数据计算得到,K,2,的观测值,k,很大,则在一定程度上说明假设不合理,.,(3),根据随机变量,K,2,的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为,99.9%,即,“,两个分类变量有关系,”,这一结论成立的可信度为约为,99.9%.,反证法原理与假设检验原理,反证法原理:,在一个已知假设下,如果,推出一个矛盾,,就,证明,了这个假设不成立。,假设检验原理:,

9、在一个已知假设下,如果,一个与该假设矛盾的小概率事件发生,,,就,推断,这个假设不成立。,在,H,0,成立的条件下,构造与,H,0,矛盾的小概率事件;,2.,如果样本使得这个小概率事件发生,则,H,0,不成立,就能以,一定把握,断言,H,1,成立;否则,断言没有发现样本数据与,H,0,相矛盾的证据。,求解思路,假设检验问题:,例,1.,在某医院,因为患心脏病而住院的,665,名男性病人中,有,214,人秃顶,而另外,772,名不是因为患心脏病而住院的男性病人中有,175,人秃顶,.,分别利用图形和独立性检验方法判断是否有关,?,你所得的结论在什么范围内有效,?,患心脏病,不患心脏病,总计,秃顶

10、,214,175,389,不秃顶,451,597,1048,总计,665,772,1437,在秃顶中患心脏病的比重是,在不秃顶中患心脏病的比重是,55.01%,43.03%,例,1.,在某医院,因为患心脏病而住院的,665,名男性病人中,有,214,人秃顶,而另外,772,名不是因为患心脏病而住院的男性病人中有,175,人秃顶,.,分别利用图形和独立性检验方法判断是否有关,?,你所得的结论在什么范围内有效,?,患心脏病,不患心脏病,总计,秃顶,214,175,389,不秃顶,451,597,1048,总计,665,772,1437,根据联表的数据,得到,所以有,99%,的把握认为“秃顶与患心脏

11、病有关”。,注意:,因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体,2,、本例中的边框中的注解:,1,、在解决实际问题时,可以直接计算,K,2,的观测值,k,进行独立检验,而不必写出,K,2,的推导过程;,主要是使得我们注意统计结果的适用范围(这由样本的代表性所决定),A,所以根据列联表的数据,可以有,%,的把握认为该学校,15,至,16,周岁的男生的身高和体重之间有关系。,97.5,由独立性检验随机变量,值的计算公式得:,跟踪训练,1,(2011,广东执信中学,),某中学一位高三班主任对本班,50,名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:

12、,积极参加班级工作,不太主动参加班级工作,合计,学习积极性高,18,7,25,学习积极性一般,6,19,25,合计,24,26,50,完成课本,97,页练习,(1),如果随机调查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太积极参加班级工作且学习积极性一般的学生的概率是多少?,(2),能否在犯错误的概率不超过,0.001,的前提下认为学生的积极性与对待班级工作的态度有关系?,所以,在犯错误的概率不超过,0.001,的前提下,认为,“,学生的学习积极性与对待班级工作的态度,”,有关系,1,(,2013,深圳二模,),2013,年,3,月,14,日,,CCTV,财经频道报道

13、了某地建筑市场存在违规使用未经淡化海砂的现象,.,为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了,60,个样本,得到了相关数据如下表:,混凝土耐久性达标,混凝土耐久性不达标,总计,使用淡化海砂,25,5,30,使用未经淡化海砂,15,15,30,总计,40,20,60,(,1,)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过,1%,的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?,(,2,)若用分层抽样的方法在使用淡化海砂的样本中抽取了,6,个,现从这,6,个样本中任取,2,个,则取出的,2,个样本混凝土耐久性都达标的概率是多少?,参考数据:,P

14、,(,k,2,k,),0.10,0.050,0.025,0.010,0.001,k,2.706,3.841,5.024,6.635,10.828,解析:,(,1,)提出假设,H,0,:使用淡化海砂与混凝土耐久性是否达标无关,.,根据表中数据,求得,K,2,的观测值,能在犯错误的概率不超过,1%,的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关,.,(,2,)用分层抽样的方法在使用淡化海砂的样本中抽取,6,个,其中应抽取“混凝土耐久性达标”的为,6=5,,“混凝土耐久性不达标”的为,6-5=1,,,“混凝土耐久性达标记”为,A,1,A,2,A,3,A,4,A,5,”;“,混凝土耐久性不达标”

15、的记为,B.,在这,6,个样本中任取,2,个,有以下几种可能:(,A,1,A,2,),(,A,1,A,3,),(,A,1,A,4,),(,A1,A5,),(,A1,B,),(,A2,A3,),(,A2,A4,),(,A2,A5,),(,A2,B,),(,A3,A4,),(,A3,A5,),(,A3,B,),(,A4,A5,),(,A4,B,)(,A5,B,),共,15,种,.,设“取出的,2,个样本混凝土耐久性都达标”为事件,A,,它的对立事件,A,为“取出的,2,个样本至少有,1,个混凝土耐久性不达标”,包含(,A1,B,),(,A2,B,),(,A3,B,),(,A4,B,),(,A5,B

16、,),共,5,种可能,.,2,(2011,揭阳一模,),某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取,40,件产品作为样本称出它们的重量,(,单位:克,),,重量值落在,(495,510,的产品为合格品,否则为不合格品表,1,是甲流水线样本频数分布表,图,1,是乙流水线样本的频率分布直方图,产品重量,/,克,频数,(490,495,6,(495,500,8,(500,505,14,(505,510,8,(510,515,4,表,1,甲流水线样本频数分布表,(1),根据上表数据作出甲流水线样本的频率分布直方图;,(2),若以频率作为概率,试估计从两条流水线分别任取

17、,1,件产品,该产品恰好是合格品的概率分别是多少;,(3),由以上统计数据完成下面,2,2,列联表,能否在犯错误的概率不超过,0.1,的前提下认为产品的包装质量与两条自动包装流水线的选择有关?,甲流水线,乙流水线,合计,合格品,a,b,不合格品,c,d,合计,n,附:下面的临界值表供参考:,p,(,K,2,k,),0.15,0.10,0.05,0.025,0.010,0.005,0.001,k,2.072,2.706,3.841,5.024,6.635,7.879,10.828,解析:,(1),甲流水线样本的频率分布直方图如下:,(2),由表,1,知甲样本中合格品数为,8,14,8,30,,由图,1,知乙样本中合格品数为,(0.06,0.09,0.03),5,40,36,,故甲样本合格品的频率为 ,0.75,,,乙样本合格品的频率为 ,0.9,,,据此可估计从甲流水线任取,1,件产品,该产品恰好是合格品的概率为,0.75.,从乙流水线任取,1,件产品,该产品恰好是合格品的概率为,0.9.,(3)2,2,列联表如下:,甲流水线,乙流水线,合计,合格品,a,30,b,36,66,不合格品,c,10,d,4,14,合计,40,40,n,80,在犯错误的概率不超过,0.1,的前提下认为产品的包装质量与两条自动包装流水线的选择有关,

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服