资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,独立性检验,某医疗机构为了了解,患呼吸道疾病,与吸烟是否有关,,进行了一次抽样调查,共调查了,515,个成年人,其中吸烟者,220,人,不吸烟者,295,人,调查结果是:吸烟的,220,人中,37,人患,呼吸道疾病,,,183,人未患,呼吸道疾病,;不吸烟的,295,人中,21,人患病,,274,人未患,病,。,根据这些数据能否,断定,:患,呼吸道疾病,与,吸烟有关?,问题:,吸烟与患呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,问题:,为了调查吸烟是否对呼吸道有影响,某医疗研究所随机地调查了515人,得到如下结果(单位:人),列联表,在不吸烟者中患病的比重是,在吸烟者中患病的比重是,7.12%,16.82%,不患病,患病,1)通过图形直观判断,三维柱状图,不患病,患病,2)通过图形直观判断,二维条形图,不患病,患病,3)通过图形直观判断,患病,比例,不患病,比例,思考交流:,反证法原理:,在一个已知假设下,如果,推出一个矛盾,,就,证明,了这个假设不成立。,假设检验原理:,在一个已知假设下,如果,一个与该假设矛盾的小概率事件发生,,,就,推断,这个假设不成立。,独立性检验的基本思想,数据整理;,(列,2,2,联表),做出相反的假设;(“患病与吸烟没有关系”),计算 ;,查临界值表;,下结论。,统计学对此类问题提供了这样的方法:,数据整理;,(列,2,2,联表),做出相反的假设;(“患病与吸烟没有关系”),计算 ;,查临界值表;,下结论。,统计学对此类问题提供了这样的方法:,吸烟与患呼吸道疾病关系列联表,患病,不患病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,1、列2 2联表,H,0,:,吸烟,和,患呼吸道疾病,没有关系,通过数据和图表分析,得到结论是:,吸烟与患呼吸道病有关,结论的可靠程度如何?,2、做出相反的假设,3、计算,吸烟的人中患病的比例:,不吸烟的人中患病的比例:,吸烟与患呼吸道疾病关系列联表,患病,不患病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,若H,0,成立,作为检验在多大程度上可以认为“两个变量有关系”的标准。,统计学家为了消除样本量对上式的影响,引入,了,卡方统计量,通过公式计算,吸烟与患呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,4、查表,临界值表,1)如果P(,10.828)=0.001表示有99.9%的把握认为”X与Y”有关系;,2)如果P(7.879)=0.005表示有99.5%的把握认为”X与Y”有关系;,3)如果P(6.635)=0.01表示有99%的把握认为”X与Y”有关系;,4)如果P(5.024)=0.025表示有97.5%的把握认为”X与Y”有关系;,5)如果P(3.841)=0.05表示有95%的把握认为”X与Y”有关系;,6)如果P(2.706)=0.10表示有90%的把握认为”X与Y”有关系;,7)如果P(,2.706),就认为没有充分的证据显示”X与Y”有关系;,已知在 成立的情况下,,故有99.9%的把握认为,H,0,不成立,即有99.9%的把握认为“患呼吸道疾病与吸烟有关系”。,5、下结论,练习,例题1,例题2,例题3,练习,网络链接检验结果,亲子鉴定的可靠性,DNA是从几滴血,腮细胞或培养的组织纤内提取而来.用畴素将DNA样本切成小段,放进喱胶内,用电泳槽推动DNA小块使之分离-最细的在最远,最大的最近.之後,分离开的基因放在尼龙薄膜上,使用特别的DNA探针去寻找基因,相同的基因会凝聚于一,然後,利用特别的染料,在X光的环境下,便显示由DNA探针凝聚于一的黑色条码.小孩这种肉眼可见的条码很特别-一半与母亲的吻合,一半与父亲的吻合.这过程重覆几次,每一种探针用于寻找DNA的不同部位并影成独特的条码,用几组不同的探针,可得到超过99,9%的父系或然率或分辨率.,DNA亲子鉴定的原理和程序,DNA亲子鉴定的结果,孩子会有一条纹与亲生母亲相同而另一条码与待证实父亲1号(AF1)相同,此人是生父;被排除的男子(AF2),则与小孩并无相同的条码.,肯定父系关系=99.99%或更大的生父或然率,(法律上证明是生父),否定父系关系=0%生父或然率(100%排除为生父),例4.在某医院,因为患心脏病而住院的665名男性病人,中,有214人秃顶;而另外772名不是因为患心脏病而住,院的男性病人中有175秃顶.分别利用图形和独立性检,验方法判断秃顶与患心脏病是否有关系?你所得的结论,在什么范围内有效?,秃顶与患心脏病列联表,患心脏病,患其他病,总计,秃顶,214,175,389,不秃顶,451,597,1048,总计,665,772,1437,有99%的把握认为“秃顶与患心脏病有关”,例5 为考察高中生的性别与是否喜欢数学课程之间的关,系。在某城市的某校高中生随机抽取300名学生。得到,如下列联表:,性别与喜欢数学课程列联表,喜欢,不喜欢,总计,男,37,85,122,女,35,143,178,总计,72,228,300,由表中数据计算得到 的观测值 4.514。能够以95的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?,解:在假设 “性别与是否喜欢数学课程之间没有关系”,的前提下,应该很小,并且,而我们所得到的 的观测值 超过3.841,这就,意味着“性别与是否喜欢数学课程之间有关系”这一结论,是错误的可能性约为0.05,即有95%的把握认为“性别与,是否喜欢数学课程之间有关系”。,练习:,甲乙两个班级进行一门考试,按照学生考试成绩优秀和,不优秀统计后,得到如下列联表:,优秀,不优秀,总计,甲班,10,35,45,乙班,7,38,45,总计,17,73,90,画,出列联表的条形图,并通过图形判断成绩与班级是否,有关.利用列联表的独立性检验估计,认为“成绩与班级,有关系”犯错误的概率是多少。,由图及表直观判断,好像“成绩优秀与班级有关系”,由表中,数据计算,得 的观察值为 。由教科书中表,1-12,得,从而由50%的把握认为“成绩优秀与班级有关系”,即断言“成,绩优秀与班级有关系”犯错误的概率为0.5。,100%,90%,80%,70%,60%,50%,40%,30%,20%,10%,0%,优秀,不优秀,列联表的条形图:,小结:,1、独立性检验的基本思想,2、独立性检验是用 统计量研究一类问题的方法。,3、用 统计量研究问题的步骤,由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。,作业:P94,习题3.2,第一题 第二题,温馨提示:,吸烟有害健康,请不要吸烟!,再见,
展开阅读全文