资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,1,2,独立性检验的基本思想及其初步应用,1,知识与技能,通过典型案例,初步经历案例学习的过程,学习一些常见的统计思想与方法,并能用这些方法解决一些实际问题,2,过程与方法,通过对案例的探究,了解独立性检验,(,只要求,2,2,列联表,),的基本思想、方法及初步应用,3,情感态度与价值观,通过对数据的收集、整理和分析,增强社会实践能力,培养学生分析问题、解决问题的能力,本节重点:理解独立性检验的基本思想及实施步骤,本节难点:,(1),了解独立性检验的基本思想,(2),了解随机变量,K,2,的含义,在学习中要多从实际问题考虑,对一些典型案例的数据的处理,了解和使用一些常用的统计方法,树立应用数学的意识,树立数学为实践服务的思想,1,2,2,列联表是传统的调查研究中最常用的方法之一,用于研究两个变量之间相互独立还是存在某种关联性,它适用于分析两个变量之间的关系,2,在实际问题中,判断两个分类变量的关系的可靠性时,一般利用随机变量,K,2,来确定,而不利用三维柱形图和二维条形图,1,分类变量和列联表,(1),分类变量,变量的不同,“,值,”,表示个体所属的,,像这样的变量称为分类变量,(2),列联表,定义:列出的两个分类变量的,称为列联表,2,2,列联表,一般地,假设两个分类变量,X,和,Y,,它们的取值分别为,和,,其样本频数列联表,(,也称为,2,2,列联表,),为下表,.,不同类别,频数表,x,1,,,x,2,y,1,,,y,2,2.,等高条形图,(1),等高条形图与表格相比,更能直观地反映出两个分类变量间是否,,常用等高条形图展示列联表数据的,y,1,y,2,总计,x,1,a,b,a,b,x,2,c,d,c,d,总计,a,c,b,d,a,b,c,d,互相影响,频率特征,如果,,就推断,“,X,与,Y,有关系,”,,这种推断犯错误的概率不超过,a,,否则就认为在,不超过,a,的前提下不能推断,“,X,与,Y,的关系,”,,或者在样本数据中,支持结论,“,X,与,Y,有关系,”,4,在独立性检测中,当,K,2,时,有,95%,的把握说事件,A,与,B,有关;当,K,2,时;有,99%,的把握说事件,A,与,B,有关;当,K,2,时,认为,k,k,0,犯错误的概率,没有发现足够证据,3.841,6.635,3.841,事件,A,与,B,是无关的,例,1,在一项有关医疗保健的社会调查中,发现被调查的男性有,530,人,女性有,670,人,其中男性中喜欢吃甜食的有,117,人,而女性中喜欢吃甜食的有,492,人,试判断喜不喜欢吃甜食与性别有无关系,解析,作列联表如下,(,单位:人,),:,性别与喜欢吃甜食列联表,画三维柱形图,如图,喜欢吃甜食,不喜欢吃甜食,总计,男,117,413,530,女,492,178,670,总计,609,591,1200,比较来说,主、副对角线上两个柱体高度的乘积差别较大,因而可以在某种程度上认为,“,喜不喜欢吃甜食与性别有关系,”,点评,在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分类变量有关系的可能性就越大,作三维柱形图时,作图要精确,且比较易于观察,以便对结论的判断不出现偏差,如图所示是根据调查人的性格与性别有无关系的相应数据画出的三维柱形图,由该三维柱形图可知,人的性格与性别,_,关系,(,填,“,有,”,或,“,没有,”,),答案,有,点评,由题图可知,主副对角线上两个柱体高度的乘积差别较大,因而人的性格与性别有关系,例,2,下面,2,2,列联表的,K,2,的值为,_.,答案,1.780,2,将,K,2,的数值与两个临界值,3.841,与,6.635,进行对比;,做出统计推断:当根据具体的数据算出的,K,2,3.841,时,有,95%,的把握说事件,A,与,B,有关;当,K,2,6.635,时,有,99%,的把握说事件,A,与,B,有关;当,K,2,3.841,时,认为事件,A,与,B,是无关的,某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异,.,带菌头数,不带菌头数,合计,屠宰场,8,32,40,零售点,14,18,32,合计,22,50,72,分析,这是一个,2,2,列联表,可以用,K,2,检验来检验屠宰场与零售点猪肉带菌率有无差异,例,3,在调查的,480,名男人中有,38,名患有色盲,,520,名女人中有,6,名患有色盲,通过图形判断色盲与性别是否有关利用独立性检验判断,是否能够以,99.9%,的把握认为,“,色盲与性别有关系,”,你所得到的结论在什么范围内有效?,解析,根据题目所给的数据作出如下的列联表,(,单位:名,),:,色盲与性别列联表,根据列联表作出相应的二维条形图,如图所示,色盲,非色盲,总计,男,38,442,480,女,6,514,520,总计,44,956,1000,点评,本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断,1,利用图形来判断两个分类变量是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以粗略地判断两个分类变量是否有关系,可以结合所给的数值来进行比较作图应注意单位统一,图形准确,但它不能给我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算,2,当需要利用公式计算,K,2,的观测值大小来对问题作出推断时,首先要牢记公式,再将经过准确运算后得到的结果与临界值进行比较,最后才能得出合乎情理的结论,为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,,990,件产品中有合格品,982,件,次品,8,件;甲不在生产现场时,,510,件产品中有合格品,493,件,次品,17,件试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响能否在犯错误的概率不超过,0.001,的前提下,认为质量监督员甲是否在生产现场与产品质量有关?,分析,由题目可获取以下主要信息:,甲在生产现场和不在生产现场时,产品中的合格品和次品数量;,共调查统计了,1500,件产品,解答本题的关键是准确把握数据作出,2,2,列联表,然后具体分析,解析,(1)2,2,列联表如下:,由列联表可得,|,ad,bc,|,|982,17,493,8|,12750,,相差较大,可在某种程度上认为,“,质量监督员甲是否在生产现场与产品质量有关系,”,合格品数,次品数,合计,甲在生产现场,982,8,990,甲不在生产现场,493,17,510,合计,1475,25,1500,例,4,有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表,班级与成绩列联表,试问能有多大把握认为,“,成绩与班级有关系,”,?,优秀,不优秀,总计,甲班,10,35,45,乙班,7,38,45,总计,17,73,90,辨析,由于对,2,2,列联表中,n,11,,,n,12,,,n,21,,,n,22,的位置不确定,在代入公式时代错了数值导致计算结果的错误,一、选择题,1,可以粗略地判断两个分类变量是否有关系的是,(,),A,散点图,B,三维柱形图和二维条形图,C,独立性检验的思想,D,以上都不对,答案,B,解析,用三维柱形图和二维条形图可以粗略地判断两个分类变量是否有关系,但无法精确给出结论的可靠程度,2,下表是一个,2,2,列联表:,则表中,a,,,b,处的值分别为,(,),A,94,96,B,52,50,C,52,54,D,54,52,y,1,y,2,总计,x,1,a,21,73,x,2,2,25,27,总计,b,46,100,答案,C,3,对于分类变量,X,与,Y,的随机变量,K,2,的观测值,k,,下列说法正确的是,(,),A,k,越大,推断,“,X,与,Y,有关系,”,,犯错误的概率越大,B,k,越小,推断,“,X,与,Y,有关系,”,,犯错误的概率越大,C,k,越接近于,0,,推断,“,X,与,Y,无关,”,,犯错误的概率越大,D,k,越大,推断,“,X,与,Y,无关,”,,犯错误的概率越小,答案,B,4,利用独立性检验来考虑两个分类变量,X,和,Y,是否有关系时,通过查阅临界值表来确定断言,“,X,与,Y,有关系,”,的可信度,如果,k,5.024,,那么就推断,“,X,和,Y,有关系,”,,这种推断犯错误的概率不超过,(,),A,0.25,B,0.75,C,0.025 D,0.975,答案,C,解析,通过查表确定临界值,k,.,当,k,k,0,5.024,时,推断,“,X,与,Y,”,有关系这种推断犯错误的概率不超过,0.025.,二、填空题,5,如果,K,2,的观测值,k,为,8.654,,可推断,“,X,与,Y,有关,”,犯错误的概率不超过,_,答案,0.005,解析,k,8.654,7.879,,就推断,“,X,与,Y,有关,”,犯错误的概率不超过,0.005.,6,为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后,14,天内的结果如下表所示:,进行统计分析时的统计假设是,_,答案,假设电离辐射的剂量与人体受损程度无关,死亡,存活,合计,第一种剂量,14,11,25,第二种剂量,6,19,25,合计,20,30,50,三、解答题,7,在,500,个人身上试验某种血清预防感冒的作用,把一年中的记录与另外,500,个未用血清的人作比较,结果如下表所示,.,试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立性检验,未感冒,感冒,合计,试验过,252,248,500,未用过,224,276,500,合计,476,524,1000,解析,如下图所示,
展开阅读全文