资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。感谢,人教版高中数学课标教材(A版),普通高中课程标准试验教科书选修1-2,2-3,统计案例,简 介,天津八中 陈健,欢迎光临,请多指导,8/15/2025 8:26 AM,1/96,两种统计方法:,回归分析,和,独立性检验,都是惯用,在统计学中占有很主要地位。,统计方法处理问题过程:,确定总体、选择适当变量、搜集数据、分析整理数据、进行决议或预测。,2/96,数学1,数学3,数学4,数学2,数学5,选修2-3,选修2-2,选修2-1,选修1-2,选修1-1,选修3-5,选修3-4,选修3-3,选修3-2,选修3-1,选修3-6,选修4-10,选修4-9,选修4-3,选修4-2,选修4-1,系列1,系列2,系列,3,系列4,选修,必修,3/96,数学3:,统计:随机抽样、用样本预计总体、变量间相关关系,概率:随机事件概率、古典概型、几何概型,选修2-3,(选修1-2),:,概率:离散型随机变量及其分布列、二项分布及其应用、离散型随机变量均值与方差、正态分布,回归分析基本思想及其初步应用、独立性检验基本思想及其初步应用,选修4-9 风险与决议,4/96,统计学关注是怎样探知由观察数据获取知识中不确定性度量,以及怎样明确在最小损失下最优决议。,5/96,教学目标,结构设置与课时分配,回归分析,独立性检验,6/96,1.教学目标,经过经典案例探究,深入了解,线性回归模型,相关知识,包含,残差变量起源,、,模型诊疗,初步知识、应用回归模型处理,非,线性相关关系问题,深入了解,回归分析,基本思想、方法及其初步应用。,7/96,b.经过经典案例探究,了解,独立性检验(只要求22列联表),基本思想、方法及其初步应用。,1.教学目标,8/96,教学目标,结构设置与课时分配,回归分析,独立性检验,9/96,2.结构设置与课时分配,统计案例,(10课时),独立性检验模型,(3课时),回归分析模型,(4课时),实习作业,与小结,(3课时),10/96,教学目标,结构设置与课时分配,回归分析,独立性检验,11/96,3.回归分析,比数学3中,“,回归,”,增加内容,回归分析知识结构图,回归分析教学提议,12/96,比数学3中,“,回归,”,增加内容,必修数学,已学回归内容,画散点图,了解最小二乘法思想,最小二乘预计计算公式,求回归直线方程,ybx,a,用回归直线方程处理应用问题(进行预报),选修数学23,新增内容,引入,一元,线性回归模型,ybxa,e,了解模型中随机误差项,e,产生原因,了解相关指数,R,2,和模型拟合效果之间关系,了解残差图作用(异常数据识别方法、模型改进),利用线性回归模型处理一类,非,线性回归问题,正确了解统计分析方法与结果,13/96,3.回归分析,比数学3中,“,回归,”,增加内容,回归分析知识结构图,回归分析教学提议,14/96,问题背景分析,线性回归模型,两个变量线性相关,最小二乘法,两个变量非线性相关,非线性回归模型,残差分析,相关指数,散点图,线性相关系数,应用,15/96,3.回归分析,比数学3中,“,回归,”,增加内容,回归分析知识结构图,回归分析教学提议,16/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释,残差变量,起源,正确了解,相关系数,、,相关指数,含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,17/96,函数模型与“回归模型”关系,函数模型:,回归模型:,样本点,在,函数曲线上,样本点,不在,回归函数曲线上,y=,f,(x),y=,f,(x)+,e,1993年中国GDP散点图,18/96,函数模型与“回归模型”关系,函数模型:,回归模型:,确定性关系,y=,f,(x),y=,f,(x)+,e,自变量取值一定时,因变量取值带有一定,随机性,两个变量之间关系叫做,相关关系,。,1):相关关系是一个不确定性关系;,对含有相关关系两个变量进行统计分析方法叫,回归分析,。,2):,注,不确定性关系,19/96,函数模型与“回归模型”关系,函数模型:,因变量,y,完全由,自变量,x,确定,回归模型:,预报变量,y,完全由,解释变量,x,和,随机误差,e,确定,解释变量x,(身高),随机误差e,(其它全部变量),预报变量y,(体重),无法得到残差变量值,但却能够预计它,对它进行分析。,20/96,线性回归模型,见选修2-3,P,83,+,+其中和为模型,未知参数,,e,是y与 之间误差,通常,称为,随机误差,。,函数模型与“回归模型”关系,采取,最小二乘法,预计模型参数:,(文科不包括),21/96,这么方法叫做最小二乘法.,(数学3 P,92,),22/96,问题归结为:a,b取什么值时Q最小,即总体和最小.下面是计算回归方程斜率和截距普通公式.,依据最小二乘法和上述公式能够求回归方程.,推导过程见选修2-3 P,80,23/96,为了衡量预报精度,需要预计,2,值?,公式中分母取n-2是为了到达更加好预计效果。,24/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关系数、相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,25/96,1993年中国GDP散点图,散点图与模型选择,样本点呈条状且散布在某一,直线,附近(线性),在这些点附近可画直线不止一条,哪条直线最能代表x与y之间关系呢?,26/96,散点图与模型选择,散点图帮助确定可供选择模型范围,而模型比较则基于残差分析,案例2:红铃虫产卵数与温度,这些散点更像是集中在一条,指数曲线,或,二次曲线,附近。,27/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,28/96,残差变量与模型选择,残差图帮助确定异常点,以及模型改进方向。,残差图制作及作用,在残差图中寻找异常点,可能由错误数据引发,残差图趋势性分析,趋势性残差图说明模型有改进余地,29/96,残差图制作及作用。(选修2-3P,85,及教参P,97,),坐标纵轴为残差变量,横轴能够有不一样选择。,横轴为,编号,,能够考查残差与编号次序之 间关系,惯用于,调查数据错误,。,横轴为,解释变量,,能够考查残差与解释变量关系,惯用于,研究模型是否有改进余地,。,若模型选择正确,残差图中点应该分布在以横轴为中心带形区域。,30/96,在残差图中寻找异常点(,远离横轴,),可能由错误数据引发异常点,异常点,异常点,身高与体重残差图,31/96,残差图趋势性分析,残差图含有趋势性,模型有改进余地,模型中应该添加二次项,32/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,33/96,残差变量起源:,其它原因影响,。如影响身高,y,原因不只是体重,x,,可能还包含遗传基因、饮食习惯、生长环境等原因。,选取回归模型近似真实模型,所引发误差。,预报变量观察误差,。身高 y 测量有误差。,34/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,35/96,正确了解相关系数含义,总偏差平方和,(,)为样本点中心,x,y,表明两个变量之间,线性,相关关系强弱,36/96,相关指数是度量,模型,拟合效果一个指标。,在,线性模型,中,它代表解释变量刻画预报变量能力。,正确了解相关指数含义,37/96,相关指数是度量模型拟合效果一个指标。,相关指数越大,模型拟合效果越好。,残差(,i,),平方和,总偏差,平方和,38/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,39/96,注意提炼案例所蕴含统计思想,在例1结尾提到“用身高预报体重时,需要注意,以下问题:”,这些叙述,适合用于全部回归模型。,.模型适用性;,.模型时间性;,.,样本取值范围对模型影响;,.,模型预报结果正确了解。,40/96,注意提炼案例所蕴含统计思想,又如教科书上所列“建立回归模型基本步骤”,,不但适合用于线性回归模型,也,适合用于全部回归模型。,.对研究对象背景分析;,.利用散点图判断模型类别;,.,预计模型参数;,.,残差分析,模型诊疗。,41/96,1.对研究对象背景分析;,编号,1,2,3,4,5,6,7,8,身高/cm,165,165,157,170,175,165,155,170,体重/kg,48,57,50,54,64,61,43,59,某大学8名女大学生身高与体重,确定变量:,解释变量x(身高),预报变量y(体重),分析:因为问题中要求依据身高预报体重,所以选取身高为自变量,体重为因变量,42/96,注意提炼案例所蕴含统计思想,又如教科书上所列“建立回归模型基本步骤”,,不但适合用于线性回归模型,也,适合用于全部回归模型。,.对研究对象背景分析;,.利用散点图判断模型类别;,.,预计模型参数;,.,残差分析,模型诊疗。,43/96,.利用散点图判断模型类别;,样本点呈条状分布:,身高与体重有比很好线性相关关系,,所以能够用线性回归方程来近似刻画。,44/96,注意提炼案例所蕴含统计思想,又如教科书上所列“建立回归模型基本步骤”,,不但适合用于线性回归模型,也,适合用于全部回归模型。,.对研究对象背景分析;,.利用散点图判断模型类别;,.,预计模型参数;,.,残差分析,模型诊疗。,45/96,.,预计模型参数;,设线性回归模型:y=bx+a+e,采取,最小二乘法,预计模型参数:,=,y,b,x,(x,i,)(y,i,i,=1,n,),y,x,(x,i,i,=1,n,x,),2,b,=,=,0.849,=,85.712,y,=0.849x,85.712,x,=,1,n,i,=1,n,x,i,y,=,1,n,i,=1,n,y,i,46/96,注意提炼案例所蕴含统计思想,又如教科书上所列“建立回归模型基本步骤”,,不但适合用于线性回归模型,也,适合用于全部回归模型。,.对研究对象背景分析;,.利用散点图判断模型类别;,.,预计模型参数;,.,残差分析,模型诊疗。,47/96,(1)依据散点图来粗略判断它们是否线性相关。,(2)是否能够用线性回归模型来拟合数据,(3)经过残差 来判断模型拟合效果,这种分析工作称为,残差分析,.,残差分析,模型诊疗。,48/96,.,残差分析,模型诊疗。,编号,1,2,3,4,5,6,7,8,身高/cm,165,165,157,170,175,165,155,170,体重/kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,49/96,.,残差分析,模型诊疗。,编号,1,2,3,4,5,6,7,8,身高/cm,165,165,157,170,175,165,155,170,体重/kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,50/96,总偏差平方和,:预报变量改变程度,回归平方和,:解释变量引发改变程度,残差平方和,:残差变量改变程度,预报变量改变改变之中能由解释变量引发百分比,R,2,越,大,模型拟合效果越好。,.,残差分析,模型诊疗。,51/96,回归分析教学提议,函数模型与“回归模型”关系,散点图与模型选择,残差变量与模型选择,解释残差变量起源,正确了解相关指数含义,注意提炼案例所蕴含统计思想,应用统计方法处理实际问题需要注意问题,52/96,应用统计方法处理实际问题需要注意问题,经过例2,说明以下结论:,对于一样数据,有不一样统计方法进行分析,要用最有效方法分析数据。(,残差平方和,与,R,2,),53/96,案例2:红铃虫产卵数与温度(残差分析),指数模型,二次模型,残差平方和:,相关系数,R,2,:,1550.538,15448.431,0.98,0.80,54/96,应用统计方法处理实际问题需要注意问题,在讲完例2经过引导学生们讨论“,是不是还有其它效果更加好模型来拟合例2中数据,?”,取得上述结论。,55/96,教学目标,结构设置与课时分配,回归分析,独立性检验,56/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,57/96,a.假设检验问题,假设检验问题由两个,互斥,假设组成:,原假设,,用,H,0,表示;,备择假设,,用,H,1,表示。,表示式为:,H,0,:,H,1,:,如:在“吸烟与患肺癌是否相关系”例子中。,原假设,为:,H,0,:吸烟与患肺癌,没,关系,备择假设,为:,H,1,:吸烟与患肺癌,有,关系,这个假设检验问题能够表示为:,H,0,:,吸烟与患肺癌,没,关系,H,1,:,吸烟与患肺癌,有,关系,58/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,59/96,b.求解假设检验问题,考虑假设检验问题:,H,0,H,1,在H,0,成立条件下,结构与H,0,矛盾小概率事件;,假如样本使得这个小概率事件发生,就能以一定把握断言H,1,成立;不然,就说从数据中没有发觉充分证据支持H,1,成立。,求解思绪:,检验问题解:,一个,规则,,用以判断是,H,0,还是,H,1,正确,。,规则要在获取观察数据之前确定,显著性水平,60/96,b.求解假设检验问题,求解过程:,1、提出假设问题,2、结构随机变量,3、确定拒绝域,4、考查临界值,5、推断结果及解释,61/96,b.求解假设检验问题,求解过程:,1、提出假设问题,如:在“吸烟与患肺癌是否相关系”例子中。,提出假设问题:,原假设,为:,H,0,:吸烟与患肺癌,没,关系,备择假设,为:,H,1,:吸烟与患肺癌,有,关系,62/96,b.求解假设检验问题,求解过程:,1、提出假设问题,2、结构随机变量,3、确定拒绝域,4、考查临界值,5、推断结果及解释,63/96,b.求解假设检验问题,求解过程:,2、结构随机变量,如:在“吸烟与患肺癌是否相关系”例子中。,结构随机变量:,K,2,=,(a+b)(c+d)(a+c)(b+d),n(ad-bc),2,注:不含任何未知参数,K,2,越,小,,原假设,H,0,成立可能性越,大,64/96,b.求解假设检验问题,求解过程:,1、提出假设问题,2、结构随机变量,3、确定拒绝域,4、考查临界值,5、推断结果及解释,65/96,b.求解假设检验问题,求解过程:,3、确定拒绝域,如:在“吸烟与患肺癌是否相关系”例子中。,确定拒绝域,:,k,0,,+),6.635,+),注:6.635经统计取得,若原假设H,0,成立,则P(K,2,6.635)0.01,其中0.01即为显著性水平,66/96,b.求解假设检验问题,求解过程:,1、提出假设问题,2、结构随机变量,3、确定拒绝域,4、考查临界值,5、推断结果及解释,67/96,b.求解假设检验问题,求解过程:,4、考查临界值,如:在“吸烟与患肺癌是否相关系”例子中。,考查临界值,:,k,0,依据K,2,公式及实际数据计算K,2,观察值,k,k56.6326.635=,k,0,不患肺癌,患肺癌,总计,不吸烟,7775(a),42(b),7817(a+b),吸烟,2099(c),49(d),2148(c+d),总计,9874(a+c),91(b+d),9965(a+b+c+d),68/96,b.求解假设检验问题,求解过程:,1、提出假设问题,2、结构随机变量,3、确定拒绝域,4、考查临界值,5、推断结果及解释,69/96,b.求解假设检验问题,求解过程:,5、推断结果及解释,如:在“吸烟与患肺癌是否相关系”例子中。,推断及解释,:,P(K,2,6.635)0.01,k56.6326.635,观察值k落在拒绝域中,拒绝原假设,即有1-,把握认为备择假设成立,;不然接收原假设,即没有发觉样本数据与原假设矛盾。(教参P108),依据,k56.6326.635,,,断定,原假设,:(,H,0,:吸烟与患肺癌,没,关系),不成立,,,即认为“吸烟与患肺癌,有,关系”,或者解释为:,备择假设,:(,H,1,:吸烟与患肺癌,有,关系),成立,有99%把握认为:,吸烟与患肺癌,有,关系,只有1%成立可能,70/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,71/96,反证法原理,:,在假设一个叙述不成立前提下,假如,推出一个矛盾,,就,证实,了这个叙述成立。,假设检验原理,:,在假设一个叙述不成立前提下,假如,一个与该假设矛盾,小概率事件,发生,,就,推断,这个叙述成立。,c.反证法原理与假设检验原理,72/96,c.反证法原理与假设检验原理,反证法,假设检验,要证实结论A,备择假设H,1,在A不成立条件下进行推理,在H1不成立条件下,即H0成立条件下进行推理,推出矛盾,即,结论A成立,推出有利于H1成立小概率事件(概率不超出事件)发生,即H1成立可能性(可能性为1-)很大,没有找到矛盾,,不能对A下结论,即反证法不成功,推出有利于H1成立小概率事件不发生,,即接收原假设,73/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,74/96,d.,独立性检验(假设检验一个特例),检验,两,个,分类变量,x,和 y 之间是否相关系:,H,0,:,x,和 y 之间没相关系 H,1,:,x,和 y 之间相关系,两,个,分类变量,x,和 y可能取值分别为x,1,,x,2,和y,1,,y,2,,其样本频数列联表(称为2,2列联表)为:,y,1,y,2,总计,x,1,a,b,a+b,x,2,c,d,c+d,总计,a+c,b+d,a+b+c+d,75/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,76/96,e.,独立性检验知识结构图,分类变量之间关系,条形图,柱形图,列联表,独立性检验,背景分析,77/96,独立性检验,假设检验问题,求解假设检验问题,反证法原理与假设检验原理,独立性检验,独立性检验知识结构图,教学提议,78/96,f.教学提议,关于探究吸烟与患肺癌关系教学提议,关于例1教学提议,关于例2教学提议,79/96,不患肺癌,患肺癌,总计,不吸烟,7775,42,7817,吸烟,2099,49,2148,总计,9874,91,9965,不患肺癌,患肺癌,总计,不吸烟,a,b,a+b,吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,22列联表,关于探究吸烟与患肺癌关系教学提议,80/96,关于探究吸烟与患肺癌关系教学提议,经过图形,直观判断,只能得到定性结论,无法知道所得结论可信程度及含义,所以需要用列联表检验。,81/96,关于探究吸烟与患肺癌关系教学提议,经过图形,直观判断,只能得到定性结论,无法知道所得结论可信程度及含义,所以需要用列联表检验。,不吸烟,吸烟,患肺癌,百分比,不患肺癌,百分比,82/96,推导统计量K,2,用意是建立判定吸烟与患肺癌是否相关系指标(用于结构有利于H,1,成立小概率事件指标),,使同学了解:,K,2,越大,H,1,成立,可能性,就越大,。,关于探究吸烟与患肺癌关系教学提议,这种可能性计算基于,K,2,分布,K,2,=,(a+b)(c+d)(a+c)(b+d),n(ad-bc),2,83/96,在教学过程中强调:只有在此条件下,才能得到这个近似公式。,在教学过程中能够指出估算需要很多概率统计知识。,在,“吸烟与患肺癌没相关系”成立条件下,,能够估算出:,关于探究吸烟与患肺癌关系教学提议,当,n,时,变为等号。在实际应用中,当,近似效果才可接收。,84/96,结果解释:,k,54.7216.635解释为,有99%把握断定“吸烟与患肺癌相关”。,若按以下规则进行判断,则把“吸烟与患肺癌没相关系”错判断成“吸烟与患肺癌相关系”可能性不超出0.01。,规则:若,K,2,6.635,就断定“吸烟与患肺癌相关”,关于探究吸烟与患肺癌关系教学提议,85/96,关于探究吸烟与患肺癌关系教学提议,总结“两个分类变量独立性检验”本质,问题:,建立,判断结论,H,0,:分类变量,X,与,Y,之间相关系,是否成立,规则。,判别指标,:,规则k,0,:假如kk,0,判定H,0,成立;不然认为H,0,不成立。,确定规则k,0,判定“H,0,成立”犯错误概率。,选修2-3P95表,310给出了一些规则犯错误概率。,86/96,归纳两个分类变量独立性检验基本思想:,当 很大时,就认为两个变量相关系;不然就认为没有充分证据显示两个变量相关系。,关于探究吸烟与患肺癌关系教学提议,87/96,在前面案例中,由,k,54.7216.635 可得结论:,有99%把握断定“吸烟与患肺癌相关”。,另首先,由,k,54.72110.828 还可得结论:,有99.9%把握断定“吸烟与患肺癌相关”。,问题:,二个结论矛盾吗?,关于探究吸烟与患肺癌关系教学提议,可引导学生讨论下面问题,加深对假设检验问题正确了解。,88/96,两个结论不矛盾,它们是对两个不一样评判规则结论。,结论“,有99%把握断定吸烟与患肺癌相关”,是相对于规则一:,假如随机变量观察值大于或等于6.635就认为“吸烟与患肺癌相关系”。,结论“,有99.9%把握断定吸烟与患肺癌相关”,是相对于规则二:,假如随机变量观察值大于或等于10.828就认为“吸烟与患肺癌相关系”。,89/96,阀值设定,阀值设定并无客观标准,但当前统计学上习惯是将其规范化到几个惯用值:最惯用是0.05,其次是0.01,0.10,更小或更大值也能够依据情况需要去采取。,阀值人为性是一个常见现象,往往是为了将事务分类而不得已而做出一个选择。,90/96,f.教学提议,关于探究吸烟与患肺癌关系教学提议,关于例1教学提议,关于例2教学提议,91/96,关于例1教学提议,例1.秃头与患心脏病,在处理实际问题时,能够直接计算K,2,观察值k进行独立检验,而无须写出K,2,推导过程,。,提醒学生们注意统计结果适用范围(这由样本代表性所决定)。,因为这组数据来自住院病人,所以所得到结论适合住院病人群体,92/96,f.教学提议,关于探究吸烟与患肺癌关系教学提议,关于例1教学提议,关于例2教学提议,93/96,例2.性别与喜欢数学课,本例主要是使学生了解独立性检验原理。,在教学过程中向同学们说明:在掌握了两个分类变量独立性检验方法之后,就能够模仿例1中计算处理实际问题,而没有必要画对应图形。,图形可帮助向非专业人士解释所得结果;,也能够帮助我们判断所得结果是否合理,关于例2教学提议,94/96,8/15/2025 8:26 AM,95/96,96/96,
展开阅读全文