1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一章 统计案例简 介,1.,教学目标,通过典型案例的探究,进一步了解,回归分 析,的基本思想、方法及其初步应用。,通过典型案例的探究,了解,独立性检验(只要求,22,列联表),的基本思想、方法及其初步应用。,2.,结构设置与课时分配,(,4,学时),3.,回归分析模型,a.,比,数学,3,中“回归”增加的内容,数学,统计,画散点图,了解最小二乘法的思想,求回归直线方程,y,bx,a,用回归直线方程解决应用问题,选修,-,统计案例,引入线性回归模型,y,bx,a,e,了解模型中随机误差项,e,产生的原因,了
2、解相关指数,R,2,和模型拟合的效果之间的关系,了解残差图的作用,利用线性回归模型解决一类非线性回归问题,正确理解分析方法与结果,b.,函数模型与“回归模型”的关系,函数模型:,回归模型:,不能提供,选择模型的准则,可以提供,选择模型的准则,问题背景分析,线性回归模型,两个变量线性相关,最小二乘法,两个变量非线性相关,非线性回归模型,残差分析,相关指数,散点图,线性相关系数,应用,c.,回归分析知识结构图,d.,教学建议,散点图;,回归方程:,通过探究,“,身高,172 cm,的女大学生的体重一定是,60.23 kg,吗?”,引入线性回归模型。此处可以引导学生们体会函数模型与回归模型之间的差别
3、案例,1,:女大学生的,身高与体重,使学生理,解:在回归模型中,预报变量(因变量)是解释变量(自变量)与残差变量共同作用的结果。,解释残差变量的来源,(,可以推广到一般):,其它因素的影响:影响身高,y,的因素不只是体重,x,,可能还包括遗传基因、饮食习惯、生长环境等因素;,用线性回归模型近似真实模型所引起的误差;,身高,y,的观测误差。,使学生正确理解相关指数的含义,他是度量模型拟合效果的一种指标。在线性模型中,他代表自变量刻画预报变量的能力。,总偏差平方和:,预报变量的变化程度,回归平方和:,解释变量引起的变化程度,残差平方和:,残差变量的变化程度,在线性模型中,,并不要求学生掌握,偏
4、差平方和分解公式,可以直接由相关指数的定义理解其含义,使学生了解残差图的制作及作用。,坐标纵轴为残差变量,横轴可以有不同的选择;,若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域,;,对于远离横轴的点,要特别注意,。,身高与体重残差图,异常点,错误数据,模型问题,在教学的过程中,要注意把所蕴含的统计思想提炼出来。如在本例结尾提到,“,用身高预报体重时,需要注意下列问题:,”,,这些论述适用于所有的回归模型。,模型适用的总体;,模型的时间性;,样本的取值范围对模型的影响;,模型预报结果的正确理解。,教科书上所列,“,建立回归模型的基本步骤,”,,不仅适用于线性回归模型,也适用于一般回
5、归模型的建立。,散点图:,从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。,案例,2,:红铃虫的产卵数与温度,令 ,则,x,与,z,的散点图为,x,和,z,之间的关系可以用线性回归模型来拟合,令 ,则,t,与,y,的散点图为,散点并不集中在一条直线的附近,因此用线性,回归模型拟合他们的效果不是最好的。,教师在此处可以引导学生体会应用统计方法解决实际问题需要注意的问题:,现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:,可以利用直观(散点图和残差图)、相关指数来确定哪一个模型的拟合效果更好。,
6、对于同样的数据,有不同的统计方法进行分析,,要用最有效的方法分析数据。,4.,两个分类变量的,独立性检验,3,课时,a.,反证法原理与假设检验原理,反证法原理:,在一个已知假设下,如果,推出一个矛盾,,就,证明,了这个假设不成立。,假设检验原理:,在一个已知假设下,如果,一个与该假设矛盾的小概率事件发生,,就,推断,这个假设不成立。,例,.,数学家庞加莱每天都从一家面包店买一块,1000g,的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为,950g,。于是庞加莱推断这家面包店的面包分量不足。,推断过程:,假设“面包分量足”,则一年购买面包的质量数据的平均值应该不
7、少于,1000g,;,“平均值不大于,950g”,是一个与假设“面包分量足”矛盾的小概率事件;,这个小概率事件的发生使庞加莱得出推断结果。,b.,假设检验问题,假设检验问题由两个互斥的假设构成,其中一个,叫做原假设,用,H,0,表示;另一个叫做备择假设,用,H,1,表示。,例如,在前面的例子中,原假设为:,H,0,:面包分量足,,备择假设为:,H,1,:面包分量不足。,这个假设检验问题可以表达为:,H,0,:面包分量足 ,H,1,:面包分量不足,c.,求解,假设检验问题,考虑假设检验问题:,H,0,H,1,在,H,0,成立的条件下,构造与,H,0,矛盾的小概率事件;,如果样本使得这个小概率事件
8、发生,就能以一定把握断言,H,1,成立;否则,断言没有发现样本数据与,H,0,相矛盾的证据。,求解思路:,问题:判断应该是,H,0,还是,H,1,正确?,d.,独立性检验,检验两个分类变量,x,和,y,之间是否有关系,即回答假设检验问题:,H,0,:,x,和,y,之间没有关系,H,1,:,x,和,y,之间有关系,只取两个值的变量,e.,知识结构图,分类变量之间关系,条形图,柱形图,列联表,独立性检验,背景分析,f.,教学建议,案例,1.,吸烟与肺癌,确定所涉及的变量是否为二值分类变量;,根据样本数据制作列联表:,通过图形直观判断两个分类变量是否相关:,不吸烟,吸烟,患肺癌,比例,不患肺癌,比例
9、在教学过程中强调:只有在此条件下,才能得到这个近似公式。,在教学过程中可以指出估算需要很多的概率统计知识,为学生指明还有更多的知识需要学习。,推导统计量,K,2,(,用于构造有利于,H,成立的小概率事件,),,使同学了解:,K,2,越大,,H,成立的可能性就越大。,在“吸烟与患肺癌没有关系”成立的条件下,可以估算出:,推导统计量,K,2,(,用于构造有利于,H,成立的小概率事件,),,使同学了解:,K,2,越大,,H,成立的可能性就越大。,在“吸烟与患肺癌没有关系”成立的条件下,可以估算出:,当,n,时,变为等号。在实际应用中,当,近似的效果才可接受。,推导统计量,K,2,(,用于构造有利于
10、H,成立的小概率事件,),,使同学了解:,K,2,越大,,H,成立的可能性就越大。,在“吸烟与患肺癌没有关系”成立的条件下,可以估算出:,注,:隐含了构造与原假设,H,0,矛盾的小概率事件,的思想,基础好的学生可以深入体会。,由列联表中的数据计算随机变量,K,2,的值:,用,k,是为了区分随机变量与其观测值,结果的解释:,k,54.7216.635,解释为,有,99%,的把握断定“吸烟与患肺癌有关”。,若按如下规则进行判断,则把“吸烟与患肺癌没有关系”错判断成“吸烟与患肺癌有关系”的可能性不超过,0.01,。,规则:若,K,2,6.635,,就断定“吸烟与患肺癌有关”,两个分类变量独立性检验
11、的基本思想:,当 很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。,小概率事件发生,在前面案例中,由,k,54.7216.635,可得结论:,有,99%,的把握断定“吸烟与患肺癌有关”。,规则一:如果随机变量的观测值大于或等于,6.635,就认为“吸烟与患肺癌有关系”。,另一方面,,由,k,54.72110.828,还可得结论:,有,99.9%,的把握断定“吸烟与患肺癌有关”。,规则二:如果随机变量的观测值大于或等于,10.828,就认为“吸烟与患肺癌有关系”。,问题:,二者矛盾吗?,不矛盾,他们是对两个不同评判规则的结论。,评判规则是在获取样本数据之前,确定的。,例
12、1.,秃头与患心脏病,在解决实际问题时,可以直接计算,K,2,的观测值,k,进行独立检验,而不必写出,K,2,的推导过程,。,本例中的边框中的注解,主要是使得学生们注意统计结果的适用范围(这由样本的代表性所决定)。,因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体,例,2.,性别与喜欢数学课,本例主要是使学生理解独立性检验的原理。,在教学过程中向同学们说明:在掌握了两个分类变量的独立性检验方法之后,就可以模仿例,1,中的计算解决实际问题,而没有必要画相应的图形。,图形可帮助向非专业人士解释所得结果;,也可以帮助我们判断所得结果是否合理,独立性检验结束,第二章 随机变量及其分布简
13、 介,1.,教学目标,在对具体问题的分析中,理解,取有限值,的,离散型随机变量,及其,分布列,的概念,认识分布列对于刻画随机现象的重要性。,通过实例,理解,超几何分布,及其导出过程,并能进行简单的应用。,在具体情景中,了解条件概率和两个事件相互独立的概念,理解,n,次,独立重复试验,的模型及,二项分布,,并能解决一些简单的实际问题。,通过实例,理解取有限值的离散型随机变量,均值、方差,的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。,通过实际问题,借助直观,认识,正态分布曲线的特点及曲线,所表示的意义。,2.,结构设置与课时分配,3.,教材内容的变化与特点,知识的引入,的变
14、化,:,注重利用学生熟悉的实例和具体情景,以引发学生的学习兴趣,;,通过思考或探究栏目提出问题,以调动学生解决问题的积极性。,具体内容的变化:,以,取有限值,的离散型随机变量为载体;,增加了,超几何分布,。,知识的应用,体现概率统计的,应用价值,;,利用思考、探究等栏目提高学生,解决实际问题,能力。,例如:,随机变量的引入,思考:抛一枚骰子,出现的点数可以用数字,1,,,2,,,3,,,4,,,5,,,6,来表示,那么掷一枚硬币的结果是否也可以用数字来表示呢?,例如:,条件概率的引入,探究:,3,张奖券中只有,1,张能中奖,现分别由,3,名同学无放回地抽取,问最后一名同学抽到中奖奖券的概率是否
15、比其他同学小?,思考,:如果已经知道第一名同学没有抽到中奖奖券,那么,最后一名同学抽到中奖奖券的概率又是多少?,条件概率,例如:,离散型随机变量均值的引入,思考:某商场要将单价分别为,18,元,/kg,,,24,元,/kg,,,36,元,/kg,的,3,种糖果按,3,:,2,:,1,的比例混合销售,如何对混合糖果定价才合理?,利用高尔顿版引入正态分布的密度曲线更直观,易于解释曲线所表示的意义,.,例如:正态分布密度曲线的引入,知识的引入,的变化,:,注重利用学生熟悉的实例和具体情景,以引发学生的学习兴趣,;,通过思考或探究栏目提出问题,以调动学生解决问题的积极性。,具体内容,的变化:,以,取有
16、限值,的离散型随机变量为载体;,增加了,超几何分布,。,知识的应用,体现概率统计的,应用价值,;,利用思考、探究等栏目提高学生,解决实际问题,能力。,3.,教材内容的变化与特点,用,有限值,的离散型随机变量作为载体的好处:,使学生的注意力更集中在有关随机变量的均值、方差及其含义的理解;,便于解释随机变量取所有值的概率和为,1,;,不影响二点分布、超几何分布、二项分布的知识理解,他们都是取有限值的随机变量。,例,1.2,在含有,5,件次品的,100,件产品中,任取,3,件,试求:,(,1,)取到的次品数,X,的分布列;,(,2,)至少取到,1,件次品的概率,引入,超几何分布,的好处:,贴近学生们
17、的生活。如在模球和扑克牌游戏中,都会出现超几何分布。而同学们又很熟悉这些游戏,由此可提升他们学习概率知识的兴趣。,应用广泛,如,知识的引入,的变化,:,注重利用学生熟悉的实例和具体情景,以引发学生的学习兴趣,;,通过思考或探究栏目提出问题,以调动学生解决问题的积极性。,具体内容,的变化:,以取有限值的离散型随机变量为载体;,增加了超几何分布。,知识的应用,体现概率统计的,应用价值,;,利用思考、探究等栏目提高学生,解决实际问题,能力。,3.,教材内容的变化与特点,例,1.3,在某年级的联欢会上设计了一个摸,奖游戏,在一个口袋中装有,10,个红球,,20,个白球,这些球除颜色外完全相同一次从中摸
18、出,5,个球,至少摸到,3,个红球就中奖求中奖的概率,超几何分布的应用,思考:如果要将这个游戏的中奖概率控制在,55%,左右,那么应该如何设计中奖规则?,例,2.2,一张储蓄卡的密码共有,6,位数字,,每位数字都可从,0,9,中任选一个某人在银行自动提款机上取钱时,忘记了密码的最后一位数字,(,1,)求在他任意按最后一位数字的,情况下,不超过,2,次就按对的概率;,(,2,)如果他记得密码的最后一位是,偶数,求不超过,2,次就按对的概率,条件概率的应用,例,2.3,某商场推出二次开奖活动,凡购买一定价值,的商品可以获得一张奖券奖券上有一个兑奖号码,可以分别参加两次抽奖方式相同的兑奖活动如果两次
19、兑奖活动的中奖概率都是,0,05,,求,(,1,)两次抽奖都抽到某一指定号码的概;,(,2,)两次抽奖恰有一次抽到某一指定号码,的概率;,(,3,)两次抽奖至少有一次抽到某一指定号,码的概率,独立性的应用,思考:二次开奖至少中一次奖的概率是不是一次开奖中奖概率的两倍?为什么?,二项分布的应用,例,2.4,某射手每次射击击中目标的概率,是,0.8,,求这名射手,(,1,)在,10,次射击中,恰有,8,次击,中目标的概率;,(,2,)在,10,次射击中,至少有,8,次,击中目标的概率,解决实际问题的例子,例,3,根据气象预报,某地区近期有小洪水的概率为,0.25,,有大洪水的概率为,0.01,该地
20、区某工地上有一台大型设备,遇到大洪水时要损失,60 000,元,遇到小洪水时要损失,10 000,元为保护设备,有以下,3,种方案:,方案,1,:运走设备,搬运费为,3800,元;,方案,2,:建保护围墙,建设费为,2000,元但,围墙只能防小洪水;,方案,3,:不采取措施,希望不发生洪水,试比较哪一种方案好,.,4.,教学建议,在教学过程中要交待引入随机变量的原因(章引言中);,注意通过边框问题引导学生了解:对于同一个实际问题,可以用不同的随机变量来描述(如掷一枚硬币);,通过与函数的比较加深对随机变量的理解;,通过取有限值的随机变量为载体,介绍有关随机变量的概念,重点在概率含义的理解及应用
21、离散型随机变量的定义使用了“取值可以一一列出”的描述性语言,主要是为了避免“,可数集,”概念;,注意超几何分布与二项分布背景的区别:,超几何分布:不放回模出,m,个球中的红球个数;,二项分布:有放回模出,m,个球中的红球个数。,注意解释随机变量与样本均值,(,方差,),的关系:,两者都表示各自的平均位置,(,变化剧烈程度,),;,样本均值,(,方差,),具有随机性,而随机变量的均值,(,方差,),没有随机性;,样本均值,(,方差,),的极限是总体均值,(,方差,),。,在高尔顿钉板试验中,课文中说“随着试验次数的增加,这个频率直方图的形状会越来越,像,一条钟形曲线”。,越来越接近于钟形曲线的离散化。,谢谢!,欢迎各位老师对教材,提出宝贵意见,,






