收藏 分销(赏)

第八章成对数据的统计分析章末复习课公开课.pptx

上传人:二*** 文档编号:12612108 上传时间:2025-11-11 格式:PPTX 页数:43 大小:1.28MB 下载积分:5 金币
下载 相关 举报
第八章成对数据的统计分析章末复习课公开课.pptx_第1页
第1页 / 共43页
本文档共43页,全文阅读请下载到手机保存,查看更方便
资源描述
,章末复习课,第八章,成对数据的统计分析,1,知识网络,PART ONE,2,考点突破,PART TWO,一、变量的相关性,1.,变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度,.,2.,在学习该部分知识时,体会直观想象和数学运算的素养,.,例,1,(1),下列两个变量具有相关关系且不是函数关系的是,A.,圆的半径与面积,B.,匀速行驶的车辆的行驶距离与时间,C.,庄稼的产量与施肥量,D.,人的身高与视力,解析,对于,A,,圆的半径与面积是确定的关系,是函数关系;,对于,B,,匀速行驶的车辆的行驶距离与时间是确定的关系,是函数关系;,对于,C,,庄稼的产量与施肥量在一定范围内有相关关系,不是函数关系;,对于,D,,人的身高与视力,不具有相关关系,也不是函数关系,.,故选,C.,(2),在一次试验中,测得,(,x,,,y,),的四组值分别为,(1,2),,,(2,0),,,(4,,,4),,,(,1,6),,则,y,与,x,的样本相关系数为,_.,1,方法二观察四个点,发现其在一条单调递减的直线上,,,故,y,与,x,的样本相关系数为,1.,反思感悟,变量相关性的判断的两种方法,(1),散点图法:直观形象,.,(2),公式法:可用公式精确计算,需注意特殊情形的样本相关系数,.,如点在一条直线上,,|,r,|,1,,且当,r,1,时,正相关;,r,1,时,负相关,.,跟踪训练,1,(1),已知变量,x,和,y,满足关系,y,2,x,1,,变量,y,与,z,正相关,下列结论中正确的是,A.,x,与,y,正相关,,x,与,z,负相关,B.,x,与,y,正相关,,x,与,z,正相关,C.,x,与,y,负相关,,x,与,z,负相关,D.,x,与,y,负相关,,x,与,z,正相关,解析,根据题意,变量,x,和,y,满足关系,y,2,x,1,,,其,比例系数为,20,,所以,x,与,y,负相关,;,又,由变量,y,与,z,正相关,则,x,与,z,负相关,.,故选,C.,(2),如图所示,给出了样本容量均为,7,的,A,,,B,两组成对样本数据的散点图,已知,A,组成对样本数据的样本相关系数为,r,1,,,B,组成对样本数据的样本相关系数为,r,2,,,则,A.,r,1,r,2,B.,r,1,r,2,D,.,无法,判定,解析,根据,A,,,B,两组成对样本数据的散点图知,,A,组成对样本数据几乎在一条直线上,且成正相关,,,样本相关系数为,r,1,应最接近,1,,,B,组成对样本数据分散在一条直线附近,也成正相关,,,样本相关系数为,r,2,,满足,r,2,r,2,,故选,C.,二、一元线性回归模型及其应用,1.,该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析,.,2.,主要培养数学建模和数据分析的素养,.,例,2,一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:,人数,x,i,10,15,20,25,30,35,40,件数,y,i,4,7,12,15,20,23,27,其中,i,1,2,3,4,5,6,7.,(1),以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;,(2),求经验回归方程;,(,结果保留到小数点后两位,),(3),预测进店人数为,80,时商品销售的件数,.(,结果保留整数,),解,由表中数据,画出,7,个数据点,,可得散点图如图所示,.,(1),以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;,(2),求经验回归方程;,(,结果保留到小数点后两位,),(3),预测进店人数为,80,时商品销售的件数,.(,结果保留整数,),反思感悟,解决回归分析问题的一般步骤,(1),画散点图,.,根据已知数据画出散点图,.,(2),判断变量的相关性并求经验回归方程,.,通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程,.,(3),回归分析,.,画残差图或计算,R,2,,进行残差分析,.,(4),实际应用,.,依据求得的经验回归方程解决实际问题,.,三、非线性经验回归方程,1.,在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化,.,2.,体现数学建模的优劣,提升数据分析的素养,.,作业本,49,页,16,题,例,3,某公司为确定下一年度投入产品的宣传费,需了解年宣传费,x,(,单位:千元,),对年销售量,y,(,单位:,t),和年利润,z,(,单位:千元,),的影响,于是对近,8,年的宣传费,x,i,和年销售量,y,i,(,i,1,2,,,,,8),的数据进行了初步处理,得到如图所示的散点图及一些统计量的值,.,(2),根据,(1),的判断结果及表中数据,建立,y,关于,x,的回归方程,;,(3),已知这种产品的年利润,z,与,x,,,y,之间的关系为,z,0.2,y,x,,根据,(2),的结果回答下列问题,.,当年宣传费,x,49,时,年销售量及年利润的预报值是多少?,年宣传费,x,为何值时,年利润的估计值最大?,故当年宣传费为,46.24,千元时,年利润的估计值最大,.,反思感悟,非线性经验回归方程的求解策略,(1),本例中,,y,与,x,不是线性相关关系,但通过转换线性相关关系,从而可利用线性回归分析间接讨论,y,与,x,的相关关系,.,(2),可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合,.,四、独立性检验,1.,主要考查根据样本制作,2,2,列联表,由,2,2,列联表计算,2,,查表分析并判断相关性结论的可信程度,.,2.,通过计算,2,值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养,.,例,4,奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了,60,人,结果如下:,是否,愿意,提供志愿者,服务,性别,愿意,不愿意,男生,20,10,女生,10,20,(1),用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取,6,人,其中男生抽取多少人?,(2),依据小概率值,0.01,的独立性检验,能否据此推断该校高中生是否愿意提供志愿者服务与性别有关?,下面,的临界值表供参考:,是否,愿意,提供志愿者,服务,性别,愿意,不愿意,男生,20,10,女生,10,20,0.10,0.05,0.010,0.005,0.001,x,2.706,3.841,6.635,7.879,10.828,解,零假设,H,0,:该校高中生是否愿意提供志愿者服务与性别无关,.,所以依据小概率值,0.01,的独立性检验,我们可以推断,H,0,不成立,可以认为该校高中生是否愿意提供志愿者服务与性别有关,该推断错误的概率不超过,0.01.,反思感悟,独立性检验问题的求解策略,(1),等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两个变量的相关性,.,(2),通过公式,2,先,计算,2,,再与,临,界,值表作比较,最后得出结论,.,3,真题体验,PART THREE,1,2,1.(,2020,全国,),某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,.,为调查该地区某种野生动物的数量,将其分成面积相近的,200,个地块,从这些地块中用简单随机抽样的方法抽取,20,个作为样区,调查得到样本数据,(,x,i,,,y,i,)(,i,1,2,,,,,20),,其中,x,i,和,y,i,分别表示第,i,个样区的植物覆盖面积,(,单位:公顷,),和这种野生动物的数量,并计算得,(1),求该地区这种野生动物数量的估计值,(,这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数,),;,从而该地区这种野生动物数量的估计值为,60,200,12 000.,1,2,(2),求样本,(,x,i,,,y,i,)(,i,1,2,,,,,20),的相关系数,(,精确到,0.01),;,1,2,1,2,(3),根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由,.,1,2,解,分层随机抽样,根据植物覆盖面积的大小对地块分层,再对,200,个地块进行分层抽样,.,理由如下:由,(2),知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系,.,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,,,采用,分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,,,从而,可以获得该地区这种野生动物数量更准确的估计,.,1,2,2.(,2020,新高考全国,改编,),为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了,100,天空气中的,PM,2.5,和,SO,2,浓度,(,单位:,g/m,3,),,得下表:,SO,2,PM,2.5,0,50,(50,150,(150,475,0,35,32,18,4,(35,75,6,8,12,(75,115,3,7,10,(1),估计事件,“,该市一天空气中,PM,2.5,浓度不超过,75,,且,SO,2,浓度不超过,150,”,的概率;,1,2,解,由表格可知,该市,100,天中,空气中的,PM,2.5,浓度不超过,75,,,且,SO,2,浓度不超过,150,的天数为,32,6,18,8,64,,,所以该市一天中,空气中的,PM,2.5,浓度不超过,75,,,1,2,(2),根据所给数据,完成下面的,2,2,列联表:,SO,2,PM,2.5,0,150,(150,475,0,75,(75,115,1,2,解,由所给数据,可得,2,2,列联表:,SO,2,PM,2.5,0,150,(150,475,0,75,64,16,(75,115,10,10,1,2,(3),根据,(2),中的列联表,依据小概率值,0.010,的独立性检验,分析该市一天空气中,PM,2.5,浓度与,SO,2,浓度是否有关,.,1,2,解,零假设为,H,0,:该市一天空气中,PM,2.5,浓度与,SO,2,浓度无关,.,根据列联表中数据,经计算得到,7.4846.635,x,0.010,,,根据小概率值,0.010,的独立性检验,我们推断,H,0,不成立,,,即,认为该市一天空气中,PM,2.5,浓度与,SO,2,浓度有关,.,1,2,本课结束,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服