1、推荐学习K12 资料推荐学习K12 资料变量间的相关关系与统计案例(25 分钟45 分)一、选择题(每小题 5 分,共 20 分)1.有下列关于回归分析的说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示;通过回归方程=x+可以估计变量的取值和观测变量的变化趋势;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确的个数是()A.1 B.2 C.3 D.4【解析】选 C.反映的是最小二乘法的思想,故正确;反映的是散点图的作用,也正确;解释的是回归方程=x+的作用,也正确;是
2、不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.2.(2015 湖北高考)已知变量x 和 y 满足关系y=-0.1x+1,变量 y 与 z 正相关,下列结论中正确的是()A.x 与 y 正相关,x 与 z 负相关B.x 与 y 正相关,x 与 z 正相关C.x 与 y 负相关,x 与 z 负相关D.x 与 y 负相关,x 与 z 正相关【解析】选 C.因为变量x 和 y 满足关系y=-0.1x+1,其中-0.10),则将 y=-0.1x+1 代入即可得到:z=k(-0.1x+1)+b=-0.1kx+(k+b),所以-0.1k0,0 B.0,0 C.0 D.0,0【解析】选 B
3、.由表中数据画出散点图,如图,推荐学习K12 资料推荐学习K12 资料由散点图可知0.4.(2016 洛阳模拟)通过随机询问110 名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走斑马线40 20 60 走人行天桥20 30 50 总计60 50 110 由 K2=算得 K2的观测值 k=7.8.附表:P(K2k0)0.050 0.010 0.001 k03.841 6.635 10.828 参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01 的前提下认为“选择过马路的方式与性别有关”B.在犯错误的概率不超过0.01 的前提下认为
4、“选择过马路的方式与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”【解析】选 A.因为 K2的观测值k7.8 6.635,所以犯错误的概率不超过0.01.【加固训练】(2016安庆模拟)某人研究中学生的性别与成绩、视力、智商、阅读量这4 个变量的关系,随机抽查52 名中学生,得到统计数据如表1 至表 4,则与性别有关联的可能性最大的变量是()表 1 成绩性别不及格及格总计男6 14 20 女10 22 32 总计16 36 52 推荐学习K12 资料推荐学习K12 资料表 2 视
5、力性别好差总计男4 16 20 女12 20 32 总计16 36 52 表 3 智商性别偏高正常总计男8 12 20 女8 24 32 总计16 36 52 表 4 阅读量性别丰富不丰富总计男14 6 20 女2 30 32 总计16 36 52 A.成绩B.视力C.智商D.阅读量【解析】选 D.因为 k1=,k2=,k3=,推荐学习K12 资料推荐学习K12 资料k4=,则有 k4k2k3k1,所以阅读量与性别关联的可能性最大.二、填空题(每小题 5 分,共 15 分)5.(2016 唐山模拟)某市居民20112015 年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料
6、如表所示:年份2011 2012 2013 2014 2015 收入 x 11.5 12.1 13 13.3 15 支出 y 6.8 8.8 9.8 10 12 根 据 统 计 资 料,居 民 家 庭 年 平 均 收 入 的 中 位 数 是,家 庭 年 平 均 收 入 与 年 平 均 支 出 有线性相关关系.【解析】由中位数的定义知,总体个数为奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.答案:13 正6.(2016 唐山模拟)为了考察是否喜欢运动与性别之间的关系,得到一个22
7、 列联表,经计算 K2的观测值k=6.679,则在犯错误的概率不超过的前提下认为是否喜欢运动与性别有关系.本题可以参考独立性检验临界值表P(K2k0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828【解析】由于 K2=6.6796.635,所以在犯错误的概率不超过0.01 的前提下认为是否喜欢运动与性别有关系.答案:0.01【加固训练】1.(2016 深圳模拟)某中学将100 名高一新生分成水平相同的甲,乙两个“
8、平行班”,每班 50人.陈老师采用A,B 两种不同的教学方式分别在甲,乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20 名学生的成绩进行统计,作出茎叶图如下,记成绩不低于90 分者为“成绩优秀”.推荐学习K12 资料推荐学习K12 资料由以上统计数据填写下面22 列联表,并判断是否有90%的把握认为“成绩优秀”与教学方式有关.甲班(A 方式)乙班(B 方式)总计成绩优秀成绩不优秀总计【解析】由已知数据得:甲班(A 方式)乙班(B 方式)总计成绩优秀1 5 6 成绩不优秀19 15 34 总计20 20 40 根据 22 列联表中数据,K2=3.1372.
9、706,所以有 90%的把握认为“成绩优秀”与教学方式有关.2.(2016 成都模拟)为了比较注射A,B 两种药物后产生的皮肤疱疹的面积,选 200 只家兔做试验,将这 200只家兔随机地分成两组,每组 100 只,其中一组注射药物A,另一组注射药物B.完成下面22 列联表,并回答能否在犯错误的概率不超过0.01 的前提下认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.疱疹面积小于 70mm2疱疹面积不小于 70mm2总计注射药物A a=b=30 a+b=注射药物B c=35 d=c+d=推荐学习K12 资料推荐学习K12 资料总计a+c=b+d=a+b+c+d=【解题提示】
10、(1)把握 22 列联表的意义,准确填入数据.(2)将数据代入随机变量K2的公式进行计算.(3)与临界值比较并得出结论.【解析】22 列联表如下:疱疹面积小于 70mm2疱疹面积不小于 70mm2总计注射药物A a=70 b=30 a+b=100 注射药物B c=35 d=65 c+d=100 总计a+c=105 b+d=95 a+b+c+d=200 K2的观测值k=24.56,由于 k6.635,因此能在犯错误的概率不超过0.01 的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.7.(2016 岳阳模拟)车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5
11、次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.零件数 x(个)10 20 30 40 50 加工时间y(min)62 75 81 89 现发现表中有一个数据看不清,请你推断出该数据的值为.【解析】由已知可计算求出=30,而回归直线方程必过点(,),则=0.67 30+54.9=75,设模糊数据为a,则=75,计算得 a=68.答案:68 三、解答题8.(10 分)(2015 重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:推荐学习K12 资料推荐学习K12 资料年份2010 2011 2012 201
12、3 2014 时间代号t 1 2 3 4 5 储蓄存款y(千亿元)5 6 7 8 10(1)求 y 关于 t 的回归方程=t+.(2)用所求回归方程预测该地区2015 年(t=6)的人民币储蓄存款.附:回归方程=t+中,=,=-.【解题提示】(1)直接利用回归系数公式求解即可.(2)利用回归方程代入直接进行计算即可.【解析】(1)列表计算如下:i tiyitiyi1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 15 36 55 120 这里 n=5,=ti=3,=yi=7.2.又-n=55-5 32=10,tiyi-n=120-
13、537.2=12,从而=1.2,=-=7.2-1.23=3.6,故所求回归方程为=1.2t+3.6.(2)将 t=6 代入回归方程可预测该地区2015 年的人民币储蓄存款为=1.2 6+3.6=10.8(千亿元).【加固训练】某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价 x(元)8 8.2 8.4 8.6 8.8 9 推荐学习K12 资料推荐学习K12 资料销量 y(件)90 84 83 80 75 68(1)求回归直线方程=x+,其中=-20,=-.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4 元/件,为使工
14、厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,=(y1+y2+y3+y4+y5+y6)=80.所以=-=80+208.5=250.从而回归直线方程为=-20 x+250.(2)设工厂获得的利润为L 元,依题意得L=x(-20 x+250)-4(-20 x+250)=-20 x2+330 x-1000=-20+361.25.当且仅当x=8.25 时,L 取得最大值,故当单价定为8.25 元时,工厂可获得最大利润.(20 分钟40 分)1.(5分)(2016 洛阳模拟)对具有线性相关关系的变量x,y 有一组观测
15、数据(xi,yi)(i=1,2,8),其回归直线方程是=x+,且 x1+x2+x3+x8=2(y1+y2+y3+y8)=6,则实数的值是()A.B.C.D.【解析】选 B.依题意可知样本中心点为,则=+,解得=.2.(5分)(2016 常德模拟)有两个分类变量X,Y,其一组的22 列联表如下所示,Y1Y2X1a 20-a X215-a 30+a 其中 a,15-a 均为大于 5的整数,若在犯错误的概率不超过0.05 的前提下认为X,Y 有关,则 a的值为()A.8 B.9 C.8 或 9 D.6 或 8【解题提示】计算 K2的观测值k,建立 k3.841 的不等式.解不等式并根据a,15-a
16、均为大于5 的整数求解.【解析】选 C.根据公式,得推荐学习K12 资料推荐学习K12 资料k=3.841,根据 a5 且 15-a5,a Z,求得 a=8 或 9 满足题意.3.(5分)已知 x,y 之间的一组数据如下表:x 2 3 4 5 6 y 3 4 6 8 9 对于表中数据,现给出如下拟合直线:y=x+2;y=3x-1;y=x-;y=x.则根据最小二乘法的思想求得拟合程度最好的直线是(填序号).【解析】由题意知=4,=6,所以=,所以=-=-,所以=x-,所以填.答案:4.(12分)在一次抽样调查中测得样本的5 个样本点,数值如下表:x 0.25 0.5 1 2 4 y 16 12
17、5 2 1 求 y 与 x 之间的回归方程.【解析】画出散点图如图所示,观察可知y 与 x 近似是反比例函数关系.设 y=(k 0),令 t=,则 y=kt.可得到 y 关于 t 的数据如表:推荐学习K12 资料推荐学习K12 资料t 4 2 1 0.5 0.25 y 16 12 5 2 1 画出散点图如图所示,观察可知 t 和 y 有较强的线性相关性,因此可利用线性回归模型进行拟合,易得:=4.1344,=-0.7917,所以=4.1344t+0.7917,所以 y 与 x 的回归方程是=+0.7917.5.(13分)(2016 太原模拟)设三组试验数据(x1,y1),(x2,y2),(x3
18、,y3)的回归直线方程是:=x+,使代数式y1-(x1+)2+y2-(x2+)2+y3-(x3+)2的值最小时,=-,=(,分别是这三组数据的横、纵坐标的平均数)若有七组数据列表如下:x 2 3 4 5 6 7 8 y 4 6 5 6.2 8 7.1 8.6(1)求上表中前三组数据的回归直线方程.(2)若|yi-(xi+)|0.2,即称(xi,yi)为(1)中回归直线的拟合“好点”,求后四组数据中拟合“好点”的概率.【解析】(1)前三组数的平均数:=3,=5.根据公式:=.所以=5-3=.所以回归直线方程为y=x+.(2)|6.2-3.5-0.55|=0.2 0.2,推荐学习K12 资料推荐学习K12 资料|8-3.5-0.5 6|=1.50.2,|7.1-3.5-0.57|=0.10.2,综上,拟合的“好点”有2 组,所以后四组数据中拟合“好点”的概率P=.
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100