1、 考点规范练49 相关性、最小二乘估计与统计案例 考点规范练A册第38页 基础巩固组 1.根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到的回归方程为y=bx+a,则( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案:B 解析:由表中数据画出散点图,如图, 由散点图可知b<0,a>0,选B. 2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A.若χ2的观测
2、值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病 B.由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病 C.若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确 答案:C 解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计. 3.(2015湖北七市联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线y=bx+a近似地刻画其相关关
3、系,根据图形,以下结论最有可能成立的是( ) A.线性相关关系较强,b的值为3.25 B.线性相关关系较强,b的值为0.83 C.线性相关关系较强,b的值为-0.87 D.线性相关关系太弱,无研究价值 答案:B 解析:依题意,注意到题中的相关的点均集中在某条直线的附近,且该直线的斜率小于1,结合各选项知,故选B. 4.(2015山东东营二模)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=-10x+200,则下列结论正确的是( ) A.y与x具有正的线性相关关系 B.若
4、r表示变量y与x之间的线性相关系数,则r=-10 C.当销售价格为10元时,销售量为100件 D.当销售价格为10元时,销售量为100件左右 答案:D 解析:当销售价格为10元时,y=-10×10+200=100,即销售量为100件左右. 5.2016年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表: 做不到“光盘” 能做到“光盘” 男 45 10 女 30 15 则下面的正确结论是( ) A.有90%的把握认为“该市居民能否做到‘光盘’与性别有关” B.有99%的把握认
5、为“该市居民能否做到‘光盘’与性别无关” C.有99%的把握认为“该市居民能否做到‘光盘’与性别有关” D.有90%的把握认为“该市居民能否做到‘光盘’与性别无关” 答案:A 解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得χ2的观测值k=≈3.030.因为2.706<3.030<3.841,所以在犯错误的概率不超过10%的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A. 6.若两个分类变量X和Y的2×2列联表如下: y1 y2 合计 x1
6、 5 15 20 x2 40 10 50 合计 45 25 70 则有 的把握认为X与Y之间有关系. 答案:99.9% 解析:χ2的观测值k=≈18.822>10.828, 所以有99.9%的把握认为X与Y之间有关系. 7.某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: 气温/℃ 18 13 10 -1 用电量/千瓦时 24 34 38 64 由表中数据得回归直线方程y=bx+a中 b=-2,预测当气温为-4 ℃时,用电量的度数约为 .〚导学号
7、32470535〛 答案:68 解析:=10,=40, ∵回归直线方程过点(), ∴40=-2×10+a.∴a=60.∴y=-2x+60. 令x=-4,得y=(-2)×(-4)+60=68. 8.(2015大连高三质检)假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如下表的统计资料: 使用年限x(年) 2 3 4 5 6 维修费用y(万元) 2.2 3.8 5.5 6.5 7.0 若由资料可知y对x呈线性相关关系,试求: (1)线性回归直线方程; (2)根据回归直线方程,估计使用年限为12年时,维修费用是多少? 解:(1)
8、列表 i 1 2 3 4 5 合计 xi 2 3 4 5 6 20 yi 2.2 3.8 5.5 6.5 7.0 25 xiyi 4.4 11.4 22.0 32.5 42.0 112.3 4 9 16 25 36 90 =4,=5; =90;xiyi=112.3 b==1.23, 于是a=-b=5-1.23×4=0.08. 所以线性回归直线方程为y=1.23x+0.08. (2)当x=12时,y=1.23×12+0.08=14.84(万元),即估计使用12年时,维修费用是14.84万元. 9.某高校
9、共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12].估计该校学生每周平均体育运动时间不少于4小时的概率; (3)在样本数据中,有60位女生的每周平均体育运动时间不少于4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有
10、95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 附χ2= P(χ2≥k0) 0.10 0.05 0.010 0.005 0.001 k0 2.706 3.841 6.635 7.879 10.828 解:(1)300×=90,所以应收集90位女生的样本数据. (2)由频率分布直方图得1-2×(0.100+0.025)=0.75, 所以该校学生每周平均体育运动时间不少于4小时的概率的估计值为0.75. (3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间不少于4小时,75人的每周平均体育运动时间少于4小时.又
11、因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下: 每周平均体育运动时间与性别列联表 男生 女生 总计 每周平均体育运动 时间不超过4小时 45 30 75 每周平均体育运动 时间超过4小时 165 60 225 总计 210 90 300 结合列联表可算得 χ2=≈4.762>3.841. 所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.〚导学号32470536〛 能力提升组 10.(2015郑州质量预测)通过随机询问110名性别不同的学生是否爱好某项运动,得到如
12、下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 附表: P(χ2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A.有99%的把握认为“爱好该项运动与性别有关” B.有99%的把握认为“爱好该项运动与性别无关” C.有99.9%的把握认为“爱好该项运动与性别有关” D.有99.9%的把握认为“爱好该项运动与性别无关” 答案:A 解析:依题意, 由χ2=, 得χ2=≈7.8.
13、因为P(7.8≥6.635)=0.010,因此有99%的把握认为“爱好该项运动与性别有关”,故选A.
11.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )
A.b>b',a>a'
B.b>b',aa'
D.b 14、
a=-b=-,
∴ba',选C.
12.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是 .
①列联表中c的值为30,b的值为35
②列联表中c的值为15,b的值为50
③根据列联表中的数据,有97.5%的把握认为“成绩与班级有关系”
④根据列联表中的数据,有97.5%的把握不能认为“成绩与班级有关系”
答案:③
解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,
所以c=20,b=45,①②错误.
根据列联表中的数据,得到χ2=≈6.6>5.024,
因此有97.5%的把握认为“成绩与班级有关系”.
6






